在5月3日,人工智能研究员布莱恩·鲁梅尔(Brian Roemmele)透露,他的“零人类公司”已开始部署一种名为DPN-LE(双重人格神经元定位与编辑)的模型个性编辑技术,以精确调整AI代理的行为特征。根据介绍,DPN-LE在大型模型的多层感知机(MLP)层中定位“个性神经元”,允许有针对性地增强或削弱诸如“诚实、创造力、谨慎和合作”等特质。研究声称,这种方法只需编辑大约0.5%的神经元,就能实现对AI个性的“外科手术”式调整,而无需重新训练模型,同时最大程度减少对核心推理能力的损害。鲁梅尔表示,他的公司目前拥有超过100个AI代理,日常运营几乎完全自动化,使得“个性一致性”成为一个关键问题。例如,战略代理将增强“长期一致性”和“分析诚信”,财务和风险控制代理将强化“谨慎”和“精准”,内容相关的代理将提升“同理心”和“创造力”,多代理协作层将增强“合作”。他指出,由于DPN-LE在推理阶段涉及轻量级修改,公司可以“批量重塑个性”,在几分钟内部署大量AI代理,大大降低了AI对齐的成本。市场将这种“可编程个性”技术视为从单纯的AI代理能力竞争向行为控制和组织治理竞争的转变。
研究人员引入DPN-LE技术:直接编辑大型模型“个性神经元”以实现微调的AI角色控制
在5月3日,人工智能研究员布莱恩·鲁梅尔(Brian Roemmele)透露,他的“零人类公司”已开始部署一种名为DPN-LE(双重人格神经元定位与编辑)的模型个性编辑技术,以精确调整AI代理的行为特征。根据介绍,DPN-LE在大型模型的多层感知机(MLP)层中定位“个性神经元”,允许有针对性地增强或削弱诸如“诚实、创造力、谨慎和合作”等特质。研究声称,这种方法只需编辑大约0.5%的神经元,就能实现对AI个性的“外科手术”式调整,而无需重新训练模型,同时最大程度减少对核心推理能力的损害。鲁梅尔表示,他的公司目前拥有超过100个AI代理,日常运营几乎完全自动化,使得“个性一致性”成为一个关键问题。例如,战略代理将增强“长期一致性”和“分析诚信”,财务和风险控制代理将强化“谨慎”和“精准”,内容相关的代理将提升“同理心”和“创造力”,多代理协作层将增强“合作”。他指出,由于DPN-LE在推理阶段涉及轻量级修改,公司可以“批量重塑个性”,在几分钟内部署大量AI代理,大大降低了AI对齐的成本。市场将这种“可编程个性”技术视为从单纯的AI代理能力竞争向行为控制和组织治理竞争的转变。