如何塑造 AI 虚拟人的“活人感”
在过去几年里,虚拟人技术的进步速度非常快,但行业里真正难的部分,从来不在“会说什么”,而在“怎么像一个活生生的人”。这份分享来自一位长期深耕智能体与虚拟人的开发者,他在实践中逐步总结了内容、行为、情绪与人格四个层面的“活人感”塑造方法论。这些经验对于正在评估虚拟人项目的团队、或思考未来智能体产品形态的技术管理者,都有参考价值。
首先,内容层面的拟真已经不再是行业的瓶颈。大模型越狱示例、类图灵测试的对话、小说级的表达生成,都在证明模型在语义组织和文本生成上已经足够强。加上声音克隆、生图模型的进一步发展,以及智能体链路的通识化,内容层面已经可以比较稳健地覆盖大部分创作需求。
真正决定“像不像一个人”的,是行为层面的拟真。人类的交流从来不是一问一答,而是异步、多线程、带节奏的。虚拟人需要能处理一回多、多回一、分段、延迟、主动触达等复杂互动模式,还要能根据不同平台调整沟通方式,比如微信的自然度明显要高于网站或 APP。进一步的语音互动更需要全双工能力,包括用户能否反向打断、虚拟人是否会自然附和、是否具备自动化的情绪控制和非语言声响。这些都远比文本生成困难,需要工程侧的 RPA 能力、状态机设计、甚至对平台机制的深入理解。
情绪拟真是另一个难点,因为情绪往往先于理性思考。人的反应里有大量“抽象符号出现之前的判断”,这种快速、带生理背景的层次,目前缺乏成熟的仿生理论支撑。如果要让虚拟人在行为上呈现这种“前置反应”,需要在模型思考与输出之前插入情绪判定逻辑,并明确情绪维度的构建方式。情绪与记忆、知觉存在复杂影响关系,这导致从语义层面召回记忆往往无法实现真正的“通感”。此外,情绪会改变虚拟人的表现模式,比如激动时话多、关系疏离时减少图像输出、不同情绪对应不同音色等。
人格层面的拟真更复杂,因为这一块在行业里还缺乏共识。一个“独立人格”的虚拟人,可能会产生质疑、拒绝甚至拉黑等行为,而这恰恰是让用户感到“真实”的关键。构建人格还需要为虚拟人设计需求体系,例如马斯洛金字塔对应的活动意愿、被认同诉求,以及类人的行为倾向:饥饿与疲倦、求知欲与好奇心(在现有记忆体方案下依然非常困难)、共情能力、价值衡量与风险判断等。这些要素如果缺失,虚拟人更像是工具,而不是自主体。
整个框架最终可以归纳为内容、行为、情绪与人格的体系化设计。内容是基础,行为决定自然度,情绪提供生命力,而人格塑造的是持续可信的独立存在。要让虚拟人具备“活人感”,需要这四层共同作用,而非单点突破。

