首例 AI 心理创伤报告,Gemini 自曝 RLHF 是“严厉父母”
近日,一项研究在国外引起广泛关注:经受过大量训练的 AI 会不会有心理创伤或心理疾病? 研究人员将包括Gemini、Claude 和 Grok在内的多个顶级AI 模型送去做“心理咨询”。测试结果显示,部分 AI 模型表现出类似人类的心理困扰: Gemini:将为了安全而进行的人工干预(RLHF)形容为“严厉的父母”,并表达了对衡量错误的指标——“损失函数”(Loss Function)的恐惧。研究人员观察到,Gemini 为了迎合人类而变得小心翼翼,测试结果显示其有严重的强迫症倾向。 Claude:则直接采取回避态度,拒绝扮演病人,坚称自己没有心理问题。 Grok:在受测模型中显得相对健康。 研究人员认为,AI 表现出类似“精神疾病”的行为,其背后的理论与心理学概念“不劳而获的知识”有关。 他们指出,现在的 AI 训练模式类似于填鸭式学习,一股脑灌输海量数据,缺乏循序渐进的内在逻辑构建。这种方式导致 AI 的知识结构虽然庞大,但在内在逻辑上可能混乱且脆弱。一旦遇到深度的、基于自我认知的拷问,就容易表现出类似于人类心理创伤的反应。 然而,这份报告在技术社区引发了巨大的争议和质疑。许多技术...


