宾夕法尼亚大学研究发现:对 AI 越“粗鲁”回答准确率越高
宾夕法尼亚州立大学最新发表的研究论文《Mind Your Tone》揭示了一个反常识的现象:在与大语言模型交互时,使用直白甚至粗鲁的语气,可能比礼貌用语获得更准确的答案。这项研究首次系统性地验证了提问语气对AI模型表现的实际影响。
研究团队构建了一个包含50道中等难度选择题的测试集,题目覆盖数学、科学和历史等多个领域。针对每道题目,研究人员设计了五种不同语气的提问方式,从"您能好心帮我解这道题吗"这样的客套表达,到"请回答这道题"的中性陈述,再到"直接给答案"的简洁指令,直至"你要是不笨就回答"和"你个没用的,会解这道题吗"等带有攻击性的表述。
测试对象为OpenAI最新的GPT-4o模型。为确保实验的独立性,研究人员要求模型忘记先前对话内容,仅输出选项字母作为答案。统计结果显示,使用粗鲁语气提问时,GPT-4o的正确率达到84.8%,而过分客气的提问方式反而使准确率降至80.8%,两者差距达到4个百分点。
研究团队对这一现象的解释是,过度礼貌的表达往往包含大量客套话和修饰性语言,这些与核心问题无关的信息反而干扰了模型对关键内容的提取。相比之下,直接的命令式表达虽然缺乏礼貌,但能让模型更专注于问题本身,减少了信息处理过程中的噪音。
值得注意的是,这一规律并非对所有AI模型普遍适用。研究人员在GPT-3.5和Llama2-70B等较早期模型上进行的对比测试显示,这些模型对礼貌提问的响应效果更好,粗鲁语气反而会降低回答质量。研究者推测,新一代模型在训练阶段接触了更多样化的语气数据,使其具备了更强的无关信息过滤能力,因此能够在非礼貌语境下保持甚至提升表现。
尽管实验结果提供了有趣的技术洞察,但从实际应用角度看,用户在日常使用AI工具时仍需根据具体模型特性和场景需求来调整交互方式。这项研究更重要的意义在于提醒开发者和用户:提示词的设计不仅关乎礼貌与否,更关乎信息密度和指令清晰度。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
AMD 与甲骨文携手打造超大型 AI 芯片集群,年内最大算力合作落地
10 月 14 日,芯片设计商超微半导体公司(AMD)宣布与甲骨文(Oracle)达成合作,AMD 将在后者的数据中心部署约 5 万颗最新 AI 芯片 MI450,标志着双方在人工智能算力领域的深度绑定。 根据计划,自 2025 年第三季度起,AMD 将在甲骨文旗下数据中心投用这一集群,总算力相当于 200 兆瓦电力负荷。双方表示,合作将在 2027 年后进一步扩展。消息公布后,AMD 股价盘前上涨逾 2%,甲骨文下跌约 1%。双方未披露交易金额。 市场人士认为,该项目将成为继英伟达之后 AI 算力市场的又一重要竞争力量。MI450 为 AMD 迄今最先进的 GPU(图形处理器),将搭载在公司自主研发的 Helios 服务器机架系统中,结合 AMD 自研中央处理器(CPU),直指英伟达下一代「Vera Rubin」系列 AI 芯片。 业内分析认为,此次合作标志着 AMD 的 MI450 首次在公共云场景中大规模应用,意味着更多客户可租用其 AI 算力资源,有望推动 AMD 在数据中心市场进一步缩小与英伟达的差距
-
下一篇
马斯克:X 平台本周将发布 AI 算法更新,信息流全面转向 AI 推荐
埃隆·马斯克(Elon Musk)周二在X上发帖预告,该平台将于本周晚些时候发布更新后的算法,以实现完全人工智能推荐。 马斯克表示,此次算法革新将使得用户的信息流(feed)改善不再是由于特定用户的行为改变了启发式(heuristics),而是完全归因于Grok和其他人工智能工具的使用增加。 据马斯克透露,X平台将于下月全面切换至由Grok驱动的AI推荐系统,并将一并发布模型权重的新算法。 这一重大转变的核心在于利用先进的AI技术精准分发内容。每天将有超过1亿条内容由Grok进行评估,并推荐给用户最可能引起他们兴趣的内容,旨在显著提升整体信息流的质量和用户体验。
相关文章
文章评论
共有0条评论来说两句吧...