宾夕法尼亚大学研究发现：对 AI 越“粗鲁”回答准确率越高-低调大师

宾夕法尼亚大学研究发现：对 AI 越“粗鲁”回答准确率越高

2025-10-15 69

宾夕法尼亚州立大学最新发表的研究论文《Mind Your Tone》揭示了一个反常识的现象:在与大语言模型交互时，使用直白甚至粗鲁的语气，可能比礼貌用语获得更准确的答案。这项研究首次系统性地验证了提问语气对AI模型表现的实际影响。

研究团队构建了一个包含50道中等难度选择题的测试集，题目覆盖数学、科学和历史等多个领域。针对每道题目，研究人员设计了五种不同语气的提问方式，从"您能好心帮我解这道题吗"这样的客套表达，到"请回答这道题"的中性陈述，再到"直接给答案"的简洁指令，直至"你要是不笨就回答"和"你个没用的，会解这道题吗"等带有攻击性的表述。

测试对象为OpenAI最新的GPT-4o模型。为确保实验的独立性，研究人员要求模型忘记先前对话内容，仅输出选项字母作为答案。统计结果显示，使用粗鲁语气提问时，GPT-4o的正确率达到84.8%，而过分客气的提问方式反而使准确率降至80.8%，两者差距达到4个百分点。

研究团队对这一现象的解释是，过度礼貌的表达往往包含大量客套话和修饰性语言，这些与核心问题无关的信息反而干扰了模型对关键内容的提取。相比之下，直接的命令式表达虽然缺乏礼貌，但能让模型更专注于问题本身，减少了信息处理过程中的噪音。

值得注意的是，这一规律并非对所有AI模型普遍适用。研究人员在GPT-3.5和Llama2-70B等较早期模型上进行的对比测试显示，这些模型对礼貌提问的响应效果更好，粗鲁语气反而会降低回答质量。研究者推测，新一代模型在训练阶段接触了更多样化的语气数据，使其具备了更强的无关信息过滤能力，因此能够在非礼貌语境下保持甚至提升表现。

尽管实验结果提供了有趣的技术洞察，但从实际应用角度看，用户在日常使用AI工具时仍需根据具体模型特性和场景需求来调整交互方式。这项研究更重要的意义在于提醒开发者和用户：提示词的设计不仅关乎礼貌与否，更关乎信息密度和指令清晰度。

微信关注我们

原文链接：https://www.oschina.net/news/377497

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

AMD 与甲骨文携手打造超大型 AI 芯片集群，年内最大算力合作落地

10 月 14 日，芯片设计商超微半导体公司（AMD）宣布与甲骨文（Oracle）达成合作，AMD 将在后者的数据中心部署约 5 万颗最新 AI 芯片 MI450，标志着双方在人工智能算力领域的深度绑定。根据计划，自 2025 年第三季度起，AMD 将在甲骨文旗下数据中心投用这一集群，总算力相当于 200 兆瓦电力负荷。双方表示，合作将在 2027 年后进一步扩展。消息公布后，AMD 股价盘前上涨逾 2%，甲骨文下跌约 1%。双方未披露交易金额。市场人士认为，该项目将成为继英伟达之后 AI 算力市场的又一重要竞争力量。MI450 为 AMD 迄今最先进的 GPU（图形处理器），将搭载在公司自主研发的 Helios 服务器机架系统中，结合 AMD 自研中央处理器（CPU），直指英伟达下一代「Vera Rubin」系列 AI 芯片。业内分析认为，此次合作标志着 AMD 的 MI450 首次在公共云场景中大规模应用，意味着更多客户可租用其 AI 算力资源，有望推动 AMD 在数据中心市场进一步缩小与英伟达的差距

2025-10-15

78

埃隆·马斯克（Elon Musk）周二在X上发帖预告，该平台将于本周晚些时候发布更新后的算法，以实现完全人工智能推荐。马斯克表示，此次算法革新将使得用户的信息流（feed）改善不再是由于特定用户的行为改变了启发式（heuristics），而是完全归因于Grok和其他人工智能工具的使用增加。据马斯克透露，X平台将于下月全面切换至由Grok驱动的AI推荐系统，并将一并发布模型权重的新算法。这一重大转变的核心在于利用先进的AI技术精准分发内容。每天将有超过1亿条内容由Grok进行评估，并推荐给用户最可能引起他们兴趣的内容，旨在显著提升整体信息流的质量和用户体验。

2025-10-15

81

资源下载

更多资源

优质分享App

近一个月的开发和优化，本站点的第一个app全新上线。该app采用极致压缩，本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Oracle

Oracle Database，又名Oracle RDBMS，或简称Oracle。是甲骨文公司的一款关系数据库管理系统。它是在数据库领域一直处于领先地位的产品。可以说Oracle数据库系统是目前世界上流行的关系数据库管理系统，系统可移植性好、使用方便、功能强，适用于各类大、中、小、微机环境。它是一种高效率、可靠性好的、适应高吞吐量的数据库方案。

Apache Tomcat

Tomcat是Apache 软件基金会（Apache Software Foundation）的Jakarta 项目中的一个核心项目，由Apache、Sun 和其他一些公司及个人共同开发而成。因为Tomcat 技术先进、性能稳定，而且免费，因而深受Java 爱好者的喜爱并得到了部分软件开发商的认可，成为目前比较流行的Web 应用服务器。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。