OpenAI 最新论文：语言模型为什么会出现幻觉？-低调大师

OpenAI 最新论文：语言模型为什么会出现幻觉？

2025-09-08 101

OpenAI 近日发表的新论文《Why language models hallucinate》研究了语言模型产生幻觉的核心原因，认为是现有训练与评估机制鼓励模型猜测而非承认不确定性。

该论文认为，语言模型之所以会产生幻觉（即在不确定时进行猜测，生成看似可信但错误的陈述，而不是承认不确定性），是因为现有的训练和评估程序更倾向于奖励猜测行为，而非承认不确定性的做法。

就像面对难题的学生一样，大型语言模型在不确定时有时会进行猜测，从而产生看似合理但错误的陈述，而不是承认不确定性。

这种“幻觉”现象即使在最先进的系统中也持续存在，并会破坏信任。

我们认为，语言模型产生幻觉是因为训练和评估程序奖励猜测而非承认不确定性，我们还分析了现代训练流程中产生幻觉的统计原因。

幻觉无需被神秘化——它们源于简单的二元分类错误。如果无法将不正确的陈述与事实区分开来，那么预训练语言模型中的幻觉就会在自然的统计压力下产生。

接着我们认为，幻觉之所以持续存在，是因为大多数评估的评分方式——语言模型被优化成优秀的“考生”，而在不确定时进行猜测可以提高测试表现。

这种惩罚不确定性回答的“流行病”只能通过一种社会技术性的缓解措施来解决：修改那些虽不一致但主导着排行榜的现有基准测试的评分方式，而不是引入额外的幻觉评估。

这一改变或许能引导该领域走向更值得信赖的人工智能系统。

微信关注我们

原文链接：https://www.oschina.net/news/370863/why-language-models-hallucinate

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

苹果计划 2025 年底在中国推出 Apple Intelligence

彭博社记者 Mark Gurman 最新透露称，苹果目前还在继续推进 Apple Intelligence 在中国的发布计划，预计年底前才能上线，iPhone 17 首发无缘。据悉，国行 iPhone 的 Apple Intelligence 是通过第三方提供服务，整合了阿里巴巴、百度的大模型。其中，文心一言是核心云端引擎，阿里负责苹果内容合规审查。其实 iOS 18.5 开始，Apple Intelligence 就已经支持中文版了，苹果方面的准备已经就位，目前更多的是审核问题。据报道，苹果正组织中国区员工对相关功能进行测试，并持续与阿里巴巴及其他合作方推进技术落地工作。

2025-09-08

93

Mozilla 宣布 Firefox 144 版本（预计发布于 2025 年）是最后一个仍支持 32 位 Linux 的版本。自 Firefox 145 开始，将不再提供对 32 位 Linux 的支持。 Mozilla 在公告提到，近年来大多数 Linux 发行版已普遍放弃对 32 位 Linux 的支持，导致维护这一平台变得“越来越困难且不可靠”。为了专注于为用户提供更现代、更稳定的 Firefox，Mozilla 决定撤回对 32 位 Linux 的支持。如果你正在使用 32 位 Linux 系统上的 Firefox，Mozilla 强烈建议切换到 64 位操作系统，并安装支持持续更新的 Firefox 64 位版本。对于暂时无法升级的用户，Mozilla 提供了过渡方案——Firefox ESR 140 的 32 位构建仍将继续提供安全更新，直到 2026 年 9 月。

2025-09-08

110

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。