OpenAI 最新论文:语言模型为什么会出现幻觉?
OpenAI 近日发表的新论文《Why language models hallucinate》研究了语言模型产生幻觉的核心原因,认为是现有训练与评估机制鼓励模型猜测而非承认不确定性。
该论文认为,语言模型之所以会产生幻觉(即在不确定时进行猜测,生成看似可信但错误的陈述,而不是承认不确定性),是因为现有的训练和评估程序更倾向于奖励猜测行为,而非承认不确定性的做法 。
就像面对难题的学生一样,大型语言模型在不确定时有时会进行猜测,从而产生看似合理但错误的陈述,而不是承认不确定性。
这种“幻觉”现象即使在最先进的系统中也持续存在,并会破坏信任。
我们认为,语言模型产生幻觉是因为训练和评估程序奖励猜测而非承认不确定性,我们还分析了现代训练流程中产生幻觉的统计原因。
幻觉无需被神秘化——它们源于简单的二元分类错误。如果无法将不正确的陈述与事实区分开来,那么预训练语言模型中的幻觉就会在自然的统计压力下产生。
接着我们认为,幻觉之所以持续存在,是因为大多数评估的评分方式——语言模型被优化成优秀的“考生”,而在不确定时进行猜测可以提高测试表现。
这种惩罚不确定性回答的“流行病”只能通过一种社会技术性的缓解措施来解决:修改那些虽不一致但主导着排行榜的现有基准测试的评分方式,而不是引入额外的幻觉评估。
这一改变或许能引导该领域走向更值得信赖的人工智能系统。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
苹果计划 2025 年底在中国推出 Apple Intelligence
彭博社记者 Mark Gurman 最新透露称,苹果目前还在继续推进 Apple Intelligence 在中国的发布计划,预计年底前才能上线,iPhone 17 首发无缘。 据悉,国行 iPhone 的 Apple Intelligence 是通过第三方提供服务,整合了阿里巴巴、百度的大模型。 其中,文心一言是核心云端引擎,阿里负责苹果内容合规审查。其实 iOS 18.5 开始,Apple Intelligence 就已经支持中文版了,苹果方面的准备已经就位,目前更多的是审核问题。 据报道,苹果正组织中国区员工对相关功能进行测试,并持续与阿里巴巴及其他合作方推进技术落地工作。
-
下一篇
Firefox 将在 2026 年终止对 32 位 Linux 支持
Mozilla 宣布 Firefox 144 版本(预计发布于 2025 年)是最后一个仍支持 32 位 Linux 的版本。自 Firefox 145 开始,将不再提供对 32 位 Linux 的支持。 Mozilla 在公告提到,近年来大多数 Linux 发行版已普遍放弃对 32 位 Linux 的支持,导致维护这一平台变得“越来越困难且不可靠”。为了专注于为用户提供更现代、更稳定的 Firefox,Mozilla 决定撤回对 32 位 Linux 的支持。 如果你正在使用 32 位 Linux 系统上的 Firefox,Mozilla 强烈建议切换到 64 位操作系统,并安装支持持续更新的 Firefox 64 位版本。 对于暂时无法升级的用户,Mozilla 提供了过渡方案——Firefox ESR 140 的 32 位构建仍将继续提供安全更新,直到 2026 年 9 月。
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS7,CentOS8安装Elasticsearch6.8.6
- Hadoop3单机部署,实现最简伪集群
- MySQL数据库在高并发下的优化方案
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- SpringBoot2全家桶,快速入门学习开发网站教程
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- CentOS7,8上快速安装Gitea,搭建Git服务器
- Docker使用Oracle官方镜像安装(12C,18C,19C)