OpenAI 揭秘 GPT 模型频繁提及“哥布林”的幕后原因-低调大师

OpenAI 揭秘 GPT 模型频繁提及“哥布林”的幕后原因

2026-04-30 25

OpenAI 日前发布了一篇技术博客，深入剖析了其大语言模型从 GPT-5.1 起频繁在回答中使用 "哥布林" "小妖精" 等奇幻生物隐喻的成因。这一现象看似无害，甚至略显俏皮，但随着模型迭代，相关词汇的出现频率持续攀升，最终引起了研究团队的高度重视。

问题的根源指向了 ChatGPT 的 "Nerdy（极客）" 个性化功能。该个性使用了一条强调 "用俏皮语言消解矫饰" 的系统提示，本意是让模型以更幽默、不拘一格的方式交流。然而，在针对该个性进行的强化学习训练中，奖励信号无意间对包含生物隐喻的输出给予了过高评分。数据显示，"Nerdy" 个性仅占 ChatGPT 全部回复的 2.5%，却贡献了 66.7% 的 "goblin" 一词出现量。

更令人意外的是，这种风格并未局限在 Nerdy 个性中。研究发现，当 Nerdy 条件下的 "哥布林" 提及增加时，无该个性提示的样本中也以相近比例出现了增长。这是因为强化学习无法保证习得的行为被严格限定在训练条件内 —— 一旦某种风格获得奖励，后续监督微调使用的模型生成数据中就会更多地包含该特征，进而形成正反馈循环。

OpenAI 团队在 GPT-5.5 的 Codex 测试中还发现了更多 "生物词汇"：浣熊、巨魔、食人魔和鸽子等，都被模型高频使用，而 "青蛙" 一词则多为正常语义。为解决这一问题，OpenAI 已于今年 3 月退役了 Nerdy 个性，并在训练中移除了偏向生物隐喻的奖励信号，同时过滤了训练数据中的相关词汇。但由于 GPT-5.5 的训练在此之前已启动，Codex 目前通过开发者提示来抑制这一现象。

OpenAI 表示，这次调查为研究团队提供了新的模型行为审计工具，有助于更快地发现和修复行为问题的根本原因。

参考来源：https://openai.com/index/where-the-goblins-came-from/

微信关注我们

原文链接：https://www.oschina.net/news/437668

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

荷兰政府推出开源代码平台 code.overheid.nl，底层采用 Forgej

荷兰政府于 2026 年 4 月 27 日正式上线 code.overheid.nl 平台，这是一个面向政府机构的全国性开源代码托管与协作开发平台，标志着荷兰在数字主权领域迈出了重要一步。该平台完全自主托管，旨在让政府组织能够独立地开发、共享和发布开源软件，避免对国外商业平台的过度依赖。目前平台处于试点阶段，底层采用 Forgejo—— 这是一款开源、欧洲本土开发、可自主掌控的代码托管方案，被视为 GitHub 和 GitLab 的替代选择。 code.overheid.nl 由荷兰内政与王国关系部（BZK）开源项目办公室发起，联合 DAWO（SSC-ICT）、Ope...

2026-04-30

11

2026 年 3 月 31 日，国务院公布《关于产业链供应链安全的规定》（以下简称《规定》），以国家行政法规筑牢产业安全防线，为关键领域自主可控、供应链韧性提升提供刚性保障。在数字经济时代，开源生态已成为供应链安全的核心底座。开源中国以国家战略为指引，深耕可信开源基础设施建设，从开源供应支撑迈向全链路安全守护，为关键行业筑牢数字根基。供应链安全：从技术议题到国家法规产业链供应链安全是国家安全的重要组成部分。《规定》第四条明确，国家引导产业链供应链合理有序布局，推进产业链供应链数字化、智能化，提升安全可控水平，促进高质量发展。第七条建立关键领域清单制度，要求维护原材料、技术、设备、产品等...

2026-04-30

14

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。