OpenAI 开源 gpt-oss-120b 与 20b

OpenAI 宣布在 Apache 2.0 协议下开源两款轻量级语言模型 —— gpt-oss-120b 和 gpt-oss-20b可在低成本下实现强大的实际应用性能。这是自2019年GPT-2发布以来,OpenAI 首次回归开源领域。

“一个健康开放的模型生态系统,是实现 AI 广泛普及并惠及所有人的重要维度。我们正在发布自己的开放模型,以探索我们如何为这一生态系统做出贡献,以及这些模型的优势和好处是否值得 OpenAI 在未来投资于开放模型。”

该公司表示,与同等规模的开放模型相比,这两款模型在推理任务中表现更优,展现出强大的工具使用能力,并针对在消费级硬件上高效部署进行了优化。它们通过强化学习与 OpenAI 最先进内部模型(包括 o3 及其他前沿系统)所启发的技术相结合进行训练。

公告称,Gpt-oss-120b 模型在核心推理基准测试中与 OpenAI o4-mini 模型几乎持平,同时能在单个 80GB GPU 上高效运行。Gpt-oss-20b 模型在常见基准测试中与 OpenAI o3‑mini 模型取得类似结果,且可在仅配备 16GB 内存的边缘设备上运行,使其成为设备端应用、本地推理或无需昂贵基础设施的快速迭代的理想选择。

在工具使用、少样本函数调用、CoT推理(如在 Tau-Bench 智能体评估套件中的结果所示)以及 HealthBench 测试中也表现强劲(甚至超越了 OpenAI o1 和 GPT‑4o 等专有模型)。

“这些模型与我们的回复 API⁠兼容,并专为在智能体工作流中使用而设计,具备卓越的指令执行能力、工具使用能力(如网页搜索或 Python 代码执行)以及推理能力——包括根据任务需求调整推理力度的能力,尤其适用于无需复杂推理且/或需要极低延迟最终输出的任务。它们完全可定制,提供完整的思维链 (CoT),并支持结构化输出⁠。”

此外,OpenAI 还提到了“安全”这一核心原则。“我们还通过在我们的《防范准备框架》下测试一个经过对抗性微调的 gpt-oss-120b 版本,引入了额外的评估层。Gpt-oss 模型在内部安全基准测试中的表现与我们的前沿模型相当,为开发者提供了与我们近期专有模型相同的安全标准。

测评结果表明,Gpt-oss-120b 在竞赛编程 (Codeforces)、通用问题解决 (MMLU 和 HLE) 以及工具调用 (TauBench) 方面表现优于 OpenAI o3‑mini,并与 OpenAI o4-mini 持平或超越其性能。在健康相关查询 (HealthBench⁠) 和竞赛数学 (AIME 2024 和 2025) 方面表现得比 o4-mini 更好。尽管 gpt-oss-20b 的规模较小,但在这些相同的评估中,它与 OpenAI o3‑mini 持平或超越后者,甚至在竞赛数学和医疗方面表现得更好。

此外,作为此次更新的一部分,微软还为 Windows 设备推出了 GPU 优化版的 gpt-oss-20b 模型。这些模型基于 ONNX Runtime,支持本地推理,并可通过 Foundry Local 和 VS Code AI 工具包获取,使得 Windows 开发者更容易使用开放模型进行开发。

更多详情可查看官方公告

优秀的个人博客,低调大师

微信关注我们

原文链接:https://www.oschina.net/news/364522/gpt-oss

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

相关文章

发表评论

资源下载

更多资源
优质分享Android(本站安卓app)

优质分享Android(本站安卓app)

近一个月的开发和优化,本站点的第一个app全新上线。该app采用极致压缩,本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Mario,低调大师唯一一个Java游戏作品

Mario,低调大师唯一一个Java游戏作品

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

Java Development Kit(Java开发工具)

Java Development Kit(Java开发工具)

JDK是 Java 语言的软件开发工具包,主要用于移动设备、嵌入式设备上的java应用程序。JDK是整个java开发的核心,它包含了JAVA的运行环境(JVM+Java系统类库)和JAVA工具。

Sublime Text 一个代码编辑器

Sublime Text 一个代码编辑器

Sublime Text具有漂亮的用户界面和强大的功能,例如代码缩略图,Python的插件,代码段等。还可自定义键绑定,菜单和工具栏。Sublime Text 的主要功能包括:拼写检查,书签,完整的 Python API , Goto 功能,即时项目切换,多选择,多窗口等等。Sublime Text 是一个跨平台的编辑器,同时支持Windows、Linux、Mac OS X等操作系统。