OpenAI 开源 gpt-oss-120b 与 20b
OpenAI 宣布在 Apache 2.0 协议下开源两款轻量级语言模型 —— gpt-oss-120b 和 gpt-oss-20b,可在低成本下实现强大的实际应用性能。这是自2019年GPT-2发布以来,OpenAI 首次回归开源领域。
“一个健康开放的模型生态系统,是实现 AI 广泛普及并惠及所有人的重要维度。我们正在发布自己的开放模型,以探索我们如何为这一生态系统做出贡献,以及这些模型的优势和好处是否值得 OpenAI 在未来投资于开放模型。”
该公司表示,与同等规模的开放模型相比,这两款模型在推理任务中表现更优,展现出强大的工具使用能力,并针对在消费级硬件上高效部署进行了优化。它们通过强化学习与 OpenAI 最先进内部模型(包括 o3 及其他前沿系统)所启发的技术相结合进行训练。
公告称,Gpt-oss-120b 模型在核心推理基准测试中与 OpenAI o4-mini 模型几乎持平,同时能在单个 80GB GPU 上高效运行。Gpt-oss-20b 模型在常见基准测试中与 OpenAI o3‑mini 模型取得类似结果,且可在仅配备 16GB 内存的边缘设备上运行,使其成为设备端应用、本地推理或无需昂贵基础设施的快速迭代的理想选择。
在工具使用、少样本函数调用、CoT推理(如在 Tau-Bench 智能体评估套件中的结果所示)以及 HealthBench 测试中也表现强劲(甚至超越了 OpenAI o1 和 GPT‑4o 等专有模型)。
“这些模型与我们的回复 API兼容,并专为在智能体工作流中使用而设计,具备卓越的指令执行能力、工具使用能力(如网页搜索或 Python 代码执行)以及推理能力——包括根据任务需求调整推理力度的能力,尤其适用于无需复杂推理且/或需要极低延迟最终输出的任务。它们完全可定制,提供完整的思维链 (CoT),并支持结构化输出。”
此外,OpenAI 还提到了“安全”这一核心原则。“我们还通过在我们的《防范准备框架》下测试一个经过对抗性微调的 gpt-oss-120b 版本,引入了额外的评估层。Gpt-oss 模型在内部安全基准测试中的表现与我们的前沿模型相当,为开发者提供了与我们近期专有模型相同的安全标准。”
测评结果表明,Gpt-oss-120b 在竞赛编程 (Codeforces)、通用问题解决 (MMLU 和 HLE) 以及工具调用 (TauBench) 方面表现优于 OpenAI o3‑mini,并与 OpenAI o4-mini 持平或超越其性能。在健康相关查询 (HealthBench) 和竞赛数学 (AIME 2024 和 2025) 方面表现得比 o4-mini 更好。尽管 gpt-oss-20b 的规模较小,但在这些相同的评估中,它与 OpenAI o3‑mini 持平或超越后者,甚至在竞赛数学和医疗方面表现得更好。
此外,作为此次更新的一部分,微软还为 Windows 设备推出了 GPU 优化版的 gpt-oss-20b 模型。这些模型基于 ONNX Runtime,支持本地推理,并可通过 Foundry Local 和 VS Code AI 工具包获取,使得 Windows 开发者更容易使用开放模型进行开发。
更多详情可查看官方公告。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
HarmonyOS NEXT应用元服务开发Intents Kit(意图框架服务)本地搜索接入方案
******************************************************************************************************************** ******************************************************************************************************************** ******************************************************************************************************************** ********************************************************************************************************************
- 下一篇
Anthropic 发布 Claude Opus 4.1
Anthropic 昨晚发布了 Claude Opus 4.1,这是对 Claude Opus 4 在智能体任务、现实世界编码及推理能力上的升级。该版本现已向 Claude 付费用户、Claude Code 用户开放,同时在其 API、亚马逊 Bedrock 以及谷歌云 Vertex AI 平台上线,定价与 Opus 4 保持一致。 据反馈,Claude Opus 4.1 在多数能力上较 Opus 4 均有提升,其中多文件代码重构方面的性能提升尤为显著。该版本能精准定位大型代码库中的具体问题并修正,不会进行不必要的调整或引入漏洞,团队更青睐其在日常调试任务中的这种精准性。 Windsurf 的报告显示,在初级开发者基准测试中,Opus 4.1 较 Opus 4 有一个标准差的提升,性能飞跃程度与从 Sonnet 3.7 到 Sonnet 4 的升级相当。 开发者可通过 API 使用 claude-opus-4-1-20250805,也可查阅系统卡片、模型页面、定价页面及文档了解更多信息。此外,Anthropic 计划在未来几周内对其模型进行更大幅度地改进。
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS8安装Docker,最新的服务器搭配容器使用
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- CentOS8编译安装MySQL8.0.19
- Linux系统CentOS6、CentOS7手动修改IP地址
- CentOS7安装Docker,走上虚拟化容器引擎之路
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- CentOS7,8上快速安装Gitea,搭建Git服务器
- CentOS关闭SELinux安全模块
- SpringBoot2配置默认Tomcat设置,开启更多高级功能