OpenAI 开源 gpt-oss-120b 与 20b-低调大师

OpenAI 开源 gpt-oss-120b 与 20b

2025-08-06 238

OpenAI 宣布在 Apache 2.0 协议下开源两款轻量级语言模型 —— gpt-oss-120b 和 gpt-oss-20b，可在低成本下实现强大的实际应用性能。这是自2019年GPT-2发布以来，OpenAI 首次回归开源领域。

“一个健康开放的模型生态系统，是实现 AI 广泛普及并惠及所有人的重要维度。我们正在发布自己的开放模型，以探索我们如何为这一生态系统做出贡献，以及这些模型的优势和好处是否值得 OpenAI 在未来投资于开放模型。”

该公司表示，与同等规模的开放模型相比，这两款模型在推理任务中表现更优，展现出强大的工具使用能力，并针对在消费级硬件上高效部署进行了优化。它们通过强化学习与 OpenAI 最先进内部模型（包括 o3 及其他前沿系统）所启发的技术相结合进行训练。

公告称，Gpt-oss-120b 模型在核心推理基准测试中与 OpenAI o4-mini 模型几乎持平，同时能在单个 80GB GPU 上高效运行。Gpt-oss-20b 模型在常见基准测试中与 OpenAI o3‑mini 模型取得类似结果，且可在仅配备 16GB 内存的边缘设备上运行，使其成为设备端应用、本地推理或无需昂贵基础设施的快速迭代的理想选择。

在工具使用、少样本函数调用、CoT推理（如在 Tau-Bench 智能体评估套件中的结果所示）以及 HealthBench 测试中也表现强劲（甚至超越了 OpenAI o1 和 GPT‑4o 等专有模型）。

“这些模型与我们的回复 API⁠兼容，并专为在智能体工作流中使用而设计，具备卓越的指令执行能力、工具使用能力（如网页搜索或 Python 代码执行）以及推理能力——包括根据任务需求调整推理力度的能力，尤其适用于无需复杂推理且/或需要极低延迟最终输出的任务。它们完全可定制，提供完整的思维链 (CoT)，并支持结构化输出⁠。”

此外，OpenAI 还提到了“安全”这一核心原则。“我们还通过在我们的《防范准备框架》下测试一个经过对抗性微调的 gpt-oss-120b 版本，引入了额外的评估层。Gpt-oss 模型在内部安全基准测试中的表现与我们的前沿模型相当，为开发者提供了与我们近期专有模型相同的安全标准。”

测评结果表明，Gpt-oss-120b 在竞赛编程 (Codeforces)、通用问题解决 (MMLU 和 HLE) 以及工具调用 (TauBench) 方面表现优于 OpenAI o3‑mini，并与 OpenAI o4-mini 持平或超越其性能。在健康相关查询 (HealthBench⁠) 和竞赛数学 (AIME 2024 和 2025) 方面表现得比 o4-mini 更好。尽管 gpt-oss-20b 的规模较小，但在这些相同的评估中，它与 OpenAI o3‑mini 持平或超越后者，甚至在竞赛数学和医疗方面表现得更好。

此外，作为此次更新的一部分，微软还为 Windows 设备推出了 GPU 优化版的 gpt-oss-20b 模型。这些模型基于 ONNX Runtime，支持本地推理，并可通过 Foundry Local 和 VS Code AI 工具包获取，使得 Windows 开发者更容易使用开放模型进行开发。

更多详情可查看官方公告。

微信关注我们

原文链接：https://www.oschina.net/news/364522/gpt-oss

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

HarmonyOS NEXT应用元服务开发Intents Kit（意图框架服务）本地搜索接入方案

******************************************************************************************************************** ******************************************************************************************************************** ******************************************************************************************************************** ********************************************************************************************************************

2025-08-05

242

Anthropic 昨晚发布了 Claude Opus 4.1，这是对 Claude Opus 4 在智能体任务、现实世界编码及推理能力上的升级。该版本现已向 Claude 付费用户、Claude Code 用户开放，同时在其 API、亚马逊 Bedrock 以及谷歌云 Vertex AI 平台上线，定价与 Opus 4 保持一致。据反馈，Claude Opus 4.1 在多数能力上较 Opus 4 均有提升，其中多文件代码重构方面的性能提升尤为显著。该版本能精准定位大型代码库中的具体问题并修正，不会进行不必要的调整或引入漏洞，团队更青睐其在日常调试任务中的这种精准性。 Windsurf 的报告显示，在初级开发者基准测试中，Opus 4.1 较 Opus 4 有一个标准差的提升，性能飞跃程度与从 Sonnet 3.7 到 Sonnet 4 的升级相当。开发者可通过 API 使用 claude-opus-4-1-20250805，也可查阅系统卡片、模型页面、定价页面及文档了解更多信息。此外，Anthropic 计划在未来几周内对其模型进行更大幅度地改进。

2025-08-06

248

资源下载

更多资源

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。