昆仑万维开源 7B 和 32B 最强数学代码推理模型，同规模下性能超越 QwQ-32B-低调大师

昆仑万维开源 7B 和 32B 最强数学代码推理模型，同规模下性能超越 QwQ-32B

2025-04-14 358

昆仑万维天工团队宣布推出全新升级的Skywork-OR1(Open Reasoner 1)系列模型。

该系列在同等参数规模下实现了业界领先的推理性能，进一步突破了大模型在逻辑理解与复杂任务求解方面的能力瓶颈。同时，Skywork-OR1全面开放、免费使用，以完全开源的形式回馈开发者社区，坚定践行天工团队在推动AI技术发展上的开源路线。

此次开源涵盖三款高性能模型，包括：

Skywork-OR1-Math-7B：聚焦数学领域的专项模型，同时也具有较强的代码能力。
Skywork-OR1-7B-Preview：融合数学与代码能力、兼具通用性与专业性的通用模型。
Skywork-OR1-32B-Preview：面向更高复杂度任务、具备更强推理能力的旗舰版本。

公告称，此次发布的Skywork-OR1系列采用业界最高透明度的开源策略：不同于其他前沿开源推理模型仅开放模型权重，项目团队全面开源了模型权重、训练数据集和完整训练代码。

配套的技术博客已发布于Notion平台，详细阐述了数据处理流程、训练方法和关键技术发现，为社区提供了完全可复现的实践参考。

昆仑万维方面表示，目前Skywork-OR1-7B和Skywork-OR1-32B的能力还在持续提升，预计将在两周内发布两个模型的正式版本，同时推出更为系统详尽的技术报告，进一步分享其在推理模型训练中的经验与洞察。“我们相信，这种全方位的开源策略将有助于推动整个AI社区在推理能力研究上的共同进步。”

在数学推理任务中：

通用模型Skywork-OR1-7B-Preview和Skywork-OR1-32B-Preview在AIME24与AIME25数据集上均实现了同参数规模下的最优表现，展现出强大的数学推理能力。
针对数学场景深度优化的专项模型Skywork-OR1-Math-7B更是在AIME24和AIME25上分别取得69.8与52.3的高分，远超当前主流7B级别模型，充分验证了其在高阶数学推理任务中的专业优势。
Skywork-OR1-32B-Preview在所有benchmark上均实现了对QwQ-32B的超越，并在更难的AIME25上基本与R1持平。

在竞赛编程任务中：

通用模型Skywork-OR1-7B-Preview与Skywork-OR1-32B-Preview在LiveCodeBench数据集上均取得了同等参数规模下的最优性能。
Skywork-OR1-32B-Preview表现尤为突出，其代码生成与问题求解能力已接近DeepSeek-R1（参数规模高达671B），在大幅压缩模型体量的同时实现了卓越的性价比，充分展现出天工团队训练策略的先进性。

其中Skywork-OR1-Math-7B表现尤为亮眼，作为一个专注于数学推理能力的7B参数模型，通过多阶段GRPO训练在复杂数学问题上实现了卓越表现，同时在代码任务上也有较强的泛化能力。下图是该模型在AIME24上的训练准确率曲线：

Skywork-OR1-Math-7B最终模型在AIME24和AIME24上分别达到69.8%和52.3%，超越了OpenAI-o3-mini (low)，达到了当前尺寸SOTA性能。值得注意的是，尽管该模型训练过程中未专门针对代码能力进行优化，但在代码评测基准上Livecodebench从37.6%提升到43.6%，相比基线模型的显著提升。

微信关注我们

原文链接：https://www.oschina.net/news/344417

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

云鲸获 1 亿美金融资，正式进入 Pre-IPO 阶段

硬氪独家获悉，家庭清洁服务机器人公司「云鲸智能」近日完成1亿美金融资，本轮由腾讯投资、北京机器人产业发展投资基金联合领投，科幻基金与明势创投加码跟投。庚辛资本担任独家财务顾问。资金将优先用于云鲸具身智能产品研发、全球市场扩张及多品类战略布局等方面。此次也是云鲸继2024年底融资结束后、完成的又新一轮融资，目前云鲸已正式启动Pre-IPO轮融资，开启上市前最后冲刺，资本化进程全面提速。同时在产品端，云鲸也将从家电清洁正式迈入具身清洁阶段，其首款家庭具身智能产品正处于预研阶段，聚焦一键式解决家庭立体空间的清洁和收纳需求，实现由机器人完全托管、真正解放用户双手。该款产品预期将在2年内发布。云鲸家庭具身产品由创始人张峻彬亲自带队，首代具身产品形态为自研移动底盘搭载自研机械臂，并内置了三维双目视觉感知系统，可以将清洁范围从平面2D延展至空间3D，同时新增收纳功能，可一键式接管家庭的清洁和收纳需求，真正实现了从家用电器进化成全方位的空间清洁管家。张峻彬指出，家庭清洁革命正站在历史性跨越的临界点，当前市面上的扫地机器人仅是清洁智能化的“iPod阶段”，只有具备三维空间认知与自主决策能力的家庭...

2025-04-14

400

据 The Information 援引知情人士消息报道，谷歌已在「平台与设备」部门展开新一轮裁员，涉及数百名员工。今年 1 月，谷歌已为受影响员工提供自愿离职方案。该部门是谷歌核心业务的重要组成部分，负责 Android 系统、Pixel 智能手机、Chrome 浏览器及其他应用程序的开发与管理。谷歌发言人证实了裁员消息，并解释称此举旨在优化团队结构，提高运营效率。近来，大型科技公司普遍调整战略重心。为集中资源大力投入数据中心建设、AI 研发等高增长领域，对于其他业务领域的投资，许多科技巨头选择重新评估并缩减。例如，Meta 今年 1 月裁减了约 5%「绩效垫底」的员工，微软去年削减了 Xbox 游戏部门职位，亚马逊和苹果也在不同部门实施裁员。

2025-04-14

218

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。