昆仑万维开源 7B 和 32B 最强数学代码推理模型,同规模下性能超越 QwQ-32B
昆仑万维天工团队宣布推出全新升级的Skywork-OR1(Open Reasoner 1)系列模型。
该系列在同等参数规模下实现了业界领先的推理性能,进一步突破了大模型在逻辑理解与复杂任务求解方面的能力瓶颈。同时,Skywork-OR1全面开放、免费使用,以完全开源的形式回馈开发者社区,坚定践行天工团队在推动AI技术发展上的开源路线。
此次开源涵盖三款高性能模型,包括:
- Skywork-OR1-Math-7B:聚焦数学领域的专项模型,同时也具有较强的代码能力。
- Skywork-OR1-7B-Preview:融合数学与代码能力、兼具通用性与专业性的通用模型。
- Skywork-OR1-32B-Preview:面向更高复杂度任务、具备更强推理能力的旗舰版本。
公告称,此次发布的Skywork-OR1系列采用业界最高透明度的开源策略:不同于其他前沿开源推理模型仅开放模型权重,项目团队全面开源了模型权重、训练数据集和完整训练代码。
配套的技术博客已发布于Notion平台,详细阐述了数据处理流程、训练方法和关键技术发现,为社区提供了完全可复现的实践参考。
昆仑万维方面表示,目前Skywork-OR1-7B和Skywork-OR1-32B的能力还在持续提升,预计将在两周内发布两个模型的正式版本,同时推出更为系统详尽的技术报告,进一步分享其在推理模型训练中的经验与洞察。“我们相信,这种全方位的开源策略将有助于推动整个AI社区在推理能力研究上的共同进步。”
在数学推理任务中:
-
通用模型Skywork-OR1-7B-Preview和Skywork-OR1-32B-Preview在AIME24与AIME25数据集上均实现了同参数规模下的最优表现,展现出强大的数学推理能力。
-
针对数学场景深度优化的专项模型Skywork-OR1-Math-7B更是在AIME24和AIME25上分别取得69.8与52.3的高分,远超当前主流7B级别模型,充分验证了其在高阶数学推理任务中的专业优势。
-
Skywork-OR1-32B-Preview在所有benchmark上均实现了对QwQ-32B的超越,并在更难的AIME25上基本与R1持平。
在竞赛编程任务中:
-
通用模型Skywork-OR1-7B-Preview与Skywork-OR1-32B-Preview在LiveCodeBench数据集上均取得了同等参数规模下的最优性能。
-
Skywork-OR1-32B-Preview表现尤为突出,其代码生成与问题求解能力已接近DeepSeek-R1(参数规模高达671B),在大幅压缩模型体量的同时实现了卓越的性价比,充分展现出天工团队训练策略的先进性。
其中Skywork-OR1-Math-7B表现尤为亮眼,作为一个专注于数学推理能力的7B参数模型,通过多阶段GRPO训练在复杂数学问题上实现了卓越表现,同时在代码任务上也有较强的泛化能力。下图是该模型在AIME24上的训练准确率曲线:
Skywork-OR1-Math-7B最终模型在AIME24和AIME24上分别达到69.8%和52.3%,超越了OpenAI-o3-mini (low),达到了当前尺寸SOTA性能。值得注意的是,尽管该模型训练过程中未专门针对代码能力进行优化,但在代码评测基准上Livecodebench从37.6%提升到43.6%,相比基线模型的显著提升。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
云鲸获 1 亿美金融资,正式进入 Pre-IPO 阶段
硬氪独家获悉,家庭清洁服务机器人公司「云鲸智能」近日完成1亿美金融资,本轮由腾讯投资、北京机器人产业发展投资基金联合领投,科幻基金与明势创投加码跟投。庚辛资本担任独家财务顾问。 资金将优先用于云鲸具身智能产品研发、全球市场扩张及多品类战略布局等方面。此次也是云鲸继2024年底融资结束后、完成的又新一轮融资,目前云鲸已正式启动Pre-IPO轮融资,开启上市前最后冲刺,资本化进程全面提速。 同时在产品端,云鲸也将从家电清洁正式迈入具身清洁阶段,其首款家庭具身智能产品正处于预研阶段,聚焦一键式解决家庭立体空间的清洁和收纳需求,实现由机器人完全托管、真正解放用户双手。该款产品预期将在2年内发布。 云鲸家庭具身产品由创始人张峻彬亲自带队,首代具身产品形态为自研移动底盘搭载自研机械臂,并内置了三维双目视觉感知系统,可以将清洁范围从平面2D延展至空间3D,同时新增收纳功能,可一键式接管家庭的清洁和收纳需求,真正实现了从家用电器进化成全方位的空间清洁管家。 张峻彬指出,家庭清洁革命正站在历史性跨越的临界点,当前市面上的扫地机器人仅是清洁智能化的“iPod阶段”,只有具备三维空间认知与自主决策能力的家庭...
- 下一篇
谷歌裁撤数百名 Android 及 Pixel 部门员工
据 The Information 援引知情人士消息报道,谷歌已在「平台与设备」部门展开新一轮裁员,涉及数百名员工。 今年 1 月,谷歌已为受影响员工提供自愿离职方案。该部门是谷歌核心业务的重要组成部分,负责 Android 系统、Pixel 智能手机、Chrome 浏览器及其他应用程序的开发与管理。 谷歌发言人证实了裁员消息,并解释称此举旨在优化团队结构,提高运营效率。 近来,大型科技公司普遍调整战略重心。为集中资源大力投入数据中心建设、AI 研发等高增长领域,对于其他业务领域的投资,许多科技巨头选择重新评估并缩减。例如,Meta 今年 1 月裁减了约 5%「绩效垫底」的员工,微软去年削减了 Xbox 游戏部门职位,亚马逊和苹果也在不同部门实施裁员。
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- MySQL8.0.19开启GTID主从同步CentOS8
- CentOS8安装Docker,最新的服务器搭配容器使用
- Linux系统CentOS6、CentOS7手动修改IP地址
- 2048小游戏-低调大师作品
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- CentOS8编译安装MySQL8.0.19
- CentOS6,CentOS7官方镜像安装Oracle11G
- CentOS7,8上快速安装Gitea,搭建Git服务器