英伟达发布 OpenReasoning-Nemotron 系列推理模型,专注于数学、科学和代码
NVIDIA 发布了 OpenReasoning-Nemotron,这是由四个精简的推理模型组成的集合,参数分别为 15 亿、70 亿、140 亿和 320 亿,均源自拥有 671 亿参数的 DeepSeek R1 0528。通过将庞大的“老师”模型压缩成四个基于 Qwen-2.5 的“学生”模型,NVIDIA 使得即使在标准游戏设备上也能进行高级推理实验,而无需担心高昂的 GPU 费用和云使用量。
这些模型在数学、科学和代码等多个推理基准测试中,均在其各自的规模级别上达到了业界领先水平。
https://huggingface.co/blog/nvidia/openreasoning-nemotron
https://nvidia.github.io/NeMo-Skills/releases/openreasoning/
https://huggingface.co/collections/nvidia/openreasoning-nemotron-687730dae0170059860f1f01
关键不在于复杂的技巧,而在于原始数据。NVIDIA 使用 NeMo Skills 流水线生成了 500 万个数学、科学和代码解决方案,然后通过纯粹的监督学习对每个解决方案进行微调。目前,320 亿参数的模型在 AIME24 上获得了 89.2 分,在 HMMT 二月竞赛中获得了 73.8 分,而即使是 15 亿参数的版本也取得了 55.5 分和 31.5 分的稳定成绩。
NVIDIA 设想将这些模型打造为强大的研究工具包。所有四个检查点均可在 Hugging Face 上下载,为探索强化学习驱动的推理或针对特定任务定制模型奠定坚实的基础。使用 GenSelect 模式(每个问题进行多次迭代),可以生成多个并行生成并选出最佳答案,从而使 32B 模型的性能达到卓越水平,在多个数学和编码基准测试中堪比甚至超越 OpenAI 的 o3-high 性能。
由于 NVIDIA 仅使用监督微调训练这些模型,而未使用强化学习,因此社区拥有清晰、先进的未来强化学习实验起点。对于游戏玩家和家庭爱好者来说,如果您拥有更强大的游戏 GPU,我们将获得一个完全本地化的模型,该模型可以非常接近最先进的水平。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
Pika Labs 发布首款纯 AI 社交视频应用
Pika宣布了其开发的首款完全基于 AI 的社交视频应用,并已开放早期访问,用户可通过下载iOS应用加入等待名单。 https://apps.apple.com/gb/app/pika-social-ai-video/id6744712684 Pika 建立在一个“高度表现力的人类视频模型”之上,主打 AI 生成自拍视频,用户仅需一张自拍即可快速生成风格各异的视频,如一键音画同步(如生成唱歌、说唱、Vlog 等视频),更换发色、服装、环境等外观,对他人视频进行混剪,以及 AI 自动生成 Talking Video 脚本等等。 经过几周的内测后,Pika现已开放早期访问。用户可以下载其iOS应用加入等待名单,或通过邀请码直接获得访问权限。
-
下一篇
昔日合作伙伴反目成仇,微软 AI 主管挖角谷歌 20 名核心员工
硅谷 AI 人才市场近日掀起了一阵风暴,微软消费级 AI 战略负责人穆斯塔法・苏莱曼(Mustafa Suleyman)开始大规模从其曾创办的 DeepMind 团队挖角,已经成功引入超过20名核心员工。作为曾经的合作伙伴,苏莱曼如今却将目光投向了他的老东家,直接影响到谷歌的 AI 研发力量。 在这次人才争夺战中,前谷歌 Gemini 聊天机器人工程负责人阿马尔・苏布拉马尼亚(Amar Subramanya)也确认将加入微软,担任人工智能副总裁。他在个人社交平台上表示,微软的文化让他感到耳目一新,团队的氛围既谦逊又雄心勃勃。除了苏布拉马尼亚,微软还成功说服了其他几位 DeepMind 的核心员工加入,显示出其对人才的强烈需求。 根据消息人士透露,微软在过去六个月内已从 DeepMind 吸纳了至少24名员工。此时,正值各大科技公司加大力度从竞争对手处挖角顶尖AI 研究员和工程师,行业薪酬水平也因而迅速上升。对此,OpenAI 首席执行官萨姆・奥特曼(Sam Altman)曾批评其他公司用高额签约奖金吸引人才,认为这助长了 “唯利是图” 的风气。 随着苏莱曼的挖角行动,微软不仅获得了宝贵...
相关文章
文章评论
共有0条评论来说两句吧...