英伟达发布 OpenReasoning-Nemotron 系列推理模型,专注于数学、科学和代码
NVIDIA 发布了 OpenReasoning-Nemotron,这是由四个精简的推理模型组成的集合,参数分别为 15 亿、70 亿、140 亿和 320 亿,均源自拥有 671 亿参数的 DeepSeek R1 0528。通过将庞大的“老师”模型压缩成四个基于 Qwen-2.5 的“学生”模型,NVIDIA 使得即使在标准游戏设备上也能进行高级推理实验,而无需担心高昂的 GPU 费用和云使用量。 这些模型在数学、科学和代码等多个推理基准测试中,均在其各自的规模级别上达到了业界领先水平。 https://huggingface.co/blog/nvidia/openreasoning-nemotron https://nvidia.github.io/NeMo-Skills/releases/openreasoning/ https://huggingface.co/collections/nvidia/openreasoning-nemotron-687730dae0170059860f1f01 关键不在于复杂的技巧,而在于原始数据。NVIDIA 使用 NeMo Skills 流水...
