英伟达发布 Nemotron 3 系列开放模型
英伟达宣布推出 NVIDIA Nemotron™ 3 系列开放模型、数据和库,为各个行业透明、高效的专业代理式 AI 开发提供助力。
Nemotron 3 系列MoE 模型提供 Nano、Super 和 Ultra 三种规模,采用突破性的异构潜在混合专家 (MoE) 架构,帮助开发者大规模开发并部署可靠的多智能体系统。
- Nemotron 3 Nano:是一款具备 300 亿参数的小型模型,每次运行最多激活 30 亿参数,适用于针对性、高效的任务。
- Nemotron 3 Super:是一款具备约 1,000 亿参数的高精度推理模型,每个 token最多激活 100 亿参数,适用于多智能体应用。
- Nemotron 3 Ultra:是一款具备约 5,000 亿参数的大型推理引擎,每个 token 最多激活 500 亿参数,适用于复杂的 AI 应用。
Nemotron 3 Nano 已正式上线,是计算成本效益极高的模型,其针对软件调试、内容摘要、AI 助手工作流及信息检索等任务进行了优化,同时保持了较低的推理成本。该模型采用独特的异构 MoE 架构,以实现效率与可扩展性的提升。
这一设计使其 token 吞吐量较 Nemotron 2 Nano 至高提升 4 倍,并减少了多达 60% 的推理 token 生成量,大大降低了推理成本。具备 100 万 token 的上下文处理能力,Nemotron 3 Nano 具有更强的记忆能力,在处理长时间多步骤任务时能更精准地关联信息。
模型地址:https://huggingface.co/nvidia/NVIDIA-Nemotron-3-Nano-30B-A3B-FP8

