英伟达发布 Nemotron 3 系列开放模型
英伟达宣布推出 NVIDIA Nemotron™ 3 系列开放模型、数据和库,为各个行业透明、高效的专业代理式 AI 开发提供助力。 Nemotron 3 系列MoE 模型提供 Nano、Super 和 Ultra 三种规模,采用突破性的异构潜在混合专家 (MoE) 架构,帮助开发者大规模开发并部署可靠的多智能体系统。 Nemotron 3 Nano:是一款具备 300 亿参数的小型模型,每次运行最多激活 30 亿参数,适用于针对性、高效的任务。 Nemotron 3 Super:是一款具备约 1,000 亿参数的高精度推理模型,每个 token最多激活 100 亿参数,适用于多智能体应用。 Nemotron 3 Ultra:是一款具备约 5,000 亿参数的大型推理引擎,每个 token 最多激活 500 亿参数,适用于复杂的 AI 应用。 Nemotron 3 Nano 已正式上线,是计算成本效益极高的模型,其针对软件调试、内容摘要、AI 助手工作流及信息检索等任务进行了优化,同时保持了较低的推理成本。该模型采用独特的异构 MoE 架构,以实现效率与可扩展性的提升。 这一设计使其 ...
