英伟达开源 Nemotron 3 Nano Omni 多模态模型，AI 智能体效率最高提升 9 倍-低调大师

英伟达开源 Nemotron 3 Nano Omni 多模态模型，AI 智能体效率最高提升 9 倍

2026-04-30 10

4 月 28 日，NVIDIA 正式发布开源全模态推理模型 Nemotron 3 Nano Omni，将文本、图像、音频、视频、文档、图表乃至 GUI 界面等多种感知能力整合至单一系统，旨在解决传统 AI 智能体系统中多模型碎片化导致的延迟高、上下文断裂和成本攀升等痛点。

Nemotron 3 Nano Omni 采用 30B-A3B 混合专家（MoE）架构，总参数量约 300 亿，每次前向传播仅激活约 30 亿参数。该模型融合了 Mamba 层（提升长序列处理与内存效率）与 Transformer 层（保障推理精度），并集成 Conv3D、高效视频采样（EVS）等技术。其上下文窗口支持 256K 至 100 万 Token，能够处理超长文档与视频序列。

在性能方面，Nemotron 3 Nano Omni 在六项权威排行榜中名列前茅。相比同类开源全模态模型，其吞吐量最高提升 9.2 倍；在固定交互延迟下，视频推理的有效容量提升约 9.2 倍，多文档推理提升约 7.4 倍。得益于 Mamba 与 Transformer 的混合设计，内存与计算效率最高可提升 4 倍。在 MMlongbench-Doc、OCRBenchV2、WorldSense、DailyOmni、VoiceBench 等文档智能与音视频理解基准测试中，该模型均表现出色。

NVIDIA 此次将模型权重、训练数据集与训练配方完全开源，开发者可通过 Hugging Face、OpenRouter、build.nvidia.com 以及超过 25 个合作伙伴平台获取。模型同时以 NVIDIA NIM 微服务形式提供，支持从 NVIDIA Jetson、DGX Spark、DGX Station 等本地设备，到数据中心、云端及边缘环境的一致部署，便于企业在满足数据主权与合规要求的场景下落地。

在应用层面，Nemotron 3 Nano Omni 主要面向三大场景：一是电脑操作（Computer Use），代理可在图形界面中导航、推理屏幕内容，H Company 基于此构建的代理已采用 1920×1080 原生分辨率实现高保真视觉推理；二是文档智能（Document Intelligence），可解读文档、图表、表格与混合媒体输入，在视觉结构与文字内容之间进行连贯推理；三是音视频理解，能够将说出的内容、显示的画面与记录的文件整合至单一推理流程。

目前，富士康、Palantir、Aible、H Company、Eka Care、Pyler 等企业已宣布采用该模型，戴尔科技、DocuSign、Infosys、Oracle、Zefr 等公司亦在评估中。Nemotron 3 系列在过去一年中累计下载量已超过 5000 万次，Nano Omni 的发布标志着该系列从纯文本正式拓展至全模态 Agent 领域。

参考来源：

微信关注我们

原文链接：https://www.oschina.net/news/437611

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

蚂蚁百灵开源 Ling-2.6-1T：面向复杂任务的万亿级综合旗舰模型

蚂蚁集团旗下的百灵大模型团队宣布，正式开源其面向复杂任务的万亿级综合旗舰模型 Ling-2.6-1T。根据介绍，Ling-2.6-1T 并不是为了单纯追求更长的思考链，或制造更强的“参数规模体感”，而是面向真实复杂任务，系统性优化模型的智效比、指令执行、工具适配、长上下文承接和工程任务处理能力。 “我们希望它能够成为复杂工作流中的核心模型：既能理解复杂目标、拆解任务路径，也能在多样化 Agent harness、开发工具链和真实业务流程中稳定推进执行。” 具体而言，Ling-2.6-1T 重点解决三个问题：第一，在更低 Token 开销下保持...

2026-04-30

9

Hermes 是 Nous Research 打造的自进化 ai agent。Hermes 内置持续学习循环、跨会话的长期记忆，能从经验中生成技能，还附带功能强大的命令行界面，能连接 Telegram、Discord、Slack 等多个平台。在目前可运行的终端原生智能体中，Hermes 的能力不容置疑。目前，Hermes 正式接入 OpenAgents！几分钟即可实现安装、接入workspace，与 Claude Code、OpenClaw、Codex、OpenCode、Cursor 以及目录中所有其他 agent 协作。详细教程见下文👇 01 Hermes接入OpenAgents，有什...

2026-04-30

15

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。