2026 年 3 月 16 日,Nvidia 在美国圣何塞举办年度大会 Nvidia GTC 2026。CEO Jensen Huang(黄仁勋)进行了接近 3 小时的主题演讲,核心围绕AI算力基础设施、AI推理时代、下一代芯片路线图、AI Agent、机器人与“物理AI”等方向。
![]()
一、AI 正从“训练时代”进入“推理时代”
黄仁勋在开场提出一个关键判断:AI产业的重心正在从“训练(Training)”转向“推理(Inference)”。
原因有三:
-
AI应用爆发
- Copilot、Agent、搜索、代码、客服等
- 需要实时推理能力
-
推理算力需求将远超训练
- 每个用户请求都需要推理
- 推理规模可能比训练高 1000倍
-
企业级AI开始普及
因此 Nvidia 的战略重点是:
建立“AI 工厂”(AI Factory)来大规模生产 token。
黄仁勋预计:AI芯片市场规模将在 2027 年达到 1 万亿美元级别。
![]()
二、AI基础设施:AI Factory 成为新的数据中心形态
黄仁勋提出一个重要概念:AI Factory(AI工厂)。区别:
| 传统数据中心 |
AI Factory |
| 运行软件 |
生产 token |
| CPU主导 |
GPU/AI加速器 |
| 面向存储计算 |
面向 AI 推理 |
AI 工厂核心组件:
- GPU计算
- CPU协同
- 网络互联
- 存储
- AI软件栈
Nvidia目标:把整个 AI 数据中心做成一个“整机产品”。
三、芯片路线图:Blackwell → Rubin → Feynman
本次 GTC 最大看点之一是 AI 芯片路线图。
1 Blackwell(当前)
当前主力 AI 架构:
- Blackwell GPU
- Grace CPU
- GB200 超级芯片
主要用于:
2 Vera Rubin(2026)
下一代架构:Vera Rubin
发布时间:2026 下半年
特点:
预计:
Rubin 架构由两部分组成:
系统级平台:Rubin NVL72
![]()
3 Feynman(2028)
下一代 AI 架构:Feynman
定位:AI Agent 时代的计算架构
预计特点:
- 更高带宽 HBM
- 光互连
- 针对 AI reasoning 优化
发布时间:2028 年
四、AI推理架构:Prefill + Decode
黄仁勋提出:AI 推理需要新的计算架构。推理分为两个阶段:
1 Prefill
处理:
特点:
适合 GPU
2 Decode
逐 token 生成
特点:
因此 Nvidia 提出:异构推理架构
- GPU 负责 Prefill
- 专用芯片负责 Decode
目标:把 AI 推理成本降低一个数量级。
五、AI Agent 平台:NemoClaw
本次 GTC 还推出新的 Agent 平台:NemoClaw
定位:企业级 AI Agent 基础设施
功能包括:
- agent runtime
- agent orchestration
- agent memory
- tool integration
目标:让企业部署自主 AI agent。
![]()
六、网络革命:光互连 + 铜互连
随着 AI 工厂规模扩大:网络成为最大瓶颈。
黄仁勋强调:未来 AI 数据中心必须同时使用:
- 铜互连
- 光互连
特别是:Co-packaged optics(CPO)
原因:
AI工厂规模可能达到:GW级算力中心,网络需求指数级增长。
七、物理AI(Physical AI)
黄仁勋在演讲中反复强调:
AI 的终极形态是 Physical AI
也就是说:AI 不只是软件。
还要理解:
应用场景:
- 机器人
- 自动驾驶
- 工业自动化
八、机器人平台
Nvidia展示了多项机器人技术:
核心技术:
流程:仿真训练 → 现实部署
目标:加速机器人开发。
九、自动驾驶
自动驾驶继续是 Nvidia 的重点。
平台:
合作厂商包括:
十、黄仁勋的终极愿景
演讲最后,黄仁勋给出一个宏大叙事——未来计算三大阶段:
1️⃣ Accelerated Computing GPU改变计算
2️⃣ Generative AI 大模型时代
3️⃣ Physical AI AI进入现实世界
终极目标:让 AI 成为新的工业基础设施。