黄仁勋演讲 3 小时，几乎覆盖 AI 产业所有关键方向

2026-03-17 90

2026 年 3 月 16 日，Nvidia 在美国圣何塞举办年度大会 Nvidia GTC 2026。CEO Jensen Huang（黄仁勋）进行了接近 3 小时的主题演讲，核心围绕AI算力基础设施、AI推理时代、下一代芯片路线图、AI Agent、机器人与“物理AI”等方向。

一、AI 正从“训练时代”进入“推理时代”

黄仁勋在开场提出一个关键判断：AI产业的重心正在从“训练（Training）”转向“推理（Inference）”。

原因有三：

AI应用爆发
- Copilot、Agent、搜索、代码、客服等
- 需要实时推理能力
推理算力需求将远超训练
- 每个用户请求都需要推理
- 推理规模可能比训练高 1000倍
企业级AI开始普及

因此 Nvidia 的战略重点是：

建立“AI 工厂”（AI Factory）来大规模生产 token。

黄仁勋预计：AI芯片市场规模将在 2027 年达到 1 万亿美元级别。

二、AI基础设施：AI Factory 成为新的数据中心形态

黄仁勋提出一个重要概念：AI Factory（AI工厂）。区别：

传统数据中心	AI Factory
运行软件	生产 token
CPU主导	GPU/AI加速器
面向存储计算	面向 AI 推理

AI 工厂核心组件：

GPU计算
CPU协同
网络互联
存储
AI软件栈

Nvidia目标：把整个 AI 数据中心做成一个“整机产品”。

三、芯片路线图：Blackwell → Rubin → Feynman

本次 GTC 最大看点之一是 AI 芯片路线图。

1 Blackwell（当前）

当前主力 AI 架构：

Blackwell GPU
Grace CPU
GB200 超级芯片

主要用于：

大模型训练
大规模推理

2 Vera Rubin（2026）

下一代架构：Vera Rubin

发布时间：2026 下半年

特点：

3nm 制程
HBM4 内存
推理性能大幅提升

预计：

训练性能提升 3.5 倍
推理效率提升 10 倍

Rubin 架构由两部分组成：

Vera CPU
Rubin GPU

系统级平台：Rubin NVL72

3 Feynman（2028）

下一代 AI 架构：Feynman

定位：AI Agent 时代的计算架构

预计特点：

更高带宽 HBM
光互连
针对 AI reasoning 优化

发布时间：2028 年

四、AI推理架构：Prefill + Decode

黄仁勋提出：AI 推理需要新的计算架构。推理分为两个阶段：

1 Prefill

处理：

prompt
上下文

特点：

大规模矩阵计算

适合 GPU

2 Decode

逐 token 生成

特点：

小计算
高频调用

因此 Nvidia 提出：异构推理架构

GPU 负责 Prefill
专用芯片负责 Decode

目标：把 AI 推理成本降低一个数量级。

五、AI Agent 平台：NemoClaw

本次 GTC 还推出新的 Agent 平台：NemoClaw

定位：企业级 AI Agent 基础设施

功能包括：

agent runtime
agent orchestration
agent memory
tool integration

目标：让企业部署自主 AI agent。

六、网络革命：光互连 + 铜互连

随着 AI 工厂规模扩大：网络成为最大瓶颈。

黄仁勋强调：未来 AI 数据中心必须同时使用：

铜互连
光互连

特别是：Co-packaged optics（CPO）

原因：

AI工厂规模可能达到：GW级算力中心，网络需求指数级增长。

七、物理AI（Physical AI）

黄仁勋在演讲中反复强调：

AI 的终极形态是 Physical AI

也就是说：AI 不只是软件。

还要理解：

重力
摩擦
空间
物理世界

应用场景：

机器人
自动驾驶
工业自动化

八、机器人平台

Nvidia展示了多项机器人技术：

核心技术：

Omniverse
仿真训练
机器人基础模型

流程：仿真训练 → 现实部署

目标：加速机器人开发。

九、自动驾驶

自动驾驶继续是 Nvidia 的重点。

平台：

Drive AI
自动驾驶仿真

合作厂商包括：

多家车企
自动驾驶公司

十、黄仁勋的终极愿景

演讲最后，黄仁勋给出一个宏大叙事——未来计算三大阶段：

1️⃣ Accelerated Computing GPU改变计算

2️⃣ Generative AI 大模型时代

3️⃣ Physical AI AI进入现实世界

终极目标：让 AI 成为新的工业基础设施。

微信关注我们

原文链接：https://www.oschina.net/news/411245

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Claude 最新系列模型 100 万 Token 上下文窗口正式开放

Anthropic 宣布旗下最新系列模型 Claude Opus 4.6 与 Claude Sonnet 4.6 的 100 万 Token 上下文窗口（1M context）正式进入 GA（General Availability）阶段，并在标准价格体系下开放给开发者和企业用户。这意味着开发者可以在一次请求中输入规模极其庞大的信息，让模型在同一上下文中进行推理与处理。所谓上下文窗口，指的是模型在一次推理过程中能够“看到”的文本或数据量。此次 1M Token 的容量，已经可以覆盖多种大型工作场景，例如：完整代码库分析：可以一次加载整个项目代码、测试和文档大型文档集分析：例如数百页合同或研究资料长时间运行的 AI Agent：持续记录工具调用、日志和推理过程过去，当上下文超过模型限制时，开发者必须不断压缩或总结历史信息，这会导致关键细节丢失。新的 1M 窗口可以直接保留完整上下文，大幅减少这种“记忆压缩”。一个值得注意的变化是价格模型的调整。Anthropic 表示，1M 上下文窗口不再收取额外长上下文费用，即长请求与短请求按照同样的 Token 单价计费。当前价格大致...

2026-03-17

109

百度秒哒宣布推出全球首个OpenClaw应用开发Skill——“Miaoda App Builder”（秒哒Skill）。 “这也是业内首次将专业的应用开发能力封装为可供智能体调用的技能包，并将其作为API开放给OpenClaw生态。” 百度秒哒是百度智能云推出的无代码应用开发平台。用户只需用自然语言描述需求，秒哒即可自动完成从前端页面到后端数据库、从代码生成到部署上线的全流程，并支持可视化调试和编辑。公告称，即日起，OpenClaw用户可为“龙虾”配置秒哒Skill，通过自然语言对话直接完成网页、小程序、游戏等应用的创建、修改与发布上线，真正实现“对话即应用”，一句话让“龙虾”开发专业网站。用户只需在秒哒官网/ClawHub中获取秒哒Skill，配置API Key后，“龙虾”便具备了调用秒哒能力的权限。秒哒Skill支持应用开发全生命周期操作。“龙虾”会自动调用秒哒Skill完成创建、生成、发布全流程，最终返回一个可直接访问的网站链接，串联多个步骤，一次性完成全流程。用户也可以修改和完善应用、创建微信小程序或单独使用一些原子能力。同时，它也支持批量创作应用，自动尝试创意。

2026-03-17

82

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。