英伟达官宣:CUDA 工具链将全面原生支持 Python
在近期的 GTC 2025 大会上,英伟达宣布其 CUDA 工具包将为 Python 提供原生支持并全面与之集成。
CUDA 架构师 Stephen Jones 在 GTC 技术演讲中对此表示,“我们一直在努力让加速计算与 Python 深度融合,使其成为 CUDA 技术栈中的‘一等公民’。”
据介绍,对于添加了原生 Python 支持的 CUDA,开发者可直接用 Python 编写算法,并在英伟达 GPU 上高效执行,无需手动调用底层内核或依赖 C++ 接口封装。
Stephen Jones 补充道:“这不仅仅是把原来的 C 语言翻译成 Python,而是要让 Python 保持本色,让 Python 开发者也感到自然。”
英伟达也强调,此次更新重新设计了一套真正符合 Python 编程习惯的 CUDA 开发模型,包括 API、库、执行方式和性能优化手段。开发者可以像使用 NumPy、PyTorch 那样,用 Python 脚本直接编写和调用 GPU 加速逻辑。
换句话说,英伟达对 CUDA 不是简单的语法包装,而是一次从运行时到编程模型的 Python 化重构。具体来看,英伟达提供了:
- CUDA Core:重新设计的运行时系统,支持完全的 Python 编程体验,执行流程也更贴近 Python 风格;
- cuPyNumeric:NumPy 的 GPU 加速替代品,修改一行 import 即可将代码从 CPU 迁移至 GPU;
- NVMath Python:统一接口库,支持在 host 和 device 两端调用各种库函数,这些函数调用支持自动融合(fusing),可带来明显的性能提升;
- 采用 JIT 编译:几乎不依赖传统编译器,大幅减少依赖链复杂度,提高执行效率和可移植性;
- 全套的分析工具支持:包括性能分析器、代码静态分析器等,帮助开发者进行性能调优。
除此之外,传统 CUDA 强调线程(thread)、块(block)等显式控制方式,而 Python 工程师则更熟悉“数组思维”——以矩阵、张量、向量等结构为基础组织计算。
为此,英伟达还推出了全新编程模型 CuTile,它更像是面向数组、张量的抽象,更贴近 Python 开发者的思维模式。
CuTile 模型强调以 tile(小块)为基本计算单元进行调度,每个 tile 包含若干数据元素,由编译器负责自动映射到底层线程执行,从而实现高效的 GPU 加速。
Stephen Jones 解释道,“相比线程,tile 更贴近 Python 语言的哲学;它足够高效,性能也不输 C++。”——tile 中的数据可以是向量、张量或数组,编译器可以更好地将整个数组操作映射到 GPU。
另外英伟达还计划在未来支持更多编程语言,早在 2024 年 GPU 技术大会上英伟达工程师就表示英伟达还在探索诸如 Rust 和 Julia 等编程开发语言,吸引更广泛的开发者群体。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Vision-R1:强化学习助力视觉定位,图文模型性能提升 50%
中国科学院自动化研究所与中科紫东太初团队联手推出了一种新方法 ——Vision-R1,利用类 R1强化学习技术,显著提升了视觉定位的能力。这个方法不仅在目标检测和视觉定位等复杂任务上实现了50% 的性能提升,甚至超过了参数规模超过10倍的现有最优模型(SOTA)。 当前,图文大模型通常依赖 “预训练 + 监督微调” 的方法来提高对用户指令的响应能力,但这种方法在资源消耗和训练效率上都存在较大挑战。Vision-R1通过结合高质量的指令对齐数据和强化学习,创新性地改变了这一局面。该方法通过设计一种视觉任务评估驱动的奖励机制,为模型的目标定位能力提供了强有力的支持。 具体而言,Vision-R1的奖励机制包括四个核心部分:首先,它采用了多目标预测的方式,以确保在密集场景中有效评估预测质量;其次,设计了双重格式奖励,以解决长序列预测中的格式错误问题;再者,召回奖励鼓励模型尽可能多地识别目标;最后,精度奖励则确保模型生成的目标框质量更高。这些设计相互作用,形成了 “1+1>2” 的优化效果,使模型在复杂视觉任务中表现更为出色。 为了解决预测高质量目标框的挑战,研究团队还提出了一种渐进式规...
- 下一篇
工信部:2025 年探索推进“人工智能+标准化”
工业和信息化部办公厅印发2025年工业和信息化标准工作要点。 其中包括:加强标准对企业的服务。探索推进“人工智能+标准化”,利用人工智能大模型赋能标准化建设,推动人工智能技术在标准预研、编制、宣贯和实施推广等全生命周期的应用,提高标准制定效率,推动标准落地实施。支持龙头链主企业和专精特新中小企业联合开展技术攻关、中试验证、标准研制和产品开发,形成紧密的供应链协作体系。 加强新兴产业标准建设。优化完善云计算、大数据、区块链、北斗导航等新一代信息技术标准,统筹推进新一代信息技术基础通用、关键技术、产品服务、行业应用、安全治理等标准制定,助力突破一批面向融合应用的新一代信息技术应用产品。加快构建新型信息基础设施标准体系,推进5G—A、低空信息基础设施、6G、量子保密通信等标准研究。开展先进金属、先进非金属、先进高分子等新材料,关键零部件、智能化网联化技术、全生命周期管理等新能源汽车,特殊行业应用等机器人,高档数控机床、医疗装备、安全应急装备等高端装备,绿色智能船舶、深海极地装备等船舶与海洋工程装备,低空产业、大飞机等民用航空标准体系建设,加快基础共性、关键技术、先进工艺、试验方法、重点产品、...
相关文章
文章评论
共有0条评论来说两句吧...