您现在的位置是:首页 > 文章详情

DeepSeek 拥抱国产 GPU 编程语言 TileLang

日期:2025-09-30点击:18

9 月 29 日,深度求索正式发布 DeepSeek V3.2-Exp 模型(实验性版本),大幅提升了长文本处理效率,并宣布 API 调用成本降低 50% 以上。在这篇公告中,有这样一段表述:

在新模型的研究过程中,需要设计和实现很多新的 GPU 算子。我们使用高级语言 TileLang 进行快速原型开发,以支持更深入的探索

据介绍,TileLang 是一种简洁的领域专用语言(DSL),旨在简化 GPU 和 NPU 等加速器上的算子编程,其核心设计理念是将复杂的硬件调度与开发者的算法逻辑解耦。

TileLang 由北大团队主导开发,核心人物除了王磊、董宇骐,还有北大计算机学院的副研究员、博士生导师杨智。

https://bbs.pku.edu.cn/v2/post-read-single.php?bid=322&postid=28065519

Tilelang 主要技术亮点包括:

  • 简化 NPU 算子编程复杂度:Tilelang 采用类 Python 语法,大大降低 NPU 算子开发门槛,封装调度空间为自定义原语,开发者更加关注数据流本身。
  • 支持灵活扩展:实现调度空间与数据流解耦,NPU 算子优化由编译器自动完成,同时充分利用 NPU 底层硬件特性。
  • 高性能:Tilelang 可以实现高性能 NPU 算子,允许用户感知 NPU 硬件特性,相较 Triton 理论上可以获得更好的性能。

TileLang 采用类 Python 语法,并在 TVM 之上构建底层编译器基础架构,使开发者能够专注于提高生产力,而无需牺牲实现最佳性能所需的底层优化。

https://github.com/tile-ai/tilelang

TileLang 的核心价值在于大幅降低了 GPU 编程的技术门槛。传统 GPU 编程一直被视为高性能计算领域的 “技术高地”,需要开发者精通硬件架构、内存管理等复杂知识。

据 TileLang 开发社区 Tile-AI 发起人王磊博士在技术沙龙上透露,传统开发模式下,一个高性能算子的开发需要数周时间,且代码难以维护。而 TileLang 通过分层设计,让不同技术背景的开发者都能参与 GPU 编程。王磊博士在分享中表示:

如果你是完全不懂硬件的初学者,可以像写高级数学表达式一样编程;如果你是专家,也能进行深度优化。

原文链接:https://www.oschina.net/news/375511
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章