DeepSeek 拥抱国产 GPU 编程语言 TileLang
9 月 29 日,深度求索正式发布 DeepSeek V3.2-Exp 模型(实验性版本),大幅提升了长文本处理效率,并宣布 API 调用成本降低 50% 以上。在这篇公告中,有这样一段表述:
在新模型的研究过程中,需要设计和实现很多新的 GPU 算子。我们使用高级语言 TileLang 进行快速原型开发,以支持更深入的探索。
据介绍,TileLang 是一种简洁的领域专用语言(DSL),旨在简化 GPU 和 NPU 等加速器上的算子编程,其核心设计理念是将复杂的硬件调度与开发者的算法逻辑解耦。
TileLang 由北大团队主导开发,核心人物除了王磊、董宇骐,还有北大计算机学院的副研究员、博士生导师杨智。
https://bbs.pku.edu.cn/v2/post-read-single.php?bid=322&postid=28065519
Tilelang 主要技术亮点包括:
- 简化 NPU 算子编程复杂度:Tilelang 采用类 Python 语法,大大降低 NPU 算子开发门槛,封装调度空间为自定义原语,开发者更加关注数据流本身。
- 支持灵活扩展:实现调度空间与数据流解耦,NPU 算子优化由编译器自动完成,同时充分利用 NPU 底层硬件特性。
- 高性能:Tilelang 可以实现高性能 NPU 算子,允许用户感知 NPU 硬件特性,相较 Triton 理论上可以获得更好的性能。
TileLang 采用类 Python 语法,并在 TVM 之上构建底层编译器基础架构,使开发者能够专注于提高生产力,而无需牺牲实现最佳性能所需的底层优化。
https://github.com/tile-ai/tilelang
TileLang 的核心价值在于大幅降低了 GPU 编程的技术门槛。传统 GPU 编程一直被视为高性能计算领域的 “技术高地”,需要开发者精通硬件架构、内存管理等复杂知识。
据 TileLang 开发社区 Tile-AI 发起人王磊博士在技术沙龙上透露,传统开发模式下,一个高性能算子的开发需要数周时间,且代码难以维护。而 TileLang 通过分层设计,让不同技术背景的开发者都能参与 GPU 编程。王磊博士在分享中表示:
如果你是完全不懂硬件的初学者,可以像写高级数学表达式一样编程;如果你是专家,也能进行深度优化。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
RWKV7-G1a 2.9B 推理模型开源发布,继续推进纯 RNN 模型的思考能力
2025 年 9 月 24 日,RWKV7-G1a 2.9B 推理模型开源发布,继续推进纯 RNN 模型的思考能力。 RWKV7-G1a 2.9B 从 RWKV7-G1 2.9B 继续训练 1T tokens 高质量数据,显著提升各方面能力。 模型客观指标评测 英语和多语言能力 RWKV7-G1a 2.9B 的基础英语和多语言能力均强于同规模的开源模型: 作为纯预训练的基底模型,无“刷榜”,RWKV7-G1a 2.9B 的 MMLU 提升到 61.1%,MMLU Pro 提升到 31.5%(RWKV7-G1 2.9B 的 MMLU 为 58.0%,MMLU Pro 为 25.8%)。 无法作弊的评测 Uncheatable Eval 是"无法作弊的评测",它使用最新的论文/新闻/代码/小说等实时数据,测试压缩率(“压缩即智能”),评估基底语言模型的真实语言建模能力和泛化能力。 RWKV7-G1a 2.9B 的 Uncheatable Eval 继续提升,领先所有 3B 参数量开源模型。 模型实战 多语言能力 翻译问题推荐使用保守的解码参数,此处为:temp=0.2,topp=0.2,p...
-
下一篇
WoTerm v10.2.11 版本发布
WoTerm 是一款跨平台开源且免费,功能强大的远程管理工具,集成主流远程通讯协议,全面满足您的需求:支持 SSH1/SSH2、FTP/FTPS、SFTP、TELNET、RLOGIN、RDP、VNC、SHELL、串口、TCP、UDP 等多种协议,让您无需切换工具,轻松应对各种远程操作和通讯场景。 如下是最新的更新内容: - 修复文本终端的删除字符指令,所导致末位字符错误BUG. - 提供多种SFTP/FTP的下载保存方式。 官网地址:https://woterm.com 开源地址:https://github.com/aoyiduo/woterm 和https://gitee.com/aoyiduo/woterm
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- MySQL数据库在高并发下的优化方案
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- CentOS7,8上快速安装Gitea,搭建Git服务器
- CentOS7,CentOS8安装Elasticsearch6.8.6
- 面试大杂烩