DeepSeek 拥抱国产 GPU 编程语言 TileLang-低调大师

DeepSeek 拥抱国产 GPU 编程语言 TileLang

2025-09-30 242

9 月 29 日，深度求索正式发布 DeepSeek V3.2-Exp 模型（实验性版本），大幅提升了长文本处理效率，并宣布 API 调用成本降低 50% 以上。在这篇公告中，有这样一段表述：

在新模型的研究过程中，需要设计和实现很多新的 GPU 算子。我们使用高级语言 TileLang 进行快速原型开发，以支持更深入的探索。

据介绍，TileLang 是一种简洁的领域专用语言（DSL），旨在简化 GPU 和 NPU 等加速器上的算子编程，其核心设计理念是将复杂的硬件调度与开发者的算法逻辑解耦。

TileLang 由北大团队主导开发，核心人物除了王磊、董宇骐，还有北大计算机学院的副研究员、博士生导师杨智。

https://bbs.pku.edu.cn/v2/post-read-single.php?bid=322&postid=28065519

Tilelang 主要技术亮点包括：

简化 NPU 算子编程复杂度：Tilelang 采用类 Python 语法，大大降低 NPU 算子开发门槛，封装调度空间为自定义原语，开发者更加关注数据流本身。
支持灵活扩展：实现调度空间与数据流解耦，NPU 算子优化由编译器自动完成，同时充分利用 NPU 底层硬件特性。
高性能：Tilelang 可以实现高性能 NPU 算子，允许用户感知 NPU 硬件特性，相较 Triton 理论上可以获得更好的性能。

TileLang 采用类 Python 语法，并在 TVM 之上构建底层编译器基础架构，使开发者能够专注于提高生产力，而无需牺牲实现最佳性能所需的底层优化。

https://github.com/tile-ai/tilelang

TileLang 的核心价值在于大幅降低了 GPU 编程的技术门槛。传统 GPU 编程一直被视为高性能计算领域的 “技术高地”，需要开发者精通硬件架构、内存管理等复杂知识。

据 TileLang 开发社区 Tile-AI 发起人王磊博士在技术沙龙上透露，传统开发模式下，一个高性能算子的开发需要数周时间，且代码难以维护。而 TileLang 通过分层设计，让不同技术背景的开发者都能参与 GPU 编程。王磊博士在分享中表示：

如果你是完全不懂硬件的初学者，可以像写高级数学表达式一样编程；如果你是专家，也能进行深度优化。

微信关注我们

原文链接：https://www.oschina.net/news/375511

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

RWKV7-G1a 2.9B 推理模型开源发布，继续推进纯 RNN 模型的思考能力

2025 年 9 月 24 日，RWKV7-G1a 2.9B 推理模型开源发布，继续推进纯 RNN 模型的思考能力。 RWKV7-G1a 2.9B 从 RWKV7-G1 2.9B 继续训练 1T tokens 高质量数据，显著提升各方面能力。模型客观指标评测英语和多语言能力 RWKV7-G1a 2.9B 的基础英语和多语言能力均强于同规模的开源模型：作为纯预训练的基底模型，无“刷榜”，RWKV7-G1a 2.9B 的 MMLU 提升到 61.1%，MMLU Pro 提升到 31.5%（RWKV7-G1 2.9B 的 MMLU 为 58.0%，MMLU Pro 为 25.8%）。无法作弊的评测 Uncheatable Eval 是"无法作弊的评测"，它使用最新的论文/新闻/代码/小说等实时数据，测试压缩率（“压缩即智能”），评估基底语言模型的真实语言建模能力和泛化能力。 RWKV7-G1a 2.9B 的 Uncheatable Eval 继续提升，领先所有 3B 参数量开源模型。模型实战多语言能力翻译问题推荐使用保守的解码参数，此处为：temp=0.2，topp=0.2，p...

2025-09-30

135

WoTerm 是一款跨平台开源且免费，功能强大的远程管理工具，集成主流远程通讯协议，全面满足您的需求：支持 SSH1/SSH2、FTP/FTPS、SFTP、TELNET、RLOGIN、RDP、VNC、SHELL、串口、TCP、UDP 等多种协议，让您无需切换工具，轻松应对各种远程操作和通讯场景。如下是最新的更新内容： - 修复文本终端的删除字符指令，所导致末位字符错误BUG. - 提供多种SFTP/FTP的下载保存方式。官网地址：https://woterm.com 开源地址：https://github.com/aoyiduo/woterm 和https://gitee.com/aoyiduo/woterm

2025-10-01

128

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。