您现在的位置是:首页 > 文章详情

全网首个国芯 TileLang 在线体验环境,就在模力方舟!

日期:2025-10-09点击:48

一门由TileLang社区主导开发的编程语言,正悄然改变国产GPU的生态格局。

近日,DeepSeek 宣布在其新版本中拥抱国产 GPU 语言 TileLang,引发业界广泛关注。、TileLang 项目是由 TileLang 社区主导开发,旨在简化高性能GPU/CPU 内核的开发。它采用 Python 式语法,让开发者能够专注于提高生产力,而无需牺牲实现最佳性能所需的底层优化。

生态破局:国产算力的协同前行 

TileLang 作为一种专门用来开发 GPU 内核的领域专用语言,性能上可以对标国际主流生态。DeepSeek 官方推荐开发者使用该版本进行实验性开发,因其在调试便捷性与迭代速度上具备明显优势。这一特性对正在积极构建软件生态的国产 GPU 厂商来说,无疑是重要机遇。

开发效率:TileLang 的革命性突破

TileLang 最显著的优势在于大幅提升 GPU 内核的开发效率。TileLang 实现 FlashAttention 算子开发,代码量从 500+行减少至 80 行,并保持了与官方版本持平的性能。这种代码量的大幅减少不仅降低了开发门槛,也提高了维护性和可读性。

有开发者感叹 TileLang 是一种非常优雅的语言,只需不到 100 行代码就能写出比 Flash Attention 2 原版快 30%。这种开发效率与性能兼得的特点,正是 TileLang 引发关注的重要原因。

TileLang 提供了三个不同层次的编程接口,满足从初学者到专家不同水平开发者的需求。

实战验证:从原型到产品的性能表现

DeepSeek 选择 TileLang 并非偶然,而是基于实际性能验证。具体的性能数据来自 TileLang 以 DeepSeek 发布的 FlashMLA 内核作为评测基准的实验:在英伟达 H100 上的 MLA 解码速度,TileLang 编写的内核做到与 FlashMLA 相当。这一结果证明了 TileLang 在性能上具备与国际先进产品竞争的实力。DeepSeek v3.2 也验证了 TileLang 确实可以用来训练模型。 这一实践意义重大,表明了 TileLang 已从实验阶段走向实际生产应用。

在线体验:即刻上手的交互式探索

为了给大家提供开箱即用的 TileLang 体验环境,开源中国与沐曦联合在模力方舟平台上基于沐曦 C 系列芯片之上提供了预配置的 TileLang 在线运行环境,让开发者无需自行搭建硬件平台,即可体验 TileLang 在曦云C系列上的算子开发和优化过程。

您可以通过模力方舟的算力市场租用沐曦 GPU 卡,选择 TileLang 镜像:

在容器启动后执行如下命令即刻快速验证 TileLang 的运行效果:

cd /root/mcTileLang/

如下图所示:

国庆期间还可以领取 TileLang 专属算力券:

1. 扫码参与【双节体验券/卷】;

2. 领取您的TileLang专属算力券,并兑换算力容器资源;

3. 体验TileLang,感受其魅力。

目前沐曦 C 卡对 TileLang 支持的项目也已开源至 https://gitee.com/metax-maca/mcTileLang

即刻前往模力方舟算力市场体验 TileLang 的魅力吧:https://ai.gitee.com/compute

原文链接:https://www.oschina.net/news/376357
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章