全网首个国芯 TileLang 在线体验环境,就在模力方舟!
一门由TileLang社区主导开发的编程语言,正悄然改变国产GPU的生态格局。
近日,DeepSeek 宣布在其新版本中拥抱国产 GPU 语言 TileLang,引发业界广泛关注。、TileLang 项目是由 TileLang 社区主导开发,旨在简化高性能GPU/CPU 内核的开发。它采用 Python 式语法,让开发者能够专注于提高生产力,而无需牺牲实现最佳性能所需的底层优化。
生态破局:国产算力的协同前行
TileLang 作为一种专门用来开发 GPU 内核的领域专用语言,性能上可以对标国际主流生态。DeepSeek 官方推荐开发者使用该版本进行实验性开发,因其在调试便捷性与迭代速度上具备明显优势。这一特性对正在积极构建软件生态的国产 GPU 厂商来说,无疑是重要机遇。
开发效率:TileLang 的革命性突破
TileLang 最显著的优势在于大幅提升 GPU 内核的开发效率。TileLang 实现 FlashAttention 算子开发,代码量从 500+行减少至 80 行,并保持了与官方版本持平的性能。这种代码量的大幅减少不仅降低了开发门槛,也提高了维护性和可读性。
有开发者感叹 TileLang 是一种非常优雅的语言,只需不到 100 行代码就能写出比 Flash Attention 2 原版快 30%。这种开发效率与性能兼得的特点,正是 TileLang 引发关注的重要原因。
TileLang 提供了三个不同层次的编程接口,满足从初学者到专家不同水平开发者的需求。
实战验证:从原型到产品的性能表现
DeepSeek 选择 TileLang 并非偶然,而是基于实际性能验证。具体的性能数据来自 TileLang 以 DeepSeek 发布的 FlashMLA 内核作为评测基准的实验:在英伟达 H100 上的 MLA 解码速度,TileLang 编写的内核做到与 FlashMLA 相当。这一结果证明了 TileLang 在性能上具备与国际先进产品竞争的实力。DeepSeek v3.2 也验证了 TileLang 确实可以用来训练模型。 这一实践意义重大,表明了 TileLang 已从实验阶段走向实际生产应用。
在线体验:即刻上手的交互式探索
为了给大家提供开箱即用的 TileLang 体验环境,开源中国与沐曦联合在模力方舟平台上基于沐曦 C 系列芯片之上提供了预配置的 TileLang 在线运行环境,让开发者无需自行搭建硬件平台,即可体验 TileLang 在曦云C系列上的算子开发和优化过程。
您可以通过模力方舟的算力市场租用沐曦 GPU 卡,选择 TileLang 镜像:
在容器启动后执行如下命令即刻快速验证 TileLang 的运行效果:
cd /root/mcTileLang/
如下图所示:
国庆期间还可以领取 TileLang 专属算力券:
1. 扫码参与【双节体验券/卷】;
2. 领取您的TileLang专属算力券,并兑换算力容器资源;
3. 体验TileLang,感受其魅力。
目前沐曦 C 卡对 TileLang 支持的项目也已开源至 https://gitee.com/metax-maca/mcTileLang
即刻前往模力方舟算力市场体验 TileLang 的魅力吧:https://ai.gitee.com/compute
关注公众号
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
RAG 实践:一文掌握大模型 RAG 过程
一、RAG是什么? RAG(Retrieval-Augmented Generation,检索增强生成), 一种AI框架,将传统的信息检索系统(例如数据库)的优势与生成式大语言模型(LLM)的功能结合在一起。不再依赖LLM训练时的固有知识,而是在回答问题前,先从外部资料库中"翻书"找资料,基于这些资料生成更准确的答案。 RAG技术核心缓解大模型落地应用的几个关键问题: ▪ 知识新鲜度:大模型突破模型训练数据的时间限制 ▪ 幻觉问题:降低生成答案的虚构概率,提供参照来源 ▪ 信息安全:通过外挂知识库而不是内部训练数据,减少隐私泄露 ▪ 垂直领域知识:无需训练直接整合垂直领域知识 二、RAG核心流程 2.1 知识准备阶段 1、数据预处理 1、文档解析 ▪ 输入:原始文档(如Markdown/PDF/HTML) ▪ 操作: ▪ 提取纯文本(如解析Markdown标题、段落) ▪ 处理特殊格式(如代码块、表格、图片、视频等) 例如: [标题] 什么是 ROMA? [段落] ROMA 是一个全自主研发的前端开发基于自定义DSL(Jue语言),一份代码,可在iOS、Androi...
-
下一篇
E-GetS/简单点通过EngageLab全渠道,激活东南亚用户增长新引擎
作为全球领先的AI驱动全渠道客户互动解决方案提供商,极光旗下EngageLab宣布其AppPush与WhatsApp Business API已助力东南亚知名本地生活及电商平台E-GetS/简单点,在柬埔寨、老挝、泰国和越南等市场,实现用户互动、运营效率及业务增长的显著提升。 关于E-GetS/简单点 E-GetS/简单点是一家领先的东南亚本地生活及电商平台,业务覆盖柬埔寨、老挝、泰国、越南等国家。目前平台的下载量已突破300万,服务涵盖外卖、团购、电商、数字支付等多个领域,面向多语种、多文化的数百万用户,持续推动本地数字经济发展。 挑战与痛点 随着E-GetS/简单点在东南亚多国的快速扩张,平台在用户触达与运营中遇到多重挑战: 东南亚地区设备碎片化、运营商复杂,推送消息送达率不稳定,影响用户体验。 用户分布多语种、多文化,难以精准触达用户的首选语言。 传统消息渠道用户活跃度有限,而WhatsApp已成为东南亚主流沟通工具,传统方式难以有效激活和留存用户。 EngageLab解决方案 针对上述挑战,E-GetS/简单点携手EngageLab,打造了一套面向东南亚市场的全渠道消息触达解决...
相关文章
文章评论
共有0条评论来说两句吧...




微信收款码
支付宝收款码