Cursor 发布全球最快 MXFP8 MoE 内核
Cursor 团队发表博客介绍他们从零构建的 MXFP8 内核实现 1.5 倍 MoE 训练速度提升的过程。
在过去几周里,我们从 GPU 内核层面彻底重写了整个 MoE (专家混合模型) 层,并且完全不依赖任何 CUDA 库。我们使用的是纯粹、经典的 CUDA 和 PTX,并在此基础上融合了一些 ThunderKittens 的技术。
最终,我们的 MoE 层在前向和反向传播中的性能都提升了 3.5 倍,这使得模型在 Blackwell 架构上的端到端训练速度提升了 1.5 倍,并且比我们最初在 Hopper 上的方案快了 2 倍。
我们相信,我们的技术栈比当今任何可用的开源方案组合都要快。
为解决 MoE 层在训练中速度过慢的问题,Cursor 团队在内核级别对其进行了完全重建,并转向使用 MXFP8 格式。在训练其编程模型时,MoE 层曾占据了 27% 至 53% 的训练时间。
经过优化后,新的 MXFP8 MoE 内核实现了 MoE 层速度提升 3.5 倍,并带来了 1.5 倍。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
🔥 Spring AOP 与 Solon AOP 有什么区别?
Spring 和 Solon 作为容器型框架。都具有 IOC 和 AOP 的能力。其中: Spring AOP 使用表达式确定“切入点”,可以是某个注解(有侵入),可以是包名或类名或方法(无侵入) Solon AOP 只使用某个注解确定“切入点”(有侵入) 先看两个示例 1、Spring AOP 示例 Spring AOP 有很多不同的能力构建方式。此处采用更简洁的一种方式: import org.aspectj.lang.JoinPoint; import org.aspectj.lang.annotation.*; import org.springframework.stereotype.Component; @Aspect @Component public class LoggingAspect { @Pointcut("execution(* com.example.demo.service.*.*(..))") //也可以是某注解表达式 public void serviceLayer() {} @Around("serviceLayer()"...
- 下一篇
开放签电子签章回调通知服务使用技巧:区分合同状态与事件类型
回调通知服务使用技巧:区分合同状态与事件类型 在集成开放签回调通知服务时,许多用户容易混淆"合同状态(contractStatus)"和"事件类型(callbackType)"这两个概念。本文将通过实际案例详细解释它们的区别,帮助您正确理解和使用这两个参数。 核心概念解析 合同状态 (contractStatus) - 合同的整体状态 合同状态表示整个合同在某个时刻所处的整体状态,它描述的是合同的生命周期阶段。例如:签署中、已拒签、已完成等。 事件类型 (callbackType) - 用户的具体操作 事件类型表示在合同签署流程中发生的具体操作或事件以及触发关联事件,它描述的是某个用户或者程序执行的具体动作。例如:提交签署、拒签、完成签署等。 形象化比喻 可以把合同状态比作一部电影的播放状态(未开始、播放中、已结束),而事件类型则是观众的具体操作(暂停、快进、重新播放)。每次操作都可能影响电影的播放状态,但操作本身和状态是两个不同的概念。 合同状态详解 状态 说明 DRAFT 草稿 DELETED 已删除 WRITING 填写中 REFUSAL_WRITE 已拒填 SIGNIN...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS7,CentOS8安装Elasticsearch6.8.6
- Hadoop3单机部署,实现最简伪集群
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- Windows10,CentOS7,CentOS8安装Nodejs环境
- Linux系统CentOS6、CentOS7手动修改IP地址
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- CentOS7,8上快速安装Gitea,搭建Git服务器
- CentOS8安装Docker,最新的服务器搭配容器使用