上海 AI 实验室开源 XTuner V1 训练引擎
上海人工智能实验室(上海AI实验室)宣布开源书生大模型新一代训练引擎 XTuner V1。
根据介绍,XTuner V1 是伴随上海AI实验室“通专融合”技术路线的持续演进,以及书生大模型研发实践而成长起来的新一代训练引擎。相较于传统的 3D 并行训练引擎,XTuner V1 不仅能应对更加复杂的训练场景,还具备更快的训练速度,尤其在超大规模稀疏混合专家(MoE)模型训练中优势显著。
XTuner V1 基于 PyTorch FSDP 进行开发,并针对 FSDP 通信量大的固有缺陷,进行了系列优化,可支持 1T 参数量级 MoE 模型训练,并首次在 200B 以上量级的混合专家模型上,实现训练吞吐超越传统的 3D 并行训练方案。
针对当前主流的 MoE 后训练需求,XTuner V1 不使用序列并行就能实现 200B 量级 MoE 模型单次 forward-backward 可处理 64k 序列长度,更适合当下流行的强化学习训练场景;对专家并行依赖小,长序列训练时受专家不均衡影响小,200B 量级 MoE 无需专家并行,600B MoE 只需节点内专家并行,更适合现代 MoE Dropless 训练模式;大规模长短序列混训场景提速 2 倍以上,数据并行负载均衡,大幅减小因需序列长度不均衡导致的计算空泡。
同时,为了进一步挖掘 XTuner V1 训练方案的上限,研究团队与华为昇腾技术团队在 Ascend A3 NPU 超节点上进行联合优化,充分利用超节点硬件特性,实现了更高的 MFU(Model FLOPS Utilization,模型浮点运算利用率)。
在理论算力落后 NVIDIA H800 近 20% 的情况下,最终实现训练吞吐超过 H800 近 5%,MFU 反超 20% 以上,该项研究成果技术报告也将于近期发布。
除了训练框架,书生大模型研发中使用的 AIOps 工具 DeepTrace 与 ClusterX 也将一并开源,为大规模分布式训练提供全方位保障。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
B站(哔哩哔哩)语音团队开源新一代语音合成模型 IndexTTS2
哔哩哔哩语音团队发布并开源了新一代零样本语音合成模型IndexTTS2。 相关论文《IndexTTS2: A Breakthrough in Emotionally Expressive and Duration-Controlled Auto-Regressive Zero-Shot Text-to-Speech》已在arXiv上线,代码与模型权重也同步在GitHub与Hugging Face公开。 https://arxiv.org/abs/2506.21619 https://github.com/index-tts/index-tts 该模型首次在自回归架构中引入了“时间编码”机制,支持通过显式指定token数量来实现毫秒级的时长控制,也可以自由生成以保留原始韵律。 IndexTTS2 由三个核心模块组成:Text-to-Semantic(T2S) 、Semantic-to-Mel(S2M) 以及 BigVGANv2 声码器 。首先,T2S 模块基于输入的源文本、风格提示、音色提示以及一个可选的目标语音token数,生成对应的语义 token 序列。然后,S2M 模块以语义 t...
-
下一篇
Anthropic 支持加州 AI 安全法案
AI 公司Anthropic正式支持加州州长斯科特・维纳(Scott Wiener)提出的 SB53法案。该法案计划对全球最大的 AI 模型开发者施加前所未有的透明度要求,成为美国首个针对 AI 安全的立法尝试。然而,矛盾的是,许多硅谷科技公司和联邦政府对此法案表示强烈反对。 Anthropic在一篇博客中指出:“尽管我们认为前沿 AI 安全问题应在联邦层面解决,而不是由各州自行规定,但强大的 AI 技术发展不会等待华盛顿的共识。” 该公司强调,制定 AI 治理标准是当务之急,而 SB53提供了一条合理的路径。 如果 SB53法案获得通过,像Anthropic、OpenAI、谷歌和 xAI 等 AI 模型开发者将需要制定安全框架,并在部署强大 AI 模型前,发布公开的安全和安保报告。此外,该法案还将为举报安全问题的员工提供保护。 该法案特别关注于限制 AI 模型对 “灾难性风险” 的贡献,定义为导致至少50人死亡或造成超过10亿美元损失的事件。SB53侧重于防范极端 AI 风险,例如防止 AI 模型被用于生物武器的开发或网络攻击,而不涉及更近一步的 AI 深度伪造或过度迎合等问题。 加...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- SpringBoot2整合Redis,开启缓存,提高访问速度
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- MySQL数据库在高并发下的优化方案
- MySQL8.0.19开启GTID主从同步CentOS8
- SpringBoot2全家桶,快速入门学习开发网站教程
- SpringBoot2整合Thymeleaf,官方推荐html解决方案