DeepSeek 开源周第四日:DualPipe、EPLB 优化并行策略
DeepSeek“开源周”的进度已进行到第四天,今天开源了优化并行策略的项目。
-
DualPipe - 一种用于 V3 / R1 训练中计算-通信重叠的双向管道并行算法。
-
EPLB - 一种用于 V3 / R1 的专家并行负载平衡器。
-
分析 V3 / R1 中的计算-通信重叠。
具体项目介绍和链接如下:
“双管道(DualPipe)”是在《深度搜索-V3 技术报告》中引入的一种创新的双向流水线并行算法。它实现了正向和反向计算-通信阶段的完全重叠,同时也减少了流水线气泡。
在使用专家并行(EP)时,不同的专家被分配到不同的 GPU。由于不同专家的负载可能因当前工作负载而异,因此保持不同 GPU 的负载平衡非常重要。正如在 DeepSeek-V3 论文中所述,我们采用冗余专家策略,复制高负载的专家。
然后,我们通过启发式方法将复制的专家分配到 GPU 上,以确保不同 GPU 之间的负载平衡。
此外,由于 DeepSeek-V3 中使用了分组受限的专家路由,我们还尽可能尝试将同一组的专家放置在同一节点上,以减少节点间的数据流量。为了便于复现和部署,我们在eplb.py中开源了我们部署的 EP 负载均衡算法。该算法根据估计的专家负载计算平衡的专家复制和放置计划。
请注意,预测专家负载的确切方法不在此存储库的范围内。一种常见的方法是使用历史统计数据的移动平均值。
在这里,我们公开分享来自我们的训练和推理框架的分析数据,以帮助社区更好地理解通信-计算重叠策略和底层实现细节。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Mozilla 推出 Firefox 使用条款,更新隐私声明
在最近的领导层变更后,Mozilla 宣布首次推出了 Firefox使用条款,以及更新的隐私声明。 “为什么是现在?虽然我们过去一直依赖 Firefox 的开源许可证和对您的公开承诺,但如今我们正处于一个截然不同的技术环境中。我们希望让这些承诺变得非常清晰和易于理解。” 公告称,此举旨在使用户在使用 Firefox 时为他们提供“更多透明度”,了解自己的“权利和权限”,以及 Mozilla 帮助他们实现这些权利的“权利”。 您授予 Mozilla 运营 Firefox 所需的一切权利,包括按照Firefox 隐私声明中的描述处理数据,以及代表您帮助您浏览互联网。当您通过 Firefox 上传或输入信息时,您特此授予我们非排他性、免版税的全球许可,以使用该信息来帮助您导航、体验在线内容并与之交互,就像您在使用 Firefox 时所表明的那样。 该条款预计将从 3 月初开始将其作为新用户的标准产品体验的一部分推出,并在今年晚些时候将其作为现有用户的标准产品体验的一部分。 与此同时,更新的隐私声明则更详细地解释了相关数据实践。增加了一些琐碎的注意事项,以涵盖公司计划中的 AI 聊天机器人集成...
- 下一篇
特斯拉 FSD 国内训练数据合规,但仍处于 L2 级自动驾驶级别
2月26日,特斯拉中国正式启动2024.45.32.12版车机系统升级,此次更新重点向用户推送"完全自动驾驶能力(FSD)智能辅助驾驶"功能的进阶服务。 据《网易科技》的独家报道,特斯拉“FSD智能辅助驾驶”的训练是在数据采集使用完全合规的情况下完成的。 此外,特斯拉此次在中国沿用"FSD智能辅助驾驶"的命名体系,旨在保持全球品牌技术标识的统一性。当前特斯拉FSD仍属于L2级辅助驾驶范畴,要求驾驶员全程保持对车辆的控制权。特斯拉中国官网特别强调,用户在使用过程中必须将双手置于方向盘感应区域,视线不可脱离路面,系统会通过实时摄像头监测确保驾驶专注度。 据悉,此次发布的FSD中国版针对本土交通环境进行了超过200项专项优化。值得关注的是,此次升级暂未涵盖上月刚发布的Model Y焕新版车型。预计将在未来通过OTA方式完成功能匹配。 随着本次软件升级的推进,特斯拉成为首个在中国市场实现高阶智能驾驶功能规模化部署的外资车企。 最后看看 2016 年推出至今,特斯拉 FSD的发展脉络: 2014 年,Autopilot 辅助驾驶功能首次搭载在 Model S 上。 2016 年,特斯拉首次发布 ...
相关文章
文章评论
共有0条评论来说两句吧...