DeepEP —— 开源 EP 通信库
DeepEP 是专为 Mixture-of-Experts (MoE) 和 expert parallelism (EP) 定制的通信库。它提供高吞吐量和低延迟的 all-to-all GPU 内核,也就是所谓的 MoE 调度和组合。该库还支持低精度操作,包括 FP8。
为了与 DeepSeek-V3 论文中提出的 group-limited gating algorithm 保持一致,DeepEP 提供了一组针对非对称域带宽转发(例如将数据从 NVLink 域转发到 RDMA 域)进行优化的内核。这些内核提供高吞吐量,使其适合训练和推理预填充任务。此外,它们还支持 SM (Streaming Multiprocessors) 数量控制。
对于延迟敏感的推理解码,DeepEP 包含一组具有纯 RDMA 的低延迟内核,以最大限度地减少延迟。该库还引入了一种 hook-based 通信计算重叠方法,该方法不占用任何 SM 资源。
要求
- Hopper GPU(以后可能支持更多架构或设备)
- Python 3.8 及以上版本
- CUDA 12.3 及以上版本
- PyTorch 2.1 及以上版本
- 用于节点内通信的 NVLink
- 用于节点内通信的 RDMA 网络

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Gitee MCP 现已支持远程访问:无需本地部署,AI 助手即插即用
今年三月,Gitee 正式发布了官方 MCP Server,让 AI 助手深度参与代码仓库的管理,助力开发者更高效地工作。 今天,Gitee MCP 正式支持远程访问,上线了Remote mcp-gitee:无需安装、即开即用,让 AI 助手可以远程、安全地与 Gitee 交互,真正做到「即连即用」。 开源地址:https://gitee.com/oschina/mcp-gitee 什么是 Remote mcp-gitee? Remote mcp-gitee是 Gitee 推出的远程版 MCP Server,无需本地部署,默认运行在云端,同时也拥有全面的接口能力,支持仓库、文件、Issue、PR、用户信息获取、评论等众多操作,满足常见开发协作需求。 你可以通过简单配置直接将其接入任意支持 MCP Streamable HTTP 协议的客户端,无需安装依赖、编译构建,也无需配置本地环境。 与此前的本地部署方式不同,Remote mcp-gitee将服务完全托管在云端,为用户提供了开箱即用、跨平台、跨设备的一致使用体验。 远程 MCP 有哪些使用场景 AI 驱动的协作:通过Remote m...
- 下一篇
Firefox 139 测试内置 Perplexity AI 搜索
负责 Firefox 搜索的产品经理Gayatri 宣布团队正在与 Perplexity 合作,将Perplexity AI 搜索内置到 Firefox 139 中。 Perplexity 是一个 AI 驱动的搜索引擎,能直接以对话形式回答你的问题——无需翻阅大量搜索结果。它特别适用于以下情况: ✅需要快速简洁的答案,避免在多个信息源中迷失 📚在研究或学习时需要准确且引用充分的资料 ✍️在创作或处理技术内容,如博客文章或代码片段 Firefox 团队表示,这是他们更广泛目标的组成部分,即在使用搜索方式以及信任哪些工具来帮助他们完成任务方面为用户提供更多选择。如果体验良好,可能会考虑在未来支持更多 AI 回答或搜索选项。
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Hadoop3单机部署,实现最简伪集群
- CentOS7,CentOS8安装Elasticsearch6.8.6
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- SpringBoot2全家桶,快速入门学习开发网站教程
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池