我国科学家发明混合并行新算法,让 AI 训练速度翻倍
近日,西北农林科技大学信息工程学院智能计算与农业信息系统团队刘斌教授携其课题组在国际计算机体系结构领域权威期刊《IEEE Transactions on Computers》(TC,CCF A类期刊)上发表研究论文。
该论文由西北农林科技大学携手美国纽约州立大学和云南大学联合发表。西北农林科技大学信息工程学院教授刘斌担任第一作者,纪泽宇老师与云南大学副教授何臻力共同担任通讯作者,纽约州立大学教授李克勤(欧洲科学院院士,并行与分布式计算领域公认的顶尖学者,国家特聘教授)作为重要合作者,使本次研究成果更具国际影响力。
论文针对当前大规模深度卷积神经网络(DCNN)大模型训练中负载不均衡和高通信开销的难题,提出了一种创新的混合并行训练方法——GroPipe。该方法首次将流水线模型并行与数据并行相融合,构建“组内流水线+组间数据并行”的分层训练架构,并通过自动模型划分算法(AMPA)实现计算负载的动态均衡调度,大幅提升GPU资源利用率。
GroPipe方法整体框架图。西北农林科技大学供图
为了进一步降低数据并行同步通信代价,GroPipe在反向传播阶段引入“基于分组的延迟异步通信”策略,延迟梯度同步操作,有效减轻全局通信带宽压力,显著提升训练吞吐量。
实验证明,在ImageNet数据集上,GroPipe方法相较于主流方案(如DP、Torchgpipe、DAPPLE和DeepSpeed)表现出卓越优势:ResNet系列平均加速比达42.2%,VGG系列达79.2%;在BERT-base模型训练中,性能提升最高可达51%。该成果展示了GroPipe在图像与文本领域的广泛适用性。
这一成果的发表标志着西北农林科技大学在计算机体系结构领域的A类国际顶级学术期刊——《IEEE Transactions on Computers》(创刊于1952年)上实现了历史性突破。
相关论文信息:https://doi.org/10.1109/TC.2025.3566869
转载自:https://news.sciencenet.cn/htmlnews/2025/5/544895.shtm
作者:李媛 来源:中国科学报

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
快手可灵 2.1 上线,价格降 65%
AI 视频生成工具可灵 2.1 现已正式上线。这次更新不仅在性能上实现了显著提升,还大幅降低了价格。 可灵2.1在之前的2.0版本基础上进行了深入优化,推出了三个明确的模型质量体系:标准版、高品质版和大师版。 标准版提供720P 的画质,适合一般视频需求,一条视频仅需20灵感值;高品质版提供1080P 的画质,性能卓越,一条视频需35灵感值;而大师版则是1080P 的高端选择,适合影视级效果,价格为100灵感值。 更新后的可灵2.1在效果上已经能够与之前的2.0大师版相媲美,价格却降低了65%。虽然可灵2.1目前只支持图生视频,但其生成的效果已经能够满足大多数用户的需求。 通过对比测试,不同版本之间的性能差异显著。可灵2.1的高品质版在生成速度上也相较于老版本有了明显的提升,用户的等待时间大幅缩短。
- 下一篇
Zadig v3.4.0 核能级发布:AI 提效 × 军工级防护 × 协作革命
亲爱的开发者们,假期归来,效率拉满! Zadig v3.4.0 携 AI 黑科技 + 企业级防护 + 丝滑协作 强势登场,免费版也能打,升级只需 5 分钟👇,四大超能升级,助你轻松应对节后工作高峰! 🤖 AI 提效,Zadig Pilot 登场! 对话式解决工作流卡顿问题 智能诊断效能瓶颈并生成优化方案 产品文档秒级语义检索 ⚡ 效能四连暴击,甩锅时代终结! 🔥 资源消耗直降 50%!工作流自身运行效率翻倍 ⏮️ 生产事故 5 秒回滚:支持一键回滚备注溯源 🔔 Teams 跨国告警:跨国团队零时差协同 ✅ 测试报告直通群聊:质量问题全员可见 🛡️ 系统安全&性能双重升级 镜像漏洞扫描强化版(更新 CVE 库) 智能拦截 0day 攻击(高危接口动态防护) 工作流测试列表加载速度提升 300% 高可用架构(HubServer多副本部署) 操作日志查询响应时间缩短 80% 🔗 OpenAPI & 集成:打通企业工具链 CI/CD 融合数据库变更:OpenAPI 触发工作流自动执行 SQL 脚本 操作日志审计 API:一键导出全量操作记录,合规审计无忧 身份管理扩...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS8编译安装MySQL8.0.19
- Linux系统CentOS6、CentOS7手动修改IP地址
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- Windows10,CentOS7,CentOS8安装Nodejs环境
- Red5直播服务器,属于Java语言的直播服务器
- SpringBoot2整合Redis,开启缓存,提高访问速度
- CentOS7,8上快速安装Gitea,搭建Git服务器
- SpringBoot2配置默认Tomcat设置,开启更多高级功能