我国科学家发明混合并行新算法,训练 AI 速度近乎翻倍

我国科学家发明混合并行新算法,训练 AI 速度近乎翻倍

人工智能 2025-05-30 15:14:07 2天前

IT酷哥 5 月 29 日消息,中国科学报今天(5 月 29 日)报道,我国科学家联合发明混合并行新算法 GroPipe,首次融合流水线模型并行与数据并行,训练 AI 速度近乎实现翻倍。

IT酷哥援引博文介绍,该算法由西北农林科技大学信息工程学院智能计算与农业信息系统团队刘斌教授带领,携手美国纽约州立大学和云南大学,相关论文联合发表在国际计算机体系结构领域权威期刊《IEEE Transactions on Computers》(TC,CCF A 类期刊)上。

西北农林科技大学信息工程学院教授刘斌担任第一作者,纪泽宇老师与云南大学副教授何臻力共同担任通讯作者,纽约州立大学教授李克勤(欧洲科学院院士,并行与分布式计算领域公认的顶尖学者,国家特聘教授)作为重要合作者。

研究指出,在训练大型深度卷积神经网络(DCNNs)方面,使用越来越大的数据集来提高模型精度已变得非常耗时,数据并行(DP)和流水线模型并行(PMP)等分布式训练方法虽然提供了可行解决方案,但面临负载不平衡和显著的通信开销等挑战。

为此团队提出了 GroPipe 算法架构,协同整合 PMP 和 DP,采用了基于性能预测技术的自动模型分割算法,确保负载平衡并便于在 PMP 中进行定量性能评估。

GroPipe 方法整体框架图。西北农林科技大学供图

该方法首次将流水线模型并行与数据并行相融合,构建“组内流水线 + 组间数据并行”的分层训练架构,并通过自动模型划分算法(AMPA)实现计算负载的动态均衡调度,大幅提升 GPU 资源利用率。

在一台 8-GPU 服务器上广泛测试后,发现在 ImageNet 数据集上,GroPipe 方法相较于主流方案(如 DP、Torchgpipe、DAPPLE 和 DeepSpeed)表现出卓越优势:ResNet 系列平均加速比达 42.2%,VGG 系列达 79.2%;在 BERT-base 模型训练中,性能提升最高可达 51%。

IT酷哥附上参考地址

AI 训练速度翻倍!我国科学家发明混合并行新算法

GroPipe: A Grouped Pipeline Hybrid Parallel Method for Accelerating DCNNs Training

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 担忧变为现实:从事文案创作的 25 岁女员工因 ChatGPT 被解雇
  • DeepMind 人工智能创造出比人类快 70% 的排序算法,可让全球软件速度更快
  • 可识别 AI 生成的科学文本的新型检测工具问世,号称准确率超 99% 但遭质疑
  • 消息称字节跳动正内部测试 AI 对话类产品,代号“Grace”
  • OpenAI CEO:目前开源不是最佳路径,不会很快有 GPT-5
  • 国宝级文物“铜兽驮跪坐人顶尊铜像”完成模拟拼接,腾讯 AI 立功
  • 微软推出 LLaVA-Med AI 模型,可对医学病理案例进行分析
  • 普林斯顿大学推出 Infinigen AI 模型,可生成真实自然环境 3D 场景
  • 快手旗下视频剪辑类产品“快影”内测多款 AIGC 创作功能,可一键生成文案等
  • 英特尔研究院发布全新 AI 扩散模型,可根据文本提示生成 360 度全景图
  • AI 模型 Stable Diffusion 升级:正常生成五指、图像更逼真
  • Meta 和 OpenAI 公司 CEO 公开支持欧盟推行 AI 监管方案
  • 科大讯飞星火 AI 大模型出海东南亚,将在新加坡实施“1+4”战略
  • 中国联通发布鸿湖图文 AI 大模型 1.0,可实现以文生图、视频剪辑
  • 人工智能深度调查:用过 AI 工具的人并没想象的那么多
  • 金融巨头瑞穗银行押注生成式 AI,开放 Azure OpenAI 给 4.5 万名员工使用
  • 英伟达联手 Snowflake:卖出更多芯片,帮助企业客户建立自己的 AI 模型
  • 微软推出 ZeRO++ 技术,可显著减少 AI 大模型训练时间和成本
  • 警用 AI 助手到来,美亚柏科发布国内首个公共安全大模型“天擎”
  • 微软英伟达参投,OpenAI 竞争对手 Inflection AI 获 13 亿美元融资
  • 最新资讯

    热门资讯