华为云:CloudMatrix384 突破大模型训推瓶颈,加速行业智能化跃迁

华为云:CloudMatrix384 突破大模型训推瓶颈,加速行业智能化跃迁

IT资讯 2025-06-24 19:14:05 2天前

6 月 21 日,华为开发者大会 2025 期间,以“CloudMatrix384 昇腾 AI 云服务,算力聚变加速行业 AI 创新”为主题的高峰论坛顺利举办,四位来自不同领域的 AI 先行者,与近 200 位开发者深度对话,从技术内核到场景落地,全面解析基于 CloudMatrix384 超节点的新一代昇腾 AI 云服务如何破解 AI 算力、运力、存力瓶颈,成为行业智能化跃迁的核心引擎。

高密、高速、高效,重建大模型时代的 AI 基础设施新标准

当前,AI 大模型正以指数级速度进化,模型参数突破千亿、万亿级,传统算力架构的“算力墙”“通信墙”“存储墙”已成为制约行业创新的核心痛点。华为云公有云解决方案部 CTO 刘赫伟在峰会上指出:“大模型的爆发式发展,本质是对算力、运力、存力的全维度挑战。基于 CloudMatrix384 超节点的昇腾 AI 云服务,已成为突破算力、运力、存力瓶颈的 AI 基础设施新标准。”

CloudMatrix384 昇腾 AI 云服务,通过“硬件重构 + 软件智能”的深度融合,打造出高密、高速、高效的 AI-Native 基础设施:

・高密:超节点级联,构建“超级 AI 服务器”

CloudMatrix384 昇腾 AI 云服务创新性地将 384 颗昇腾 NPU 与 192 颗鲲鹏 CPU 通过 MatrixLink 高速网络全对等互联,形成单节点“超级 AI 服务器”,更是支持 432 个超节点级联,构建最高 16 万卡的超大集群,彻底打破传统架构的规模限制,为大模型训练提供“无限算力池”。

・高速:纳秒级通信,让算力“无损协同”

其核心网络架构 MatrixLink 通过亲和性调度、协议重构等技术突破,实现三大性能飞跃:卡间带宽高达 2.8Tb/s,节点内通信时延降至纳秒级,节点间网络时延仅微秒级。配合 PB 级虚拟显存、跨节点 / 集群 DRAM 池等创新设计,KV Cache 传输带宽提升 10 倍,输出每个 Token 的时延降至 50ms, 平均单卡吞吐量跃升到 2300 Tokens / s。

・高效:智能调度,释放算力“最大效能”

基于底层强大的算力、网络、存力,结合上层专家任务智能调度能力,CloudMatrix384 昇腾 AI 云服务基于“一卡一专家、一卡一算子任务”的灵活分配、并行推理,将算力有效使用率(MFU)提升 50% 以上,同时结合昇腾云脑,实现全栈故障感知、诊断与快速自动恢复,彻底解决传统集群的训推难题。

华为半导体业务部战略与业务发展总监夏砚秋表示:“CloudMatrix384 昇腾 AI 云服务把算力、网络、存储等硬优势与 P / D 分离、专家调度、算子优化等软实力深度协同,让千亿参数 MOE 模型的训推性能再上一个台阶。”以 DeepSeek V3 / R1 为例,在较低时延下可实现 2000 TPS 以上的吞吐量,综合性能全面领先。

行业实践:从大模型到终端智能,多场景验证“算力聚变”价值

CloudMatrix384 昇腾 AI 云服务的技术优势,已在各行业得到初步验证,此次大会上,不同领域的先行者分别展示了他们的案例成果。

硅基流动作为国内领先的大模型 MaaS 服务商,与华为云的合作由来已久,其政企商业化负责人吴凡在会上介绍,硅基流动早在 5 月就率先在 CloudMatrix384 昇腾 AI 云服务上部署 DeepSeek-R1,基于大规模专家并行方案,通过多专家负载均衡和极致通信优化,实现更高吞吐,用户 20TPS 前提下,单卡 Decode 吞吐突破 1920 Tokens / s,比肩业界主流 GPU 的部署性能,硅基流动将继续基于 CloudMatrix384 昇腾 AI 云服务持续创新,与行业客户合作共同解决 AI 落地的各种重大难题。

小艺作为华为终端智能的核心入口,对推理平台的精度、时延、吞吐要求极高。华为计算产品线芯片应用专家卓恒在方案讲述时介绍:“CloudMatrix384 超节点凭借其超大算力、带宽、专家并行部署规模,实现了极致的推理吞吐与时延,让小艺的交互体验得到全面提升”同时,将 CloudMatrix384 超节点与其它技术框架相结合,如与元戎 Serverless 框架结合,提升长序列推理场景能力,降低了 TTFT、提升 Prefill / Decode 吞吐,与 Mindspore 结合,实现了 EP 通信极致覆盖、解决了 EP 专家负载不均的难题、降低了重计算损失,进一步提升了小艺的训练和推理效能。

此外,新浪基于 CloudMatrix384 昇腾 AI 云服务,让“智慧小浪”推理交付效率提升 50%+,上线速度成倍加快;中科院基于 CloudMatrix384 昇腾 AI 云服务,自研模型训练框架,快速构建 AI4S 科研大模型;面壁智能基于 CloudMatrix384 昇腾 AI 云服务,实现小钢炮模型的推理业务性能大幅提升;科大讯飞基于 CloudMatrix384 昇腾 Al 云服务,助力讯飞星火大模型极致推理性能;360 打造的“超级搜索”纳米 A 搜索,对 AI 算力有极大需求,也已开启了 CloudMatrix384 超节点的测试。

刘赫伟在会上总结到:“CloudMatrix384 昇腾 AI 云服务将深度融入电商、社交、文娱、金融、汽车等行业的典型智能化场景,降低 AI 创新门槛,扩大 AI 创新成效,让更多企业与开发者享受技术的红利,加速全行业智能化跃迁。”

此次高峰论坛,不仅是一次技术成果的集中展示,更搭建了“技术-场景-生态”的深度交流平台,CloudMatrix384 昇腾 AI 云服务在各行的逐步落地,也标志着 AI 基础设施正式进入“超节点时代”,而华为云正以开放姿态,携手客户、伙伴,共同书写行业智能化的新篇章。

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 惠普 PC 将率先搭载 AOW 生态融合应用,携手英特尔、腾讯为中国用户打造跨端体验
  • 联想宋涛: 用全栈全周期方案服务能力满足制造业新需求
  • 提升基础与应用能力,中兴 5G 聚焦超清视界
  • 拼多多 618 开门红活动来袭:苹果 iPhone 14 系列最高直降 2340 元
  • 本地化运营及产品力驱动全球业务发展 净盈利同比增长 138.7% 至 4990 万美元
  • 比预售低 4000-6000 元!比亚迪 10 万内唯一 SUV,2023 款元 Pro 上市
  • “交管 12123”App 明日上线轻微交通事故视频快处功能,覆盖 36 个城市
  • IDC 预计今年全球智能手机出货量下降 3.2%,明年将反弹
  • 《燕云十六声》6 月 9 日就测试了!你预约了么?巧了,你也没有测试资格啊!
  • 任天堂 Switch 全新配色 Joy-Con 手柄发布:6 月 30 日上市,8228 日元
  • realme 个性贴膜服务上线:多种前膜背膜可选,售价 8.9 元起
  • 台积电美国工厂快速扩张背后,当地员工和企业文化矛盾愈发尖锐
  • 618 今日攻略:16GB 笔记本内存 109 元探底,1T 版 realme 手机 2179 元新低
  • 学生认证专属优惠:魅族 20 部分机型降价 200 元
  • 三星电视成为 2023 U 设计周战略合作伙伴,打造沉浸式先锋艺术展示空间
  • “安徽码”上线,支持就医购药、酒店住宿、图书借阅等场景
  • 华为:不会有“盘古 Chat”此类命名,也不“对标”业界产品
  • 618 重磅来袭,乐橙 TA3R 摄像头开启“省钱”攻势
  • 茅台微信小程序现咖啡产品:起价 28 元,最贵 42 元,可加料飞天酒
  • 业内首推“找供应商”能力,爱企查助力企业高效寻源、一站式采购
  • 最新资讯

    热门资讯