阶跃星辰发布新一代基础大模型 Step 3,华为昇腾芯片已首先实现搭载

阶跃星辰发布新一代基础大模型 Step 3,华为昇腾芯片已首先实现搭载

人工智能 2025-07-26 18:09:05 7天前

IT酷哥 7 月 26 日消息,在 2025 世界人工智能大会(简称“WAIC 2025”)开幕前夕,阶跃星辰昨天在上海正式发布了新一代基础大模型 ——Step 3,将于 7 月 31 日面向全球企业和开发者开源。

据官方介绍,Step 3 是阶跃星辰首个全尺寸、原生多模态推理模型,兼顾模型效果与推理成本,是在模型架构创新、算法工程协同设计上的一次大胆尝试与 Scale Up。Step 3 采用 MoE 架构,总参数量 321B,激活参数量 38B。

Step 3 拥有强大的视觉感知和复杂推理能力,可准确完成跨领域的复杂知识理解、数学与视觉信息的交叉分析,以及日常生活中的各类视觉分析问题。

Step 3 在 MMMU、MathVision、SimpleVQA、AIME 2025、LiveCodeBench (2024.08-2025.05) 等榜单上取得了开源多模态推理模型的 SOTA 成绩。

官方称,目前,主流开源模型虽然针对解码进行了大量优化,但其优化方案主要适配国际高端芯片,在中端及国产芯片上的解码效率仍有提升空间。在架构设计阶段,Step 3 便充分考量系统与硬件的特性,实现广泛硬件平台上的高效推理。凭借系统和架构创新,Step 3 实现了行业领先的推理解码效率。

根据原理分析,Step 3 在国产芯片上的推理效率最高可达 DeepSeek-R1 的 300%,且对所有芯片友好。在基于 NVIDIA Hopper 架构的芯片进行分布式推理时,实测 Step 3 相较于 DeepSeek-R1 的吞吐量提升超 70%。这些都是在不牺牲激活参数量、不降低注意力容量的条件下实现的。

阶跃星辰宣布联合近 10 家芯片及基础设施厂商,共同发起“模芯生态创新联盟”,首批成员包括华为昇腾、沐曦、壁仞科技、燧原科技、天数智芯、无问芯穹、寒武纪、摩尔线程、硅基流动等。目前,华为昇腾芯片已首先实现 Step 3 的搭载和运行。沐曦、天数智芯和燧原等也已初步实现运行 Step 3。其它联盟厂商的适配工作正在开展。

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 视觉中国推出 AI 灵感绘图功能,付费后可在“合法合规前提下使用”
  • 马斯克发推讽刺人工智能:机器学习的本质就是统计
  • 套娃不可取:研究人员证实用 AI 生成的结果训练 AI 将导致模型退化乃至崩溃
  • Snap 研发出新技术 SnapFusion,未来智能手机秒出 AI 生成图像
  • 腾讯首次披露行业大模型进展:不追求参数高,希望成本预算可控
  • 英特尔研究院发布全新 AI 扩散模型,可根据文本提示生成 360 度全景图
  • 全球首个 AI 广播频道公司完成 1900 万美元融资,开发无障碍及游戏 NPC 技术
  • 英伟达赚翻了,甲骨文今年将斥资数十亿美元买 GPU 发力 AI 云服务
  • 微软用 AI 缩短癌症放疗时间:扫描速度提高 2.5 倍,准确率达 90%
  • 英科智能推出 AI 设计的罕见病特效药,已在中美同时启动人体临床试验
  • 微软推出生成式 AI 培训项目,免费提供在线课程和证书
  • 日媒关注中国推进鸟类识别 AI 普及,除监测保护外还可预防传染性疾病
  • 微软英伟达参投,OpenAI 竞争对手 Inflection AI 获 13 亿美元融资
  • 北京出台机器人产业新政,支持 AI 大模型与机器人融合发展
  • 配 2.2 万片英伟达 H100 GPU,Inflection AI 正开发超级计算机
  • 格莱美 CEO 解释 AI 新规:愿意接纳新技术,包含 AI 要素作品也可获提名
  • 陈天桥再投 10 亿元支持 AI 脑科学,筹建睡眠梦境、抗衰老等前沿实验室
  • OpenAI 组建新团队,以解决控制超智能 AI 的核心技术挑战
  • 精准度可提高 20%:英国九家银行签约使用基于 AI 的“消费者欺诈风险系统”应对诈骗
  • 下一代“世界最快”超级计算机 El Capitan 开始安装 AMD Instinct MI300 人工智能 GPU
  • 最新资讯

    热门资讯