消息称 DeepSeek-R2 AI 模型开发进程因美国当局英伟达 H20 芯片出口限制而延迟
IT酷哥 6 月 27 日消息,据外媒 The Information 报道,由于美国当局策略致英伟达H20 芯片在中国内地供应短缺,继而导致DeepSeek-R2 AI模型开发工作延迟。
IT酷哥注意到,DeepSeek使用了5万块 Hopper GPU训练 R1 模型,其中包括 3 万块 H20、1 万块 H800 和 1 万块 H100。
外媒援引两位知情人士透露,DeepSeek 团队近几个月一直在密集推进 R2 模型开发,但 CEO 梁文锋目前对模型的能力仍不满意,内部仍在继续提升性能,相应模型尚未准备好正式投用。
此外,相应报道同时指出,多数用户都是在英伟达的 H20 芯片上部署 / 运行现有DeepSeek-R1 模型,随着 H20 芯片遭美国当局限制出口,除了令DeepSeek R2 的研发更加困难外,也对现有DeepSeek-R1实际部署造成一定影响。