消息称 DeepSeek-R2 AI 模型开发进程因美国当局英伟达 H20 芯片出口限制而延迟

消息称 DeepSeek-R2 AI 模型开发进程因美国当局英伟达 H20 芯片出口限制而延迟

人工智能 2025-06-28 18:03:05 5小时前

IT酷哥 6 月 27 日消息,据外媒 The Information 报道,由于美国当局策略致英伟达H20 芯片在中国内地供应短缺,继而导致DeepSeek-R2 AI模型开发工作延迟。

IT酷哥注意到,DeepSeek使用了5万块 Hopper GPU训练 R1 模型,其中包括 3 万块 H20、1 万块 H800 和 1 万块 H100。

外媒援引两位知情人士透露,DeepSeek 团队近几个月一直在密集推进 R2 模型开发,但 CEO 梁文锋目前对模型的能力仍不满意,内部仍在继续提升性能,相应模型尚未准备好正式投用。

此外,相应报道同时指出,多数用户都是在英伟达的 H20 芯片上部署 / 运行现有DeepSeek-R1 模型,随着 H20 芯片遭美国当局限制出口,除了令DeepSeek R2 的研发更加困难外,也对现有DeepSeek-R1实际部署造成一定影响。

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 日本 NEC 社长:正独立开发生成式 AI,这是非常大的商机
  • 长城汽车申请 SPACEGPT 等商标,有望成为首批在车机终端引入 AI 智能助理的吃螃蟹者
  • AI 朗读冲击有声读物市场,配音演员工作面临威胁
  • DeepMind 联合创始人提出新的图灵测试:让 AI 将 10 万美元变成 100 万美元
  • 京东 AI 大模型官宣 7 月 13 日发布:新上任 CEO 许冉演讲,还有重磅合作
  • 丰田推出生成式 AI 工具:输入文字指令可自动设计汽车外形,并符合工程学需求
  • 全球首个 AI 广播频道公司完成 1900 万美元融资,开发无障碍及游戏 NPC 技术
  • Dropbox 网盘推出 AI 搜索工具 Dropbox Dash:聚合多办公平台,可视化管理工作任务
  • 开源模型 PrivateGPT 上线,可本地搭建、避免信息外泄
  • Unity 推出面向开发者的 AI 软件市场 AI Hub,股价飙涨 15%
  • 谷歌 DeepMind 自曝正开发新型 AI 模型 Gemini,号称“比 GPT-4 强”
  • 金融巨头瑞穗银行押注生成式 AI,开放 Azure OpenAI 给 4.5 万名员工使用
  • 警用 AI 助手到来,美亚柏科发布国内首个公共安全大模型“天擎”
  • 微软推出生成式 AI 培训项目,免费提供在线课程和证书
  • 成功率 99%,科学家研发语音 deepfake 软件:只需 5 分钟录音即可欺骗语音认证系统
  • 日媒关注中国推进鸟类识别 AI 普及,除监测保护外还可预防传染性疾病
  • 内置 AI 助手 Copilot 上线:微软 Win11 Dev 预览版 Build 23493 发布,设置、音量大改
  • 刚合作就解约,Unity 剔除一家销售盗用资源的 AI 合作伙伴
  • 中国团队推出世界首颗 AI 全自动设计 CPU“启蒙 1 号”:无人工干预,性能堪比 486
  • 方舟启航,火山引擎这波在“大气层”
  • 最新资讯

    热门资讯