DeepSeek-Prover-V2-671B 新模型开源发布

DeepSeek-Prover-V2-671B 新模型开源发布

人工智能 2025-05-02 07:10:01 16小时前

IT酷哥 4 月 30 日消息,DeepSeek 今日在 AI 开源社区 Hugging Face 发布了一个名为 DeepSeek-Prover-V2-671B 的新模型。

DeepSeek-Prover-V2-671B 使用了更高效的 safetensors 文件格式,并支持 BF16、FP8、F32 等多种计算精度,方便模型更快、更省资源地训练和部署。

从命名上看,这款参数高达 6710 亿的模型可能是去年发布的数学 AI 模型 Prover-V1.5 的升级版。

截至IT酷哥发文,DeepSeek 官方暂未公布这个模型的性能介绍,开源地址如下:

https://huggingface.co/deepseek-ai/DeepSeek-Prover-V2-671B/tree/main

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 打不过就加入:首家承认 ChatGPT 影响收入的公司 Chegg 选择拥抱 AI ,裁减 4% 员工
  • (更新)消息称谷歌将与联发科合作打造 AI 服务器芯片,后者回应“错误报道”
  • 快手旗下视频剪辑类产品“快影”内测多款 AIGC 创作功能,可一键生成文案等
  • AI 公司 Databricks 推出人工智能模型共享机制,可令开发者与公司实现“双赢”
  • Dropbox 网盘推出 AI 搜索工具 Dropbox Dash:聚合多办公平台,可视化管理工作任务
  • 复旦大学与阿里巴巴达成全面战略合作,共享 AI 大模型底层能力
  • Unity 推出面向开发者的 AI 软件市场 AI Hub,股价飙涨 15%
  • 为防止泄密,美国国会明确要求职员仅可使用付费版 ChatGPT
  • 微软推出 ZeRO++ 技术,可显著减少 AI 大模型训练时间和成本
  • 近 12 年由 AI 造成的事故暴涨 15 倍,Facebook、特斯拉、OpenAI 位居总量前三
  • “商汤如影 SenseAvatar” 数字人视频生成平台上线,支持定制形象、声音克隆、创作视频等功能
  • 腾讯与西湖大学共同申请 AI 聊天机器人专利,可使问答语句更准确连贯
  • Pixela 推出 ChatGPT 翻译 App:支持中日英韩互译,限时免费上架 Google Play
  • “世界上最像人的机器人”Ameca 接入 Stable Diffusion 和 GPT-3,现场完成作画
  • ChatGPT 的 Bing 浏览功能让用户免费阅读付费内容,OpenAI 暂停测试
  • 配 2.2 万片英伟达 H100 GPU,Inflection AI 正开发超级计算机
  • 匈牙利公司推出世界首款 AI 研发饮料,口味、包装均由 AI 完成
  • 亚马逊 Kindle 自助出版功能被滥用,AI 生成的书籍泛滥
  • 华为宣布联合 26 家企业启动昇腾 AI 大模型联合创新,已建成业界首个万卡 AI 集群
  • 科大讯飞:讯飞医疗基于星火大模型升级医疗诊后康复管理平台,出院患者满意度 98% 以上
  • 最新资讯

    热门资讯