多项力压 Grok 4、OpenAI o3,谷歌推出 Gemini 2.5 Deep Think 模型

多项力压 Grok 4、OpenAI o3,谷歌推出 Gemini 2.5 Deep Think 模型

人工智能 2025-08-04 10:12:05 2天前

IT酷哥 8 月 1 日消息,谷歌今晚宣布,Gemini 2.5 Deep Think 模型现已正式上线,现已在 Gemini 应用中向 Google AI Ultra 订阅用户开放。这款新模型在多个关键基准测试中超越了 OpenAI 的 o3 和 xAI 的 Grok 4。

据外媒 Neowin 报道,今年 5 月,谷歌在 Google I/O 大会上首次介绍了 Gemini 2.5 Pro 的 Deep Think 模式,采用全新研究方法,可在作答前综合多个假设进行推理。本次发布的是该功能的升级版,结合早期内测用户的反馈和最新研究成果进行了优化。谷歌表示,新版本在性能上相比最初的 I/O 版本有了显著提升。

谷歌还透露,这一模型是此前模型的一个变体(IT酷哥注:前述模型已在国际数学奥林匹克竞赛中获得金牌)。为适应日常使用场景,谷歌对其进行了加速优化,因此在 2025 年 IMO 基准测试中仅达到铜牌水平。

从基准测试结果可知,Gemini 2.5 Deep Think 在 LiveCodeBench V6、Humanity’s Last Exam、IMO 2025 和 AIME 2025 等项目中均表现优异。

目前,Google AI Ultra 用户每天可以在 Gemini 应用中以限定次数使用 Deep Think。当启用 Gemini 2.5 Pro 模型时,输入栏会显示“Deep Think”选项。谷歌指出,该功能将自动集成代码执行和谷歌搜索等工具。谷歌还计划在未来几周内,通过 Gemini API 向部分开发者提供带工具与不带工具的 Deep Think 模型版本。

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 支持普通话,桌面端 Bing Chat 新增语音聊天方式
  • 一个月来至少三起,台积电频频投资硅谷 AI 芯片创企
  • 腾讯自主研发机器狗 Max 升级,可模仿真狗“奔跑跳跃”完成避障动作
  • Snap 研发出新技术 SnapFusion,未来智能手机秒出 AI 生成图像
  • 科学家利用 AI 识别热门歌曲,准确率高达 97%
  • DeepMind 联合创始人提出新的图灵测试:让 AI 将 10 万美元变成 100 万美元
  • 宏碁、惠普、华硕等品牌发力 AI 笔记本市场,明年将带动新一波换机潮
  • MetaGPT AI 模型开源:可模拟软件公司开发过程,生成高质量代码
  • 研究发现 AI 筛选的私募基金回报率高于大部分机构投资者
  • 中国团队推出脑电图图像生成模型 DreamDiffusion,清华、腾讯参与研究
  • 匈牙利公司推出世界首款 AI 研发饮料,口味、包装均由 AI 完成
  • 亚马逊 Kindle 自助出版功能被滥用,AI 生成的书籍泛滥
  • 联合国将招募数十个机器人,协助完成 2030 可持续发展目标
  • 丁磊:当前网易的首要任务是用最快的速度探索 AI 大模型的创新应用
  • 格莱美 CEO 解释 AI 新规:愿意接纳新技术,包含 AI 要素作品也可获提名
  • 热度过去用户兴趣降低:数据显示 ChatGPT 流量在 6 月首次出现下降
  • 奔驰正在车辆生产中测试 ChatGPT,进行质量管理和流程优化等活动
  • OpenAI 组建新团队,以解决控制超智能 AI 的核心技术挑战
  • 下一代“世界最快”超级计算机 El Capitan 开始安装 AMD Instinct MI300 人工智能 GPU
  • 科大讯飞:讯飞医疗基于星火大模型升级医疗诊后康复管理平台,出院患者满意度 98% 以上
  • 最新资讯

    热门资讯