多项力压 Grok 4、OpenAI o3，谷歌推出 Gemini 2.5 Deep Think 模型

多项力压 Grok 4、OpenAI o3，谷歌推出 Gemini 2.5 Deep Think 模型

人工智能 2025-08-04 10:12:05 2天前

IT酷哥 8 月 1 日消息，谷歌今晚宣布，Gemini 2.5 Deep Think 模型现已正式上线，现已在 Gemini 应用中向 Google AI Ultra 订阅用户开放。这款新模型在多个关键基准测试中超越了 OpenAI 的 o3 和 xAI 的 Grok 4。

据外媒 Neowin 报道，今年 5 月，谷歌在 Google I/O 大会上首次介绍了 Gemini 2.5 Pro 的 Deep Think 模式，采用全新研究方法，可在作答前综合多个假设进行推理。本次发布的是该功能的升级版，结合早期内测用户的反馈和最新研究成果进行了优化。谷歌表示，新版本在性能上相比最初的 I/O 版本有了显著提升。

谷歌还透露，这一模型是此前模型的一个变体（IT酷哥注：前述模型已在国际数学奥林匹克竞赛中获得金牌）。为适应日常使用场景，谷歌对其进行了加速优化，因此在 2025 年 IMO 基准测试中仅达到铜牌水平。

从基准测试结果可知，Gemini 2.5 Deep Think 在 LiveCodeBench V6、Humanity’s Last Exam、IMO 2025 和 AIME 2025 等项目中均表现优异。

目前，Google AI Ultra 用户每天可以在 Gemini 应用中以限定次数使用 Deep Think。当启用 Gemini 2.5 Pro 模型时，输入栏会显示“Deep Think”选项。谷歌指出，该功能将自动集成代码执行和谷歌搜索等工具。谷歌还计划在未来几周内，通过 Gemini API 向部分开发者提供带工具与不带工具的 Deep Think 模型版本。

模型基准多个工具用户

相关阅读

支持普通话，桌面端 Bing Chat 新增语音聊天方式

一个月来至少三起，台积电频频投资硅谷 AI 芯片创企

腾讯自主研发机器狗 Max 升级，可模仿真狗“奔跑跳跃”完成避障动作

Snap 研发出新技术 SnapFusion，未来智能手机秒出 AI 生成图像

科学家利用 AI 识别热门歌曲，准确率高达 97%

DeepMind 联合创始人提出新的图灵测试：让 AI 将 10 万美元变成 100 万美元

宏碁、惠普、华硕等品牌发力 AI 笔记本市场，明年将带动新一波换机潮

MetaGPT AI 模型开源：可模拟软件公司开发过程，生成高质量代码

研究发现 AI 筛选的私募基金回报率高于大部分机构投资者

中国团队推出脑电图图像生成模型 DreamDiffusion，清华、腾讯参与研究

匈牙利公司推出世界首款 AI 研发饮料，口味、包装均由 AI 完成

亚马逊 Kindle 自助出版功能被滥用，AI 生成的书籍泛滥

联合国将招募数十个机器人，协助完成 2030 可持续发展目标

丁磊：当前网易的首要任务是用最快的速度探索 AI 大模型的创新应用

格莱美 CEO 解释 AI 新规：愿意接纳新技术，包含 AI 要素作品也可获提名

热度过去用户兴趣降低：数据显示 ChatGPT 流量在 6 月首次出现下降

奔驰正在车辆生产中测试 ChatGPT，进行质量管理和流程优化等活动

OpenAI 组建新团队，以解决控制超智能 AI 的核心技术挑战

下一代“世界最快”超级计算机 El Capitan 开始安装 AMD Instinct MI300 人工智能 GPU

科大讯飞：讯飞医疗基于星火大模型升级医疗诊后康复管理平台，出院患者满意度 98% 以上