国际象棋最强 AI 鸣锣开赛:首日战果公布,OpenAI 的 o3、xAI 的 Grok4 等晋级

国际象棋最强 AI 鸣锣开赛:首日战果公布,OpenAI 的 o3、xAI 的 Grok4 等晋级

人工智能 2025-08-07 10:06:07 3天前

IT酷哥 8 月 6 日消息,科技媒体 webpronews 昨日(8 月 5 日)发布博文,报道称谷歌 DeepMind 于 8 月 5~7 日在 Kaggle 的 Game Arena 平台上,举办“AI 国际象棋”比赛,邀请 OpenAI、Anthropic、谷歌、Kimi、Deepseek 在内的顶尖模型一较高下。

DeepMind 表示,本次“AI 国际象棋”比赛的目的,是检验顶级 AI 模型的推理能力。本次活动将于 8 月 5~7 日举行,每日举办一轮比赛,由国际象棋大师 Hikaru Nakamura 和流媒体播主 Levy Rozman 解说。

在 AI 发展的重要时刻,这场象棋对决提供了一个严格的测试,以评估 AI 的预见和策略调整能力,文本基础的格式解决了许多大型语言模型在视觉象棋盘表示上的难题,提供了一个更公平的推理能力测试。

IT酷哥附上本次参赛选手如下:

Gemini 2.5 Pro(Google)

Gemini 2.5 Flash(Google)

o3(OpenAI)

o4-mini(OpenAI)

Claude 4 Opus(Anthropic)

Grok 4(xAI)

DeepSeek R1

Kimi k2(Moonshot AI)

根据首日战况,OpenAI 的 o4 mini 胜过 Deepseek-R1、OpenAI 的 o3 超过 Kimi K2 Instruct 模型、谷歌的 Gemini 2.5 Pro 胜过 Claude Opus 4、xAI 的 Grok4 模型超过谷歌的 Gemini 2.5 Flash。

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • Line 推出付费 AI 自拍功能,可定制你的风格
  • 万达集团:全国首个旅游景区 AI 导游“小丹”亮相,基于大语言模型开发
  • GitHub 报告称 92% 的美国程序员正在使用 AI 工具
  • 日本起草针对学校的生成式 AI 使用指南,禁止学生用 ChatGPT 写作文
  • 外媒提议更新开源许可证:摆脱 80 年代束缚,应对当下人工智能时代
  • 英科智能推出 AI 设计的罕见病特效药,已在中美同时启动人体临床试验
  • 为防止泄密,美国国会明确要求职员仅可使用付费版 ChatGPT
  • 美国银行分析师:聊天机器人中 ChatGPT 占据最大优势,过半用户会为其付费服务买单
  • 近 12 年由 AI 造成的事故暴涨 15 倍,Facebook、特斯拉、OpenAI 位居总量前三
  • 内置 AI 助手 Copilot 上线:微软 Win11 Dev 预览版 Build 23493 发布,设置、音量大改
  • 北京出台机器人产业新政,支持 AI 大模型与机器人融合发展
  • Pixela 推出 ChatGPT 翻译 App:支持中日英韩互译,限时免费上架 Google Play
  • 研究表明 GPT-4 模型具备自我纠错能力,有望推动 AI 代码进一步商业化
  • 中国工程院院士高文:将打造 2000 亿参数自然语言大模型底座,性能对标 ChatGPT
  • 上半年全球风险投资额缩水近半,超 400 亿美元流向 AI 初创公司
  • Mozilla 的 AI Help 工具终遭官方停用:生成的技术信息真假参半
  • 牛津剑桥解除 ChatGPT 禁令,英国 24 所顶尖高校发布详细使用原则
  • 上海仁济医院升级“数智人客服”3.0,AI 护士“小威”月底上线
  • Databricks 发布大数据分析平台 Spark 用 AI 模型 SDK:一键生成 SQL 及 FySpark 语言图表代码
  • 调查显示 AI 工具每年可帮助企业员工节省近 400 个小时
  • 最新资讯

    热门资讯