最新一期权威大模型榜单：豆包 1.5、商汤日日新 V6 并列国内第一

最新一期权威大模型榜单：豆包 1.5、商汤日日新 V6 并列国内第一

IT资讯 2025-05-30 21:11:07 2天前

5 月 28 日, 权威大模型测评机构 SuperCLUE《中文大模型基准测评 2025 年 5 月报告》全新出炉!

豆包 1.5・深度思考模型 (Doubao-1.5-thinking-pro) 和商汤日日新 V6 多模态模型 (SenseNova-V6 Reasoner) 共同摘得金牌, 超越 Gemini 2.5 Flash Preview, 在国内大模型第一梯队领跑。

位居第二梯队的大模型包括 DeepSeek-R1、NebulaCoder-V6、Hunyuan-T1 以及 DeepSeek-V3。

来自 SuperCLUE

报告指出, 国内外第一梯队大模型在中文领域的通用能力差距正在缩小。在国产大模型中,Doubao-1.5-thinking-pro-250415、SenseNova V6 Reasoner 表现最为亮眼。国内推理模型竞争格局初露端倪。

SuperCLUE 是行业权威的通用大模型的综合性测评基准。本次 2025 年 5 月报告聚焦通用能力测评, 涵盖数学推理、科学推理、代码生成、智能体 Agent、精确指令遵循、文本理解与创作六大任务, 总量为 1579 道多轮简答题。

模型梯队基准中文商汤声明

相关阅读

“新应用，新数据，新韧性”，华为提出面向 YB 数据时代的存储产业演进方向

金山云 Q1 毛利率创新高深耕行业差异化优势把握行业向上行情

京东方艺云亮相 VC 2023 医工融合创新引领健康显示新未来

消息称 ARM 为上市大砍研发投入：关闭尖端研发设施，更重投资回报

中国工程院院士：我国半导体产业还相对比较落后，稍不小心就会拉大差距

《夺宝奇兵 5》定档 6 月 30 日中国内地上映，同步北美

Meta 发布 Megabyte AI 模型抗衡 Transformer：解决后者已知问题、速度提升 4 成

业界首款满血商用笔记本，ThinkBook 16p 2023 起售价 8499 元

\"格力电器为你降温，夏日好物推荐\"

英伟达市值飙升破万亿，华尔街纷纷调高其股票目标价

因芯片短缺，日本实体 Suica 西瓜卡及 PASMO 交通卡将于 6 月 8 日停止售卖

EA 与耐克达成合作，在未来的体育游戏中添加 NFT 数字藏品

中国联通：云南联通收回云南全省委托承包运营权

“中国版 Adobe”万兴科技首设“AI 国货节” 王牌产品限时福利赋能创作者

分析称苹果 Vision Pro 头显将为索尼和其他亚洲 VR / AR 供应商带来新机遇

助推学习手机趋势品类发展小度与京东签署战略合作协议

瑞昱再度回应同联发科的专利纠纷，称所获赔偿将捐作公益

全球震撼！天玑 9300 全大核引爆热度，联发科市占率再夺第一！

苹果、Epic 双双要求美法庭重新考虑反垄断裁决

2023 三星电视技术品鉴会畅临京夏，核“芯”实力塑造极致视听