最新一期权威大模型榜单:豆包 1.5、商汤日日新 V6 并列国内第一

最新一期权威大模型榜单:豆包 1.5、商汤日日新 V6 并列国内第一

IT资讯 2025-05-30 21:11:07 2天前

5 月 28 日, 权威大模型测评机构 SuperCLUE《中文大模型基准测评 2025 年 5 月报告》全新出炉!

豆包 1.5・深度思考模型 (Doubao-1.5-thinking-pro) 和商汤日日新 V6 多模态模型 (SenseNova-V6 Reasoner) 共同摘得金牌, 超越 Gemini 2.5 Flash Preview, 在国内大模型第一梯队领跑。

位居第二梯队的大模型包括 DeepSeek-R1、NebulaCoder-V6、Hunyuan-T1 以及 DeepSeek-V3。

来自 SuperCLUE

报告指出, 国内外第一梯队大模型在中文领域的通用能力差距正在缩小。在国产大模型中,Doubao-1.5-thinking-pro-250415、SenseNova V6 Reasoner 表现最为亮眼。国内推理模型竞争格局初露端倪。

SuperCLUE 是行业权威的通用大模型的综合性测评基准。本次 2025 年 5 月报告聚焦通用能力测评, 涵盖数学推理、科学推理、代码生成、智能体 Agent、精确指令遵循、文本理解与创作六大任务, 总量为 1579 道多轮简答题。

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • “新应用,新数据,新韧性”,华为提出面向 YB 数据时代的存储产业演进方向
  • 金山云 Q1 毛利率创新高 深耕行业差异化优势把握行业向上行情
  • 京东方艺云亮相 VC 2023 医工融合创新引领健康显示新未来
  • 消息称 ARM 为上市大砍研发投入:关闭尖端研发设施,更重投资回报
  • 中国工程院院士:我国半导体产业还相对比较落后,稍不小心就会拉大差距
  • 《夺宝奇兵 5》定档 6 月 30 日中国内地上映,同步北美
  • Meta 发布 Megabyte AI 模型抗衡 Transformer:解决后者已知问题、速度提升 4 成
  • 业界首款满血商用笔记本,ThinkBook 16p 2023 起售价 8499 元
  • \"格力电器为你降温,夏日好物推荐\"
  • 英伟达市值飙升破万亿,华尔街纷纷调高其股票目标价
  • 因芯片短缺,日本实体 Suica 西瓜卡及 PASMO 交通卡将于 6 月 8 日停止售卖
  • EA 与耐克达成合作,在未来的体育游戏中添加 NFT 数字藏品
  • 中国联通:云南联通收回云南全省委托承包运营权
  • “中国版 Adobe”万兴科技首设“AI 国货节” 王牌产品限时福利赋能创作者
  • 分析称苹果 Vision Pro 头显将为索尼和其他亚洲 VR / AR 供应商带来新机遇
  • 助推学习手机趋势品类发展 小度与京东签署战略合作协议
  • 瑞昱再度回应同联发科的专利纠纷,称所获赔偿将捐作公益
  • 全球震撼!天玑 9300 全大核引爆热度,联发科市占率再夺第一!
  • 苹果、Epic 双双要求美法庭重新考虑反垄断裁决
  • 2023 三星电视技术品鉴会畅临京夏,核“芯”实力塑造极致视听
  • 最新资讯

    热门资讯