阿里通义千问推出全新推理模型 Qwen3-30B-A3B-Thinking-2507,多项能力显著提升

阿里通义千问推出全新推理模型 Qwen3-30B-A3B-Thinking-2507,多项能力显著提升

人工智能 2025-08-01 16:04:03 20小时前

IT酷哥 7 月 31 日消息,阿里通义千问今日宣布推出全新推理模型 Qwen3-30B-A3B-Thinking-2507。相较于 4 月 29 日开源的 Qwen3-30-A3B 模型,新模型在推理能力、通用能力及上下文长度上有了显著提升:

新模型在聚焦数学能力的 AIME25 评测中斩获 85.0 的高分,在代码能力测试 LiveCodeBench v6 中得分 66.0,两项核心推理能力均超越 Gemini2.5-Flash(thinking)、Qwen3-235B-A22B(thinking);新模型的知识水平(GPQA、MMLU-Pro)也较上一版本进步显著。

在写作(WritingBench)、Agent 能力(BFCL-v3)、多轮对话和多语言指令遵循(MultiIF)等通用能力评测中,Qwen3-30B-A3B-Thinking-2507 均超越 Gemini2.5-Flash(thinking)、Qwen3-235B-A22B(thinking)。

更长的上下文理解,原生支持 256K tokens,可扩展至 1M tokens。

此外,新模型的思考长度(thinking length)也增加了,官方推荐在高度复杂的推理任务中设置更长的思考预算,以充分发挥它的潜力。

官方透露,目前 Qwen3-30B-A3B-Thinking-2507 已在魔搭社区、HuggingFace 上开源,其轻量体积可轻松实现消费级硬件的本地部署;同时,其也在 Qwen Chat 上同步上线了新模型。

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 可按用户语气自动回复消息,在线会议软件 Zoom 推出基于生成式 AI 的新功能
  • 消息称微软曾不听 OpenAI 警告,上线不成熟的必应聊天服务
  • 讯飞星火 App 上线苹果 iOS 平台:搭载 V1.5 认知大模型,须获取内测资格后使用
  • 普通人也能成为音频剪辑师,Meta 推出 AI 模型 Voicebox
  • 长城汽车申请 SPACEGPT 等商标,有望成为首批在车机终端引入 AI 智能助理的吃螃蟹者
  • 全球 AI 人才需求激增,部分岗位年薪逼近 40 万美元
  • 蚂蚁集团证实正研发语言和多模态大模型,定名“贞仪”
  • 丰田推出生成式 AI 工具:输入文字指令可自动设计汽车外形,并符合工程学需求
  • YouTube 测试 Aloud 人工智能配音功能,可将视频转述为不同语言
  • Opera 向桌面和安卓用户开放浏览器 AI“Aria”
  • Dropbox 网盘推出 AI 搜索工具 Dropbox Dash:聚合多办公平台,可视化管理工作任务
  • Stability AI 推出文字生成图片模型 SDXL 0.9,硬件要求下探至消费级 GPU 水平
  • 复旦大学与阿里巴巴达成全面战略合作,共享 AI 大模型底层能力
  • 微软用 AI 缩短癌症放疗时间:扫描速度提高 2.5 倍,准确率达 90%
  • 金融巨头瑞穗银行押注生成式 AI,开放 Azure OpenAI 给 4.5 万名员工使用
  • 特斯拉人形机器人将于 7 月亮相上海 2023 世界人工智能大会
  • 微软必应聊天周报:改善体育相关话题、向 Skype 开放图片生成工具
  • 中国电信公布 TeleChat 大模型,宣称将建立“百亿级 AI 服务商”
  • 正版文心一言上架 App Store,百度此前起诉苹果“盗版 App 泛滥”
  • Pixela 推出 ChatGPT 翻译 App:支持中日英韩互译,限时免费上架 Google Play
  • 最新资讯

    热门资讯