阿里通义千问推出全新推理模型 Qwen3-30B-A3B-Thinking-2507，多项能力显著提升

阿里通义千问推出全新推理模型 Qwen3-30B-A3B-Thinking-2507，多项能力显著提升

人工智能 2025-08-01 16:04:03 20小时前

IT酷哥 7 月 31 日消息，阿里通义千问今日宣布推出全新推理模型 Qwen3-30B-A3B-Thinking-2507。相较于 4 月 29 日开源的 Qwen3-30-A3B 模型，新模型在推理能力、通用能力及上下文长度上有了显著提升：

新模型在聚焦数学能力的 AIME25 评测中斩获 85.0 的高分，在代码能力测试 LiveCodeBench v6 中得分 66.0，两项核心推理能力均超越 Gemini2.5-Flash（thinking）、Qwen3-235B-A22B（thinking）；新模型的知识水平（GPQA、MMLU-Pro）也较上一版本进步显著。

在写作（WritingBench）、Agent 能力（BFCL-v3）、多轮对话和多语言指令遵循（MultiIF）等通用能力评测中，Qwen3-30B-A3B-Thinking-2507 均超越 Gemini2.5-Flash（thinking）、Qwen3-235B-A22B（thinking）。

更长的上下文理解，原生支持 256K tokens，可扩展至 1M tokens。

此外，新模型的思考长度（thinking length）也增加了，官方推荐在高度复杂的推理任务中设置更长的思考预算，以充分发挥它的潜力。

官方透露，目前 Qwen3-30B-A3B-Thinking-2507 已在魔搭社区、HuggingFace 上开源，其轻量体积可轻松实现消费级硬件的本地部署；同时，其也在 Qwen Chat 上同步上线了新模型。

模型能力上下文开源更长

相关阅读

可按用户语气自动回复消息，在线会议软件 Zoom 推出基于生成式 AI 的新功能

消息称微软曾不听 OpenAI 警告，上线不成熟的必应聊天服务

讯飞星火 App 上线苹果 iOS 平台：搭载 V1.5 认知大模型，须获取内测资格后使用

普通人也能成为音频剪辑师，Meta 推出 AI 模型 Voicebox

长城汽车申请 SPACEGPT 等商标，有望成为首批在车机终端引入 AI 智能助理的吃螃蟹者

全球 AI 人才需求激增，部分岗位年薪逼近 40 万美元

蚂蚁集团证实正研发语言和多模态大模型，定名“贞仪”

丰田推出生成式 AI 工具：输入文字指令可自动设计汽车外形，并符合工程学需求

YouTube 测试 Aloud 人工智能配音功能，可将视频转述为不同语言

Opera 向桌面和安卓用户开放浏览器 AI“Aria”

Dropbox 网盘推出 AI 搜索工具 Dropbox Dash：聚合多办公平台，可视化管理工作任务

Stability AI 推出文字生成图片模型 SDXL 0.9，硬件要求下探至消费级 GPU 水平

复旦大学与阿里巴巴达成全面战略合作，共享 AI 大模型底层能力

微软用 AI 缩短癌症放疗时间：扫描速度提高 2.5 倍，准确率达 90%

金融巨头瑞穗银行押注生成式 AI，开放 Azure OpenAI 给 4.5 万名员工使用

特斯拉人形机器人将于 7 月亮相上海 2023 世界人工智能大会

微软必应聊天周报：改善体育相关话题、向 Skype 开放图片生成工具

中国电信公布 TeleChat 大模型，宣称将建立“百亿级 AI 服务商”

正版文心一言上架 App Store，百度此前起诉苹果“盗版 App 泛滥”

Pixela 推出 ChatGPT 翻译 App：支持中日英韩互译，限时免费上架 Google Play