性能比肩 Gemini-2.5 pro、o4-mini：阿里通义千问 Qwen 3 推理模型超级进化，现已开源

性能比肩 Gemini-2.5 pro、o4-mini：阿里通义千问 Qwen 3 推理模型超级进化，现已开源

人工智能 2025-07-26 18:09:05 7天前

IT酷哥 7 月 25 日消息，阿里通义千问今日宣布正式推出 Qwen3-235B-A22B 思考模型升级版本：Qwen3-235B-A22B-Thinking-2507。

自千问 3 旗舰模型发布后，阿里通义千问团队一直在努力拓展大模型的推理性能，全新开源的 Qwen3-235B-A22B-Thinking-2507，在推理性能和通用能力上均实现巨大飞跃，号称可比肩 Gemini-2.5 pro、O4-mini 等顶尖闭源模型，并创下全球开源模型 SOTA 最佳性能表现：

在编程（LiveCodeBench）、数学（AIME25）等核心能力上，Qwen3 推理模型实现了推理性能的再突破；

在知识（SuperGPQA）、创意写作能力（WritingBench）、人类偏好对齐（Arena-Hard v2）、多语言能力（MultilF）等通用能力上，Qwen3 推理模型也取得了显著进步；

新模型支持 256K 长文本理解，处理超长上下文不费力。

Qwen3-235B-A22B-Thinking-2507 目前已在魔搭社区、Hugging Face 开源，采用宽松的 Apache2.0 开源协议，人人均可免费下载商用。

IT酷哥附开源地址：

https://www.modelscope.cn/models/Qwen/Qwen3-235B-A22B-Thinking-2507

https://huggingface.co/Qwen/Qwen3-235B-A22B-Thinking-2507

模型开源性能能力阿里

相关阅读

日本发布 2023 年知识产权推进计划，将重点讨论生成式 AI 侵权界定

谷歌推出 SAIF 框架，倡导安全环境下探索和发展人工智能

英国投资 1 亿英镑，成立 AI 工作组和 OpenAI 等共建基础模型

美国心理学会：经常接触 AI 的员工更容易孤独，增加疾病风险

必应聊天周报：iOS 端引入小组件、为语音聊天扩展语言支持

全球 AI 人才需求激增，部分岗位年薪逼近 40 万美元

AI 公司 Databricks 推出人工智能模型共享机制，可令开发者与公司实现“双赢”

AI 模型 Stable Diffusion 升级：正常生成五指、图像更逼真

YouTube 测试 Aloud 人工智能配音功能，可将视频转述为不同语言

Dropbox 网盘推出 AI 搜索工具 Dropbox Dash：聚合多办公平台，可视化管理工作任务

英伟达赚翻了，甲骨文今年将斥资数十亿美元买 GPU 发力 AI 云服务

金融巨头瑞穗银行押注生成式 AI，开放 Azure OpenAI 给 4.5 万名员工使用

微软推出 ZeRO++ 技术，可显著减少 AI 大模型训练时间和成本

成功率 99%，科学家研发语音 deepfake 软件：只需 5 分钟录音即可欺骗语音认证系统

微软必应聊天周报：改善体育相关话题、向 Skype 开放图片生成工具

李开复创业大模型公司“零一万物”官网上线：致力于打造全新的 AI 2.0 平台

首款搭载 ChatGPT 的自行车问世，让你骑行不再孤单

多家欧洲企业签署公开信，批评欧盟 AI 法案草案限制产业发展

学而思网校推出《人工智能第一课》，号称首个基于自研大模型的 AIGC 课程

方舟启航，火山引擎这波在“大气层”