性能比肩 Gemini-2.5 pro、o4-mini:阿里通义千问 Qwen 3 推理模型超级进化,现已开源

性能比肩 Gemini-2.5 pro、o4-mini:阿里通义千问 Qwen 3 推理模型超级进化,现已开源

人工智能 2025-07-26 18:09:05 7天前

IT酷哥 7 月 25 日消息,阿里通义千问今日宣布正式推出 Qwen3-235B-A22B 思考模型升级版本:Qwen3-235B-A22B-Thinking-2507。

自千问 3 旗舰模型发布后,阿里通义千问团队一直在努力拓展大模型的推理性能,全新开源的 Qwen3-235B-A22B-Thinking-2507,在推理性能和通用能力上均实现巨大飞跃,号称可比肩 Gemini-2.5 pro、O4-mini 等顶尖闭源模型,并创下全球开源模型 SOTA 最佳性能表现:

在编程(LiveCodeBench)、数学(AIME25)等核心能力上,Qwen3 推理模型实现了推理性能的再突破;

在知识(SuperGPQA)、创意写作能力(WritingBench)、人类偏好对齐(Arena-Hard v2)、多语言能力(MultilF)等通用能力上,Qwen3 推理模型也取得了显著进步;

新模型支持 256K 长文本理解,处理超长上下文不费力。

Qwen3-235B-A22B-Thinking-2507 目前已在魔搭社区、Hugging Face 开源,采用宽松的 Apache2.0 开源协议,人人均可免费下载商用。

IT酷哥附开源地址:

https://www.modelscope.cn/models/Qwen/Qwen3-235B-A22B-Thinking-2507

https://huggingface.co/Qwen/Qwen3-235B-A22B-Thinking-2507

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 日本发布 2023 年知识产权推进计划,将重点讨论生成式 AI 侵权界定
  • 谷歌推出 SAIF 框架,倡导安全环境下探索和发展人工智能
  • 英国投资 1 亿英镑,成立 AI 工作组和 OpenAI 等共建基础模型
  • 美国心理学会:经常接触 AI 的员工更容易孤独,增加疾病风险
  • 必应聊天周报:iOS 端引入小组件、为语音聊天扩展语言支持
  • 全球 AI 人才需求激增,部分岗位年薪逼近 40 万美元
  • AI 公司 Databricks 推出人工智能模型共享机制,可令开发者与公司实现“双赢”
  • AI 模型 Stable Diffusion 升级:正常生成五指、图像更逼真
  • YouTube 测试 Aloud 人工智能配音功能,可将视频转述为不同语言
  • Dropbox 网盘推出 AI 搜索工具 Dropbox Dash:聚合多办公平台,可视化管理工作任务
  • 英伟达赚翻了,甲骨文今年将斥资数十亿美元买 GPU 发力 AI 云服务
  • 金融巨头瑞穗银行押注生成式 AI,开放 Azure OpenAI 给 4.5 万名员工使用
  • 微软推出 ZeRO++ 技术,可显著减少 AI 大模型训练时间和成本
  • 成功率 99%,科学家研发语音 deepfake 软件:只需 5 分钟录音即可欺骗语音认证系统
  • 微软必应聊天周报:改善体育相关话题、向 Skype 开放图片生成工具
  • 李开复创业大模型公司“零一万物”官网上线:致力于打造全新的 AI 2.0 平台
  • 首款搭载 ChatGPT 的自行车问世,让你骑行不再孤单
  • 多家欧洲企业签署公开信,批评欧盟 AI 法案草案限制产业发展
  • 学而思网校推出《人工智能第一课》,号称首个基于自研大模型的 AIGC 课程
  • 方舟启航,火山引擎这波在“大气层”
  • 最新资讯

    热门资讯