昆仑万维发布并开源全新推理大模型 MindLink,基于 Qwen3-32B 和 Qwen2.5-72B 进行后训练

昆仑万维发布并开源全新推理大模型 MindLink,基于 Qwen3-32B 和 Qwen2.5-72B 进行后训练

人工智能 2025-08-05 07:10:01 1天前

IT酷哥 8 月 2 日消息,昆仑万维刚刚发文,宣布推出并开源全新推理大模型 Skywork MindLink。

据介绍,这套全新的推理范式,能够根据任务难度自适应整合推理和非推理的生成回复,极大减少了推理成本,增强了推理过程的可读性和有效性。

数据显示,Skywork MindLink 模型在 10 个在无外接工具配置的大模型评测对比中,在人类最后的考试(Humanity's Last Exam)评测中获得第一,在复杂的数学领域(奥赛)中拿下 4 项评测第一(USAMO 2025、AIME 2024、AIME 2025、 HMMT 2025),在通识类领域的 GPQA-diamond 和 MMLU-pro 评测也表现优异。

Skywork MindLink 模型的核心能力包括:

新的推理范式 Plan-based Reasoning 去掉了“think”标签,减少了推理成本,提升了多轮对话能力。

提出了全新的数学方法,能够尝试分析 CoT 和 Plan-based Reasoning 的有效性。

提出一套自适应的推理机制,能够根据任务难度整合推理和非推理的生成回复。

基于 Qwen3-32B 和 Qwen2.5-72B 进行后训练,节省了大量训练成本的前提下,提高了原本模型能力,未来会开源更多尺寸模型。

IT酷哥注意到,目前昆仑万维已经拥有天工语言大模型、天工多模态大模型、SWE 代码大模型、Agent 大模型、视频大模型、3D 大模型、音乐大模型、音频大模型等大模型。

官方地址:

72B 模型权重:MindLink 72B-0801: https://huggingface.co/Skywork/MindLink-72B-0801

技术报告:https://github.com/SkyworkAI/MindLink/blob/main/mindlink.pdf

代码仓库:https://github.com/SkyworkAI/MindLink

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 联合国秘书长称支持建立全球人工智能监管机构
  • 行业首家,长虹电视 AI 大模型“长虹超脑”开启公测
  • 印象笔记开放旗下“印象 AI”,可一键生成思维导图、写文章等
  • 理想汽车负责人:我们在 ChatGPT 问世之前就已启动 AI 大语言模型训练
  • Meta 发布 Voicebox AI 模型:可生成音频回复信息,用于 NPC 对话等
  • 网友“欺骗”ChatGPT 生成 Win10、Win11 密钥,马斯克调侃:真适合做睡前读物
  • 软银 CEO 孙正义称每天都会使用 ChatGPT,是生成式 AI 服务的“忠实用户”
  • 语音生成 AI 初创公司 ElevenLabs 发布合成语音检测工具,号称准确率超过 99%
  • 蚂蚁集团证实正研发语言和多模态大模型,定名“贞仪”
  • 全球首个 AI 广播频道公司完成 1900 万美元融资,开发无障碍及游戏 NPC 技术
  • 报告称 5 月美国生成式 AI 岗位激增 20%
  • Dropbox 网盘推出 AI 搜索工具 Dropbox Dash:聚合多办公平台,可视化管理工作任务
  • AI 公司 MosaicML 推出 300 亿参数模型 MPT-30B,号称训练成本仅为竞品零头
  • 外媒提议更新开源许可证:摆脱 80 年代束缚,应对当下人工智能时代
  • 特斯拉人形机器人将于 7 月亮相上海 2023 世界人工智能大会
  • 内置 AI 助手 Copilot 上线:微软 Win11 Dev 预览版 Build 23493 发布,设置、音量大改
  • 版权问题难解,OpenAI 被控非法使用图书数据训练 AI 系统
  • 刚合作就解约,Unity 剔除一家销售盗用资源的 AI 合作伙伴
  • 英国初创公司用 AI 提升垃圾回收效率,每年追踪量达 320 亿件
  • 北京出台机器人产业新政,支持 AI 大模型与机器人融合发展
  • 最新资讯

    热门资讯