小米开源“Xiaomi MiMo”大模型:为推理而生,以 7B 参数超越 OpenAI o1-mini

小米开源“Xiaomi MiMo”大模型:为推理而生,以 7B 参数超越 OpenAI o1-mini

人工智能 2025-05-01 11:04:05 4小时前

IT酷哥 4 月 30 日消息,小米大模型团队通过“Xiaomi MiMo”公众号宣布,今天,小米开源首个“为推理而生”的大模型 Xiaomi MiMo,联动预训练到后训练,全面提升推理能力。据介绍,MiMo 是来自全新成立不久的“小米大模型 Core 团队”的初步尝试。

在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上,MiMo 仅用 7B 的参数规模,超越了 OpenAI 的闭源推理模型 o1-mini 和阿里 Qwen 更大规模的开源推理模型 QwQ-32B-Preview。

官方表示,MiMo 推理能力的提升,由预训练和后训练阶段中数据和算法等多层面的创新联合驱动,包括:

预训练:核心是让模型见过更多推理模式

数据:着重挖掘富推理语料,并合成约 200B tokens 推理数据。

训练:进行了三阶段训练,逐步提升训练难度,总训练 25T tokens。

后训练:核心是高效稳定的强化学习算法和框架

算法:提出 Test Difficulty Driven Reward 来缓解困难算法问题中的奖励稀疏问题,并引入 Easy Data Re-Sampling 策略,以稳定RL训练。

框架:设计了 Seamless Rollout 系统,使得 RL 训练加速 2.29 倍,验证加速 1.96 倍。

IT酷哥附开源地址:

Hugging Face:https://huggingface.co/XiaomiMiMo

技术报告:https://github.com/XiaomiMiMo/MiMo/blob/main/MiMo-7B-Technical-Report.pdf

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 研究发现 AI 聊天机器人 ChatGPT 不会讲笑话,只会重复 25 个老梗
  • 360 智脑大模型应用发布会直播(视频)
  • 毕马威调查显示,过半美国白领不担心 AI 威胁自己的工作
  • AMD:Meta 正采用其云芯片支持新人工智能战略
  • 行业首家,长虹电视 AI 大模型“长虹超脑”开启公测
  • 捷豹路虎宣布采用 AI 管控供应链,最大程度降低生产中断风险
  • 腾讯宣布打造行业大模型精选商店,提供一站式服务
  • 软银 CEO 孙正义称每天都会使用 ChatGPT,是生成式 AI 服务的“忠实用户”
  • 美图秀秀发布七款 AI 工具:修图一样修视频、打造电影级上镜脸
  • Dropbox 网盘推出 AI 搜索工具 Dropbox Dash:聚合多办公平台,可视化管理工作任务
  • 微软用 AI 缩短癌症放疗时间:扫描速度提高 2.5 倍,准确率达 90%
  • 外媒提议更新开源许可证:摆脱 80 年代束缚,应对当下人工智能时代
  • 微软推出生成式 AI 培训项目,免费提供在线课程和证书
  • 成功率 99%,科学家研发语音 deepfake 软件:只需 5 分钟录音即可欺骗语音认证系统
  • 16 名匿名人士起诉 ChatGPT 侵犯隐私,向微软和 OpenAI 索赔 30 亿美元
  • 研究表明 GPT-4 模型具备自我纠错能力,有望推动 AI 代码进一步商业化
  • AI 作画工具 Midjourney 推出“pan”功能,可上下左右平移扩展图片外场景
  • 必应聊天将推出“#nosearch”功能:禁用网络搜索,直达精准答案
  • 格莱美 CEO 解释 AI 新规:愿意接纳新技术,包含 AI 要素作品也可获提名
  • 中国工程院院士高文:将打造 2000 亿参数自然语言大模型底座,性能对标 ChatGPT
  • 最新资讯

    热门资讯