小米开源“Xiaomi MiMo”大模型：为推理而生，以 7B 参数超越 OpenAI o1-mini

小米开源“Xiaomi MiMo”大模型：为推理而生，以 7B 参数超越 OpenAI o1-mini

人工智能 2025-05-01 11:04:05 4小时前

IT酷哥 4 月 30 日消息，小米大模型团队通过“Xiaomi MiMo”公众号宣布，今天，小米开源首个“为推理而生”的大模型 Xiaomi MiMo，联动预训练到后训练，全面提升推理能力。据介绍，MiMo 是来自全新成立不久的“小米大模型 Core 团队”的初步尝试。

在数学推理（AIME 24-25）和代码竞赛（LiveCodeBench v5）公开测评集上，MiMo 仅用 7B 的参数规模，超越了 OpenAI 的闭源推理模型 o1-mini 和阿里 Qwen 更大规模的开源推理模型 QwQ-32B-Preview。

官方表示，MiMo 推理能力的提升，由预训练和后训练阶段中数据和算法等多层面的创新联合驱动，包括：

预训练：核心是让模型见过更多推理模式

数据：着重挖掘富推理语料，并合成约 200B tokens 推理数据。

训练：进行了三阶段训练，逐步提升训练难度，总训练 25T tokens。

后训练：核心是高效稳定的强化学习算法和框架

算法：提出 Test Difficulty Driven Reward 来缓解困难算法问题中的奖励稀疏问题，并引入 Easy Data Re-Sampling 策略，以稳定RL训练。

框架：设计了 Seamless Rollout 系统，使得 RL 训练加速 2.29 倍，验证加速 1.96 倍。

IT酷哥附开源地址：

Hugging Face：https://huggingface.co/XiaomiMiMo

技术报告：https://github.com/XiaomiMiMo/MiMo/blob/main/MiMo-7B-Technical-Report.pdf

模型算法小米开源数据

相关阅读

研究发现 AI 聊天机器人 ChatGPT 不会讲笑话，只会重复 25 个老梗

360 智脑大模型应用发布会直播（视频）

毕马威调查显示，过半美国白领不担心 AI 威胁自己的工作

AMD：Meta 正采用其云芯片支持新人工智能战略

行业首家，长虹电视 AI 大模型“长虹超脑”开启公测

捷豹路虎宣布采用 AI 管控供应链，最大程度降低生产中断风险

腾讯宣布打造行业大模型精选商店，提供一站式服务

软银 CEO 孙正义称每天都会使用 ChatGPT，是生成式 AI 服务的“忠实用户”

美图秀秀发布七款 AI 工具：修图一样修视频、打造电影级上镜脸

Dropbox 网盘推出 AI 搜索工具 Dropbox Dash：聚合多办公平台，可视化管理工作任务

微软用 AI 缩短癌症放疗时间：扫描速度提高 2.5 倍，准确率达 90%

外媒提议更新开源许可证：摆脱 80 年代束缚，应对当下人工智能时代

微软推出生成式 AI 培训项目，免费提供在线课程和证书

成功率 99%，科学家研发语音 deepfake 软件：只需 5 分钟录音即可欺骗语音认证系统

16 名匿名人士起诉 ChatGPT 侵犯隐私，向微软和 OpenAI 索赔 30 亿美元

研究表明 GPT-4 模型具备自我纠错能力，有望推动 AI 代码进一步商业化

AI 作画工具 Midjourney 推出“pan”功能，可上下左右平移扩展图片外场景

必应聊天将推出“#nosearch”功能：禁用网络搜索，直达精准答案

格莱美 CEO 解释 AI 新规：愿意接纳新技术，包含 AI 要素作品也可获提名

中国工程院院士高文：将打造 2000 亿参数自然语言大模型底座，性能对标 ChatGPT