小米开源全新基础语言模型MiMo-V2-Flash
2025年12月17日,小米正式发布并开源全新基础语言模型MiMo-V2-Flash,总参数规模达到3090亿,激活参数为150亿。这款模型专为智能体时代设计,追求极致速度与效能。
在当日举行的小米人车家全生态合作伙伴大会上,MiMo大模型负责人罗福莉首次公开亮相并发表主题演讲。
01 性能表现:跻身开源模型第一梯队
MiMo-V2-Flash在多项关键基准测试中表现突出,已进入全球开源大模型的前列。官方数据显示,该模型在2025年AIME数学竞赛和GPQA-Diamond科学知识测试中,均位列开源模型前两名。
编程能力是MiMo-V2-Flash的强项。在SWE-bench Verified基准测试中,它取得了73.4%的解决率,超越所有开源模型,接近GPT-5-High的水平。
这一测试要求AI修复真实世界的软件bug,意味着MiMo-V2-Flash能处理大部分实际编程问题。
在多语言编程基准测试SWE-Bench Multilingual中,模型的解决率为71.7%。在智能体任务方面,MiMo-V2-Flash在τ²-Bench分类得分中,通信类达到95.3分,零售类79.5分,航空类66.0分。
| 测试领域 | 关键指标/得分 | 表现水平 |
|---|---|---|
| 数学与科学推理 | AIME 2025:开源模型前二 | 顶级开源水平 |
| 编程能力 | SWE-bench Verified:73.4% | 超越所有开源模型 |
| 多语言编程 | SWE-Bench Multilingual:71.7% | 开源模型领先 |
| 智能体任务 | τ²-Bench通信类:95.3分 | 专业场景表现优异 |
| 长上下文处理 | 支持256K上下文窗口 | 行业领先水平 |
小米方面表示,MiMo-V2-Flash的整体性能与主流先进模型相当,与DeepSeek-V3.2、Kimi-K2等头部开源模型处于同一水平。模型的写作质量也接近顶级闭源模型,使其不仅能作为工具使用,还能成为可靠的日常助手。
02 效率突破:创新架构实现超高性价比
MiMo-V2-Flash的核心卖点之一是极高的推理效率和低成本。官方数据显示,该模型的推理速度最高可达每秒150个token。
在定价策略上,MiMo-V2-Flash的API调用成本为每百万输入token 0.1美元,每百万输出token 0.3美元。
这一价格明显低于当前主流高性能模型的市场价格,仅为标杆闭源模型Claude Sonnet 4.5的2.5%。
效率突破的背后是两项核心技术创新:
首先是混合滑动窗口注意力机制,采用了5层滑动窗口注意力搭配1层全局注意力的激进比例。这种设计让KV缓存存储量减少了近6倍,同时保持了长文本性能,最长支持256k上下文窗口。
另一项创新是轻量级多Token预测技术。传统模型一次只能生成一个token,而MiMo-V2-Flash通过原生集成的MTP模块,能并行预测多个token。实测平均能接受2.8到3.6个token,推理速度直接提升2到2.6倍。
在后训练阶段,小米提出了多教师在线策略蒸馏方法。这一方法只需要传统训练流程1/50的算力,就能让学生模型达到教师性能峰值。MOPD支持灵活接入新教师,学生模型成长后还能反过来当教师,形成"教与学"的闭环自我进化。
03 开源策略:全面开放模型权重与代码
MiMo-V2-Flash选择了完全开源的策略,包括模型权重和推理代码均已全面开放。模型采用MIT开源协议,基础版权重已经在Hugging Face上发布。
小米将所有推理代码贡献给了SGLang,并在LMSYS博客分享了推理优化经验。技术报告公开了完整模型细节,模型权重在Hugging Face上以MIT许可协议发布。
目前,MiMo-V2-Flash已经在API Platform限时免费开放,开发者可以直接上手体验。官方还推出了在线体验平台Xiaomi MiMO Studio,为用户提供包含深度与联网搜索在内的AI对话服务。
在应用场景上,MiMo-V2-Flash专门为智能体任务设计,能够在超长上下文中持续进行多轮决策和工具调用。模型支持256k的超长上下文窗口,相当于一本中等篇幅的小说,支持数百轮智能体交互与工具调用。
开发者可以将MiMo-V2-Flash直接融入现有工作流,与Claude Code、Cursor、Cline等主流开发环境无缝配合,不需要额外适配。
小米的AI战略布局
罗福莉在演讲中指出,虽然MiMo-V2-Flash总参数只有309B,激活参数15B,但在代码和智能体评测基准上已达到全球开源模型的顶尖水平。
从商标布局到模型发布,小米在AI赛道上正在下一盘大棋。截至今年4月,小米已申请注册多枚"XIAOMI MIMO"商标,覆盖科学仪器、通讯服务等多个领域。
目前,部分商标已通过初审或处于注册申请中。这一系列动作,从底层模型到应用平台,再到知识产权保护,构成了小米在AI领域完整的布局。