小米开源309B参数AI大模型 | 性能效率领先

文章摘要
小米正式发布并开源MiMo-V2-Flash基础语言模型,总参数3090亿,激活参数150亿。在SWE-bench编程测试中取得73.4%解决率,支持256K上下文窗口,推理速度达150token/秒,API成本仅为Claude Sonnet 4.5的2.5%,全面开源模型权重与代码。

小米开源全新基础语言模型MiMo-V2-Flash

2025年12月17日,小米正式发布并开源全新基础语言模型MiMo-V2-Flash,总参数规模达到3090亿,激活参数为150亿。这款模型专为智能体时代设计,追求极致速度与效能。

在当日举行的小米人车家全生态合作伙伴大会上,MiMo大模型负责人罗福莉首次公开亮相并发表主题演讲。


01 性能表现:跻身开源模型第一梯队

MiMo-V2-Flash在多项关键基准测试中表现突出,已进入全球开源大模型的前列。官方数据显示,该模型在2025年AIME数学竞赛和GPQA-Diamond科学知识测试中,均位列开源模型前两名。

编程能力是MiMo-V2-Flash的强项。在SWE-bench Verified基准测试中,它取得了73.4%的解决率,超越所有开源模型,接近GPT-5-High的水平。

这一测试要求AI修复真实世界的软件bug,意味着MiMo-V2-Flash能处理大部分实际编程问题。

在多语言编程基准测试SWE-Bench Multilingual中,模型的解决率为71.7%。在智能体任务方面,MiMo-V2-Flash在τ²-Bench分类得分中,通信类达到95.3分,零售类79.5分,航空类66.0分。

测试领域关键指标/得分表现水平
数学与科学推理AIME 2025:开源模型前二顶级开源水平
编程能力SWE-bench Verified:73.4%超越所有开源模型
多语言编程SWE-Bench Multilingual:71.7%开源模型领先
智能体任务τ²-Bench通信类:95.3分专业场景表现优异
长上下文处理支持256K上下文窗口行业领先水平

小米方面表示,MiMo-V2-Flash的整体性能与主流先进模型相当,与DeepSeek-V3.2、Kimi-K2等头部开源模型处于同一水平。模型的写作质量也接近顶级闭源模型,使其不仅能作为工具使用,还能成为可靠的日常助手。


02 效率突破:创新架构实现超高性价比

MiMo-V2-Flash的核心卖点之一是极高的推理效率和低成本。官方数据显示,该模型的推理速度最高可达每秒150个token。

在定价策略上,MiMo-V2-Flash的API调用成本为每百万输入token 0.1美元,每百万输出token 0.3美元。

这一价格明显低于当前主流高性能模型的市场价格,仅为标杆闭源模型Claude Sonnet 4.5的2.5%

效率突破的背后是两项核心技术创新

  • 首先是混合滑动窗口注意力机制,采用了5层滑动窗口注意力搭配1层全局注意力的激进比例。这种设计让KV缓存存储量减少了近6倍,同时保持了长文本性能,最长支持256k上下文窗口。

  • 另一项创新是轻量级多Token预测技术。传统模型一次只能生成一个token,而MiMo-V2-Flash通过原生集成的MTP模块,能并行预测多个token。实测平均能接受2.8到3.6个token,推理速度直接提升2到2.6倍。

在后训练阶段,小米提出了多教师在线策略蒸馏方法。这一方法只需要传统训练流程1/50的算力,就能让学生模型达到教师性能峰值。MOPD支持灵活接入新教师,学生模型成长后还能反过来当教师,形成"教与学"的闭环自我进化。


03 开源策略:全面开放模型权重与代码

MiMo-V2-Flash选择了完全开源的策略,包括模型权重和推理代码均已全面开放。模型采用MIT开源协议,基础版权重已经在Hugging Face上发布。

小米将所有推理代码贡献给了SGLang,并在LMSYS博客分享了推理优化经验。技术报告公开了完整模型细节,模型权重在Hugging Face上以MIT许可协议发布

目前,MiMo-V2-Flash已经在API Platform限时免费开放,开发者可以直接上手体验。官方还推出了在线体验平台Xiaomi MiMO Studio,为用户提供包含深度与联网搜索在内的AI对话服务。

在应用场景上,MiMo-V2-Flash专门为智能体任务设计,能够在超长上下文中持续进行多轮决策和工具调用。模型支持256k的超长上下文窗口,相当于一本中等篇幅的小说,支持数百轮智能体交互与工具调用。

开发者可以将MiMo-V2-Flash直接融入现有工作流,与Claude Code、Cursor、Cline等主流开发环境无缝配合,不需要额外适配。


小米的AI战略布局

罗福莉在演讲中指出,虽然MiMo-V2-Flash总参数只有309B,激活参数15B,但在代码和智能体评测基准上已达到全球开源模型的顶尖水平

从商标布局到模型发布,小米在AI赛道上正在下一盘大棋。截至今年4月,小米已申请注册多枚"XIAOMI MIMO"商标,覆盖科学仪器、通讯服务等多个领域。

目前,部分商标已通过初审或处于注册申请中。这一系列动作,从底层模型到应用平台,再到知识产权保护,构成了小米在AI领域完整的布局。

AI内容生成说明

本文由扶摇AI根据指定的权威信源自动生成,旨在提供结构清晰、事实准确的信息整合。 生成过程遵循严格的信源引用与事实核查标准。

更多推荐