罗福莉首秀雷军AI新战事：小米MiMo-V2-Flash模型发布

2025-12-18 11:56:33 互联网 3 次阅读

罗福莉，这位被誉为”天才少女”的AI研究者，近期在小米的舞台上大放异彩。从年初与雷军接触到离职，再到本月加入小米并亮相”人车家全生态大会”，她带来的新模型MiMo-V2-Flash，为小米在AI领域的布局交出了一份亮眼的成绩单。这个参数量达309B、激活参数15B的模型，虽然罗福莉本人不愿称之为”大模型”，但在小米团队的构想中，它将成为Agent训练的坚实基座。模型优化聚焦于高性价比与快速响应两大核心，能够实现每秒150tokens的生成速度，同时保持极低成本。在性能与价格的天平上，小米找到了完美平衡点。

“它的代码能力和Agent能力在世界级公开评估榜单上已跻身全球开源模型Top1-2行列。”罗福莉自豪地表示，”大部分评估基准已超越或与DeepSeek-V3、Kimi K2-Thinking、Qwen等模型相当，但参数量却是后者的1/2-1/3。”然而，发布的小米模型也引发了两极分化的口碑——有人盛赞其代码能力领先，也有人质疑这是”刷分”之作。但无论如何，小米对AI的投入已毋庸置疑。选择在12月18日举办人车家全生态大会发布模型，更凸显了AI对小米的战略重要性。

在智能终端领域，小米面临两大核心任务：一是开发轻量化模型，通过端侧部署升级”超级小爱”和澎湃OS，将AI融入智能终端；二是为智驾系统构建大模型基座，提升智能驾驶能力。小米用行动证明，AI战略已进入”动真格”阶段。自2023年雷军年度演讲提出”轻量化+端侧部署”目标以来，罗福莉在演讲中直言，当前模型学习方向与生物智能进化存在背离，单纯依靠参数规模已难孕育更高阶智能。当Scaling Law的边际效益递减时，小米选择了更适合自己的道路——打造参数小、性能强且价格优的模型。

“Scaling范式正从预训练转向后训练，我们需要稳定范式以便在强化学习上投入更多算力。”罗福莉解释道。为此，MiMo-V2-Flash的优化逻辑围绕三个关键问题展开：高效沟通（强化代码能力和工具调用）、加速带宽（提升推理效率突破信息传递瓶颈）、发力后训练（激发强化学习潜能）。基于此，小米打造了309B参数的MiMo-V2-Flash，其最突出优势在于代码能力。官方数据显示，在SWE-Bench Multilingual基准测试中，该模型甚至超越包括GPT-5在内的众多闭源大模型。虽然其他指标与DeepSeek V3.2、kimi k2Thinking等开源模型尚有差距，但作为尺寸较小的模型，表现已属亮眼。

更核心的是模型在推理速度和价格上的突破：与Claude Sonnet4.5对比，小米新模型的推理价格仅为其2.5%，生成速度却是其2倍。MiMo-V2-Flash的API定价为输入0.7元/百万tokens，输出2.1元/百万tokens，在国内模型中极具竞争力。为优化成本和速度，小米采用了混合注意力机制——5:1的滑动窗口注意力（SWA）与全局注意力（GA）混合结构。这一选择借鉴了月之暗面、MiniMax等独角兽的探索成果。官方实验证明，SWA在长文处理和推理能力上优于主流线性注意力机制，且固定大小KV Cache极易适配现有基础设施。

然而，300B参数规模对于小米来说仍具挑战，距离端侧落地尚有距离。罗福莉在演讲结语中提出：”AI进化的下一个起点，必须有一个可交互的物理模型，我们要打造的本质上是一个具备物理一致性、时空连贯性的虚拟宇宙。”从今年小米模型发布动态看，未来优化将沿两条主线展开：一是死磕端侧部署，为智能终端加码；二是攻克物理模型，补足智驾能力短板。

无论外界如何讨论参数与架构，小米AI的价值最终要回归业务。选择在12月18日人车家全生态大会发布模型，本身就说明AI对小米的战略意义：通过升级”超级小爱”和澎湃OS，让智能终端从指令执行者转变为真正助理；在智驾领域，则急需大模型作为基座拓展能力上限。回顾2025年，小米在MiMo系列上的发力呈现急行军态势，不同于两年前的安静，今年小米高调出击。4月开源MiMo-7B系列；5月发布MiMo-VL-7B突破多模态视觉理解；11月推出MiMo-Embodied具身智能大模型；12月MiMo-V2-Flash压轴登场，主打极致效率与Agent能力。

这一系列动作背后是巨额投入。小米集团总裁卢伟冰在财报电话会上明确表示，AI是核心研发方向。2025年研发投入预计超300亿元，其中75亿元直接投向AI，未来五年将投入超2000亿元。”在端侧，我们要追求轻量算力、低功耗和周期成本，这样才能普及端侧AI。”卢伟冰强调，这既是小米未来大方向，也是其核心优势所在。组织层面的布局同样印证决心：自2024年起，小米搭建AI Infra平台，去年底已建成GPU万卡集群，团队成立时已有6500张GPU资源。

为支撑这一战略，小米人才布局也在2025年逐步完善。除了负责基础大模型的罗福莉，小米还引进陈龙加入智驾团队。这种”双核”配置在技术路线上初见成效——陈龙团队开源了全球首个打通自驾与具身操作的跨具身（X-Embodied）基座模型，试图用通用AI逻辑驱动从手机到智驾的全硬件生态。雷军曾提出”轻量化+本地部署”AI战略，小米正利用连接超10亿台设备的巨大存量优势，通过AI赋能业务。MiMo-V2-Flash的发布，不仅是技术突破，更是小米向资本市场和用户讲述的新故事：一家硬件公司，正通过掌握高效AI模型和广阔生态，在智能时代完成进化。至于这个故事能否讲通，不仅取决于模型质量，更取决于技术能否真正落地每台小米设备，转化为用户可感知的体验。

2025年12月18日

21:35

罗福莉首秀雷军AI新战事：小米MiMo-V2-Flash模型发布

最新快讯

2025年12月18日

苹果回应iPhone内存用完就坏了：建议及时清理空间

字节高管：豆包调用不提升产品权重比价选拼多多

LG将推新一代屏下摄像头模块

星空PS5版Switch2版将推太空飞行系统重大优化

作家起诉Adobe滥用盗版书训练AI模型

芝奇宣布2025年DRAM涨价背后供需失衡解析

西门子能源洋浦燃机基地开工海南自贸港迎首个制造业外资项目

百奥泰维拉西塔单抗注射液获NMPA受理填补免疫疾病治疗需求

海天味业三年股东回报规划发布每年分红不低于净利润80

图灵奖得主Yann LeCun新创AI公司估值30亿欧元引领全球AI创新

阿凡达3点映票房破亿詹姆斯卡梅隆执导12月19日上映

瑞穗银行上调美光科技目标价至290美元