
罗福莉,这位被誉为”天才少女”的AI研究者,近期在小米的舞台上大放异彩。从年初与雷军接触到离职,再到本月加入小米并亮相”人车家全生态大会”,她带来的新模型MiMo-V2-Flash,为小米在AI领域的布局交出了一份亮眼的成绩单。这个参数量达309B、激活参数15B的模型,虽然罗福莉本人不愿称之为”大模型”,但在小米团队的构想中,它将成为Agent训练的坚实基座。模型优化聚焦于高性价比与快速响应两大核心,能够实现每秒150tokens的生成速度,同时保持极低成本。在性能与价格的天平上,小米找到了完美平衡点。
“它的代码能力和Agent能力在世界级公开评估榜单上已跻身全球开源模型Top1-2行列。”罗福莉自豪地表示,”大部分评估基准已超越或与DeepSeek-V3、Kimi K2-Thinking、Qwen等模型相当,但参数量却是后者的1/2-1/3。”然而,发布的小米模型也引发了两极分化的口碑——有人盛赞其代码能力领先,也有人质疑这是”刷分”之作。但无论如何,小米对AI的投入已毋庸置疑。选择在12月18日举办人车家全生态大会发布模型,更凸显了AI对小米的战略重要性。

在智能终端领域,小米面临两大核心任务:一是开发轻量化模型,通过端侧部署升级”超级小爱”和澎湃OS,将AI融入智能终端;二是为智驾系统构建大模型基座,提升智能驾驶能力。小米用行动证明,AI战略已进入”动真格”阶段。自2023年雷军年度演讲提出”轻量化+端侧部署”目标以来,罗福莉在演讲中直言,当前模型学习方向与生物智能进化存在背离,单纯依靠参数规模已难孕育更高阶智能。当Scaling Law的边际效益递减时,小米选择了更适合自己的道路——打造参数小、性能强且价格优的模型。
“Scaling范式正从预训练转向后训练,我们需要稳定范式以便在强化学习上投入更多算力。”罗福莉解释道。为此,MiMo-V2-Flash的优化逻辑围绕三个关键问题展开:高效沟通(强化代码能力和工具调用)、加速带宽(提升推理效率突破信息传递瓶颈)、发力后训练(激发强化学习潜能)。基于此,小米打造了309B参数的MiMo-V2-Flash,其最突出优势在于代码能力。官方数据显示,在SWE-Bench Multilingual基准测试中,该模型甚至超越包括GPT-5在内的众多闭源大模型。虽然其他指标与DeepSeek V3.2、kimi k2Thinking等开源模型尚有差距,但作为尺寸较小的模型,表现已属亮眼。
更核心的是模型在推理速度和价格上的突破:与Claude Sonnet4.5对比,小米新模型的推理价格仅为其2.5%,生成速度却是其2倍。MiMo-V2-Flash的API定价为输入0.7元/百万tokens,输出2.1元/百万tokens,在国内模型中极具竞争力。为优化成本和速度,小米采用了混合注意力机制——5:1的滑动窗口注意力(SWA)与全局注意力(GA)混合结构。这一选择借鉴了月之暗面、MiniMax等独角兽的探索成果。官方实验证明,SWA在长文处理和推理能力上优于主流线性注意力机制,且固定大小KV Cache极易适配现有基础设施。

然而,300B参数规模对于小米来说仍具挑战,距离端侧落地尚有距离。罗福莉在演讲结语中提出:”AI进化的下一个起点,必须有一个可交互的物理模型,我们要打造的本质上是一个具备物理一致性、时空连贯性的虚拟宇宙。”从今年小米模型发布动态看,未来优化将沿两条主线展开:一是死磕端侧部署,为智能终端加码;二是攻克物理模型,补足智驾能力短板。
无论外界如何讨论参数与架构,小米AI的价值最终要回归业务。选择在12月18日人车家全生态大会发布模型,本身就说明AI对小米的战略意义:通过升级”超级小爱”和澎湃OS,让智能终端从指令执行者转变为真正助理;在智驾领域,则急需大模型作为基座拓展能力上限。回顾2025年,小米在MiMo系列上的发力呈现急行军态势,不同于两年前的安静,今年小米高调出击。4月开源MiMo-7B系列;5月发布MiMo-VL-7B突破多模态视觉理解;11月推出MiMo-Embodied具身智能大模型;12月MiMo-V2-Flash压轴登场,主打极致效率与Agent能力。
这一系列动作背后是巨额投入。小米集团总裁卢伟冰在财报电话会上明确表示,AI是核心研发方向。2025年研发投入预计超300亿元,其中75亿元直接投向AI,未来五年将投入超2000亿元。”在端侧,我们要追求轻量算力、低功耗和周期成本,这样才能普及端侧AI。”卢伟冰强调,这既是小米未来大方向,也是其核心优势所在。组织层面的布局同样印证决心:自2024年起,小米搭建AI Infra平台,去年底已建成GPU万卡集群,团队成立时已有6500张GPU资源。

为支撑这一战略,小米人才布局也在2025年逐步完善。除了负责基础大模型的罗福莉,小米还引进陈龙加入智驾团队。这种”双核”配置在技术路线上初见成效——陈龙团队开源了全球首个打通自驾与具身操作的跨具身(X-Embodied)基座模型,试图用通用AI逻辑驱动从手机到智驾的全硬件生态。雷军曾提出”轻量化+本地部署”AI战略,小米正利用连接超10亿台设备的巨大存量优势,通过AI赋能业务。MiMo-V2-Flash的发布,不仅是技术突破,更是小米向资本市场和用户讲述的新故事:一家硬件公司,正通过掌握高效AI模型和广阔生态,在智能时代完成进化。至于这个故事能否讲通,不仅取决于模型质量,更取决于技术能否真正落地每台小米设备,转化为用户可感知的体验。
