罗福莉首秀雷军AI新战事:小米MiMo-V2-Flash模型发布

罗福莉,这位被誉为”天才少女”的AI研究者,近期在小米的舞台上大放异彩。从年初与雷军接触到离职,再到本月加入小米并亮相”人车家全生态大会”,她带来的新模型MiMo-V2-Flash,为小米在AI领域的布局交出了一份亮眼的成绩单。这个参数量达309B、激活参数15B的模型,虽然罗福莉本人不愿称之为”大模型”,但在小米团队的构想中,它将成为Agent训练的坚实基座。模型优化聚焦于高性价比与快速响应两大核心,能够实现每秒150tokens的生成速度,同时保持极低成本。在性能与价格的天平上,小米找到了完美平衡点。

“它的代码能力和Agent能力在世界级公开评估榜单上已跻身全球开源模型Top1-2行列。”罗福莉自豪地表示,”大部分评估基准已超越或与DeepSeek-V3、Kimi K2-Thinking、Qwen等模型相当,但参数量却是后者的1/2-1/3。”然而,发布的小米模型也引发了两极分化的口碑——有人盛赞其代码能力领先,也有人质疑这是”刷分”之作。但无论如何,小米对AI的投入已毋庸置疑。选择在12月18日举办人车家全生态大会发布模型,更凸显了AI对小米的战略重要性。

罗福莉首秀雷军AI新战事:小米MiMo-V2-Flash模型发布插图1

在智能终端领域,小米面临两大核心任务:一是开发轻量化模型,通过端侧部署升级”超级小爱”和澎湃OS,将AI融入智能终端;二是为智驾系统构建大模型基座,提升智能驾驶能力。小米用行动证明,AI战略已进入”动真格”阶段。自2023年雷军年度演讲提出”轻量化+端侧部署”目标以来,罗福莉在演讲中直言,当前模型学习方向与生物智能进化存在背离,单纯依靠参数规模已难孕育更高阶智能。当Scaling Law的边际效益递减时,小米选择了更适合自己的道路——打造参数小、性能强且价格优的模型。

“Scaling范式正从预训练转向后训练,我们需要稳定范式以便在强化学习上投入更多算力。”罗福莉解释道。为此,MiMo-V2-Flash的优化逻辑围绕三个关键问题展开:高效沟通(强化代码能力和工具调用)、加速带宽(提升推理效率突破信息传递瓶颈)、发力后训练(激发强化学习潜能)。基于此,小米打造了309B参数的MiMo-V2-Flash,其最突出优势在于代码能力。官方数据显示,在SWE-Bench Multilingual基准测试中,该模型甚至超越包括GPT-5在内的众多闭源大模型。虽然其他指标与DeepSeek V3.2、kimi k2Thinking等开源模型尚有差距,但作为尺寸较小的模型,表现已属亮眼。

更核心的是模型在推理速度和价格上的突破:与Claude Sonnet4.5对比,小米新模型的推理价格仅为其2.5%,生成速度却是其2倍。MiMo-V2-Flash的API定价为输入0.7元/百万tokens,输出2.1元/百万tokens,在国内模型中极具竞争力。为优化成本和速度,小米采用了混合注意力机制——5:1的滑动窗口注意力(SWA)与全局注意力(GA)混合结构。这一选择借鉴了月之暗面、MiniMax等独角兽的探索成果。官方实验证明,SWA在长文处理和推理能力上优于主流线性注意力机制,且固定大小KV Cache极易适配现有基础设施。

罗福莉首秀雷军AI新战事:小米MiMo-V2-Flash模型发布插图2

然而,300B参数规模对于小米来说仍具挑战,距离端侧落地尚有距离。罗福莉在演讲结语中提出:”AI进化的下一个起点,必须有一个可交互的物理模型,我们要打造的本质上是一个具备物理一致性、时空连贯性的虚拟宇宙。”从今年小米模型发布动态看,未来优化将沿两条主线展开:一是死磕端侧部署,为智能终端加码;二是攻克物理模型,补足智驾能力短板。

无论外界如何讨论参数与架构,小米AI的价值最终要回归业务。选择在12月18日人车家全生态大会发布模型,本身就说明AI对小米的战略意义:通过升级”超级小爱”和澎湃OS,让智能终端从指令执行者转变为真正助理;在智驾领域,则急需大模型作为基座拓展能力上限。回顾2025年,小米在MiMo系列上的发力呈现急行军态势,不同于两年前的安静,今年小米高调出击。4月开源MiMo-7B系列;5月发布MiMo-VL-7B突破多模态视觉理解;11月推出MiMo-Embodied具身智能大模型;12月MiMo-V2-Flash压轴登场,主打极致效率与Agent能力。

这一系列动作背后是巨额投入。小米集团总裁卢伟冰在财报电话会上明确表示,AI是核心研发方向。2025年研发投入预计超300亿元,其中75亿元直接投向AI,未来五年将投入超2000亿元。”在端侧,我们要追求轻量算力、低功耗和周期成本,这样才能普及端侧AI。”卢伟冰强调,这既是小米未来大方向,也是其核心优势所在。组织层面的布局同样印证决心:自2024年起,小米搭建AI Infra平台,去年底已建成GPU万卡集群,团队成立时已有6500张GPU资源。

罗福莉首秀雷军AI新战事:小米MiMo-V2-Flash模型发布插图3

为支撑这一战略,小米人才布局也在2025年逐步完善。除了负责基础大模型的罗福莉,小米还引进陈龙加入智驾团队。这种”双核”配置在技术路线上初见成效——陈龙团队开源了全球首个打通自驾与具身操作的跨具身(X-Embodied)基座模型,试图用通用AI逻辑驱动从手机到智驾的全硬件生态。雷军曾提出”轻量化+本地部署”AI战略,小米正利用连接超10亿台设备的巨大存量优势,通过AI赋能业务。MiMo-V2-Flash的发布,不仅是技术突破,更是小米向资本市场和用户讲述的新故事:一家硬件公司,正通过掌握高效AI模型和广阔生态,在智能时代完成进化。至于这个故事能否讲通,不仅取决于模型质量,更取决于技术能否真正落地每台小米设备,转化为用户可感知的体验。

最新快讯

2025年12月18日

21:35
微新创想12月18日消息,今日,话题iPhone千万不能把内存用完”登上微博热搜,引发网友热议。事件起因是一段博主发布的视频。视频中,该博主展示了多位网友的反馈,称iPhone在存储空间被占满后出现无法开机的情况,刷机时还提示1110错误。据白鹿视频报道,苹果客服对此回应称,当手机存储空间占用过高、几乎没有剩余空间时,系统可能无...
21:35
微新创想12月18日讯 火山引擎于近日在FORCE原动力大会上重磅发布了豆包大模型1.8版本,这一里程碑式的更新标志着大模型技术的又一重大突破。火山引擎总裁谭待在发布会上透露,豆包大模型的性能表现持续领跑行业,截至今年12月,其日均token使用量已突破50万亿大关,较去年同期实现了超过10倍的惊人增长。这一数据充分展现了市场对豆包大模型的广泛认可与高度依赖...
21:33
当地时间12月16日,LG Innotek宣布将于2026年CES发布新一代屏下摄像头(UDC)模块,用于监测驾驶员疲劳状态与注意力。该模块安装在车载显示屏后方,外部不可见,解决了传统设计遮挡视线的问题。通过与LG Display合作,新技术克服了面板对成像质量的影响,画质可达无遮挡摄像头的99%以上。此外,LG还将在CES 2026推出首款RGB Min...
21:33
2025年12月18日,海外媒体率先披露了《星空》系列的重要更新计划。据悉,这款备受期待的太空探索游戏预计将在2026年登陆PlayStation 5和Switch 2平台,并迎来一次颠覆性的太空飞行系统升级。开发团队将着重优化飞行体验的连贯性与自由度,让玩家能够更加沉浸式地探索浩瀚宇宙。为了实现这一目标,B社对自家的Creation Engine进行了全面...
21:33
2025年12月18日,美国作家Elizabeth Lyon对Adobe提起集体诉讼,指控其在训练SlimLM语言模型时使用了包含大量盗版书籍的SlimPajama-627B数据集。该数据集源自RedPajama,而后者包含争议性Books3数据库,收录约19.1万受版权保护作品。Lyon称其多部写作指导书籍被未经授权使用。诉讼指出,SlimLM作为衍生模...
21:33
2025年第四季度,全球内存市场迎来重大变革,知名内存品牌芝奇(G.SKILL)正式宣布旗下产品价格将实施大幅度上调。这一决策背后,是多重市场因素的共同作用。随着人工智能应用的迅猛发展,全球范围内对DRAM的需求呈现爆发式增长,相关技术革新不断加速,推动数据存储需求持续攀升。然而,供应端却未能同步实现产能扩张,导致DRAM市场陷入严重的供需失衡状态。这种不平...
21:33
2025年12月18日,西门子能源在海南洋浦经济开发区隆重举行燃机总装基地及服务中心开工仪式,同时正式注册成立西门子能源(海南)有限公司。这一战略性项目不仅标志着海南自贸港全岛封关政策实施后的首个制造业标志性外资项目落地,更象征着西门子能源在中国能源领域的重大布局。作为西门子能源在中国设立的第一个燃机总装基地,该项目预计将在2027年完成建设并正式投运。 该...
20:33
2025年12月18日,备受瞩目的生物制药企业百奥泰正式宣布,其自主研发的创新药物——维拉西塔单抗注射液(BAT5906)已成功提交上市许可申请,并正式获得国家药品监督管理局的受理。这一重要里程碑不仅彰显了百奥泰在免疫治疗领域的研发实力,更意味着该药物即将进入关键的审评审批阶段,有望为国内患者带来新的治疗选择。 维拉西塔单抗注射液作为一种新型靶向药物,主要应...
20:33
2025年12月18日,佛山市海天调味食品股份有限公司正式发布《未来三年(2025-2027年)股东回报规划》,彰显公司对股东价值的坚定承诺。根据该规划,海天调味将在2025年至2027年期间,确保每年现金分红总额不低于当年归属于母公司股东净利润的80%,且此比例不包含可能实施的特别分红。这一举措不仅体现了公司对股东利益的重视,更通过透明化的回报机制,进一步...
20:33
2025年12月18日,人工智能领域传来重磅消息前Meta首席AI科学家、图灵奖得主Yann LeCun正式为其新成立的人工智能初创公司Advanced Machine Intelligence Labs(简称AMILabs)设定了高达30亿欧元的估值目标这一举动不仅彰显了资本市场对LeCun及其创新理念的坚定信心更标志着这位科技巨擘正式开启独立探索AI前沿...
20:33
《阿凡达3:火与烬》点映预售票房强势突破1亿元,影片即将于12月19日全国公映,引发全网期待热潮。作为詹姆斯·卡梅隆执导的科幻巨制,本片集结了佐伊·索尔达娜、萨姆·沃辛顿等原班核心演员强势回归,共同呈现一场视觉与叙事的双重盛宴。 12月17日至18日,影片通过CINITY独家及全面超前点映活动率先与观众见面,总片长高达198分钟,为影迷带来沉浸式观影体验。中...
20:33
2025年12月18日,瑞穗银行宣布将美光科技的目标股价从270美元上调至290美元。此次调整反映了对美光科技未来业绩增长及存储芯片市场需求回暖的乐观预期。分析认为,人工智能和数据中心需求的持续攀升是推动该预测的主要因素。此举显示金融机构对美光科技在技术升级和市场拓展方面前景的信心增强。