罗福莉首秀雷军AI新战事:小米MiMo-V2-Flash模型发布

罗福莉,这位被誉为”天才少女”的AI研究者,近期在小米的舞台上大放异彩。从年初与雷军接触到离职,再到本月加入小米并亮相”人车家全生态大会”,她带来的新模型MiMo-V2-Flash,为小米在AI领域的布局交出了一份亮眼的成绩单。这个参数量达309B、激活参数15B的模型,虽然罗福莉本人不愿称之为”大模型”,但在小米团队的构想中,它将成为Agent训练的坚实基座。模型优化聚焦于高性价比与快速响应两大核心,能够实现每秒150tokens的生成速度,同时保持极低成本。在性能与价格的天平上,小米找到了完美平衡点。

“它的代码能力和Agent能力在世界级公开评估榜单上已跻身全球开源模型Top1-2行列。”罗福莉自豪地表示,”大部分评估基准已超越或与DeepSeek-V3、Kimi K2-Thinking、Qwen等模型相当,但参数量却是后者的1/2-1/3。”然而,发布的小米模型也引发了两极分化的口碑——有人盛赞其代码能力领先,也有人质疑这是”刷分”之作。但无论如何,小米对AI的投入已毋庸置疑。选择在12月18日举办人车家全生态大会发布模型,更凸显了AI对小米的战略重要性。

罗福莉首秀雷军AI新战事:小米MiMo-V2-Flash模型发布插图1

在智能终端领域,小米面临两大核心任务:一是开发轻量化模型,通过端侧部署升级”超级小爱”和澎湃OS,将AI融入智能终端;二是为智驾系统构建大模型基座,提升智能驾驶能力。小米用行动证明,AI战略已进入”动真格”阶段。自2023年雷军年度演讲提出”轻量化+端侧部署”目标以来,罗福莉在演讲中直言,当前模型学习方向与生物智能进化存在背离,单纯依靠参数规模已难孕育更高阶智能。当Scaling Law的边际效益递减时,小米选择了更适合自己的道路——打造参数小、性能强且价格优的模型。

“Scaling范式正从预训练转向后训练,我们需要稳定范式以便在强化学习上投入更多算力。”罗福莉解释道。为此,MiMo-V2-Flash的优化逻辑围绕三个关键问题展开:高效沟通(强化代码能力和工具调用)、加速带宽(提升推理效率突破信息传递瓶颈)、发力后训练(激发强化学习潜能)。基于此,小米打造了309B参数的MiMo-V2-Flash,其最突出优势在于代码能力。官方数据显示,在SWE-Bench Multilingual基准测试中,该模型甚至超越包括GPT-5在内的众多闭源大模型。虽然其他指标与DeepSeek V3.2、kimi k2Thinking等开源模型尚有差距,但作为尺寸较小的模型,表现已属亮眼。

更核心的是模型在推理速度和价格上的突破:与Claude Sonnet4.5对比,小米新模型的推理价格仅为其2.5%,生成速度却是其2倍。MiMo-V2-Flash的API定价为输入0.7元/百万tokens,输出2.1元/百万tokens,在国内模型中极具竞争力。为优化成本和速度,小米采用了混合注意力机制——5:1的滑动窗口注意力(SWA)与全局注意力(GA)混合结构。这一选择借鉴了月之暗面、MiniMax等独角兽的探索成果。官方实验证明,SWA在长文处理和推理能力上优于主流线性注意力机制,且固定大小KV Cache极易适配现有基础设施。

罗福莉首秀雷军AI新战事:小米MiMo-V2-Flash模型发布插图2

然而,300B参数规模对于小米来说仍具挑战,距离端侧落地尚有距离。罗福莉在演讲结语中提出:”AI进化的下一个起点,必须有一个可交互的物理模型,我们要打造的本质上是一个具备物理一致性、时空连贯性的虚拟宇宙。”从今年小米模型发布动态看,未来优化将沿两条主线展开:一是死磕端侧部署,为智能终端加码;二是攻克物理模型,补足智驾能力短板。

无论外界如何讨论参数与架构,小米AI的价值最终要回归业务。选择在12月18日人车家全生态大会发布模型,本身就说明AI对小米的战略意义:通过升级”超级小爱”和澎湃OS,让智能终端从指令执行者转变为真正助理;在智驾领域,则急需大模型作为基座拓展能力上限。回顾2025年,小米在MiMo系列上的发力呈现急行军态势,不同于两年前的安静,今年小米高调出击。4月开源MiMo-7B系列;5月发布MiMo-VL-7B突破多模态视觉理解;11月推出MiMo-Embodied具身智能大模型;12月MiMo-V2-Flash压轴登场,主打极致效率与Agent能力。

这一系列动作背后是巨额投入。小米集团总裁卢伟冰在财报电话会上明确表示,AI是核心研发方向。2025年研发投入预计超300亿元,其中75亿元直接投向AI,未来五年将投入超2000亿元。”在端侧,我们要追求轻量算力、低功耗和周期成本,这样才能普及端侧AI。”卢伟冰强调,这既是小米未来大方向,也是其核心优势所在。组织层面的布局同样印证决心:自2024年起,小米搭建AI Infra平台,去年底已建成GPU万卡集群,团队成立时已有6500张GPU资源。

罗福莉首秀雷军AI新战事:小米MiMo-V2-Flash模型发布插图3

为支撑这一战略,小米人才布局也在2025年逐步完善。除了负责基础大模型的罗福莉,小米还引进陈龙加入智驾团队。这种”双核”配置在技术路线上初见成效——陈龙团队开源了全球首个打通自驾与具身操作的跨具身(X-Embodied)基座模型,试图用通用AI逻辑驱动从手机到智驾的全硬件生态。雷军曾提出”轻量化+本地部署”AI战略,小米正利用连接超10亿台设备的巨大存量优势,通过AI赋能业务。MiMo-V2-Flash的发布,不仅是技术突破,更是小米向资本市场和用户讲述的新故事:一家硬件公司,正通过掌握高效AI模型和广阔生态,在智能时代完成进化。至于这个故事能否讲通,不仅取决于模型质量,更取决于技术能否真正落地每台小米设备,转化为用户可感知的体验。

最新快讯

2025年12月19日

07:12
2025年12月18日,知名科技媒体MacRumors率先披露了一则关于苹果macOS Tahoe系统的重大问题。据该报道,最新系统版本在更新后出现了严重的Bug,导致用户连接的Studio Display显示器出现频繁闪烁现象。这一故障在系统升级后明显加剧,尤其在浏览浅色背景网页或使用纯白界面时,滚动操作几乎必然触发闪烁,给用户带来极为糟糕的使用体验。经过...
06:41
2025年12月19日,一则重磅消息在科技界引发轩然大波:据多方消息源透露,人工智能巨头OpenAI正计划以高达8300亿美元的估值进行新一轮融资,但实际筹资金额预计将控制在1000亿美元以内。此次融资的核心目标,将全部用于加速其前沿人工智能技术的研发进程,并推动全球范围内数据中心等关键基础设施的规模扩张。值得注意的是,尽管该消息已广泛流传,但OpenAI方...
06:41
12月19日清晨6时,中央气象台再次启动暴雪蓝色预警机制,针对我国北方多省的恶劣天气展开紧急响应。据最新气象监测数据显示,预计在19日8时至20日8时期间,内蒙古东北部、黑龙江中北部及东部地区,以及甘肃西部局部区域将迎来范围性大雪天气。其中,黑龙江中北部部分地区将遭遇暴雪袭击,降雪量预计达到10至15毫米,呈现局部强降雪态势。 此次降雪过程具有明显地域特征,...
06:41
2025年12月19日,OpenAI首席执行官Altman在旧金山总部盛大宣布GPT-5.2-Codex的正式问世。这款专为编程与代码生成深度优化的先进模型,不仅继承了GPT系列的强大基因,更在上下文理解与多语言支持方面实现了质的飞跃。作为OpenAI在人工智能编程领域的又一力作,GPT-5.2-Codex的推出标志着AI辅助编程进入了一个全新的时代。 此次...
05:40
2025年12月19日,运动巨头耐克公司正式发布了其第二财季财务报告,数据显示公司当季实现营收总额高达124.3亿美元,虽然同比增长仅0.6%,但这一成绩仍成功超越了市场分析师普遍预估的122.4亿美元。在盈利方面,耐克当季每股收益为0.53美元,相较去年同期0.78美元的收益水平有所回落。值得注意的是,公司毛利率降至40.6%,较去年同期的43.6%出现明...
04:40
2025年12月19日,人工智能领域的领军企业OpenAI正式宣布与美国能源部达成一项重大合作协议,旨在深化双方在人工智能领域的协同创新。此次合作将聚焦于推动人工智能技术在关键能源基础设施、前沿科学研究和气候建模等领域的实际应用,为解决全球能源转型和气候变化挑战提供强大技术支撑。根据协议内容,双方将共享尖端技术资源和强大的计算能力,重点加速清洁能源技术研发和...
04:09
2025年12月19日,科技巨头谷歌正式宣布将其备受瞩目的内容透明度工具进行全球范围扩展。这一重要举措意味着Gemini应用的所有语言版本及国家地区均将全面支持图像与视频的AI生成内容验证功能。谷歌此举的核心目标在于为广大用户提供更为便捷可靠的AI内容识别途径,帮助用户在信息爆炸的时代有效辨别真伪信息。 通过引入先进的溯源信息追踪系统和技术标记机制,该工具能...
02:39
2025年12月19日,全球领先的金融服务机构花旗集团发布最新运营报告,宣布旗下大部分核心项目已成功达成或接近既定发展目标。该集团在声明中特别强调,通过全面优化标准化作业流程、大力推行自动化管理手段以及深化数字化管控体系,运营效率实现了显著提升。这一系列变革举措不仅有效简化了业务流程,更在显著降低运营成本的同时,大幅增强了风险防范与控制能力。花旗集团表示,这...
02:39
2025年12月19日,国际权威信用评级机构标普全球评级正式宣布,将法国知名汽车制造商雷诺的信用评级上调至备受青睐的投资级。这一重要评级调整,不仅是对雷诺近年来在多个关键领域取得显著成就的充分肯定,更凸显了其稳健发展的市场信心。评级上调的背后,是雷诺在财务健康度、业务结构优化以及电动化战略转型等方面取得的突破性进展,为公司的长远发展奠定了坚实基础。 标普评级...
02:39
2025年12月19日,国际评级机构标普全球评级正式宣布,将欧洲航空巨头空客的信用评级展望从稳定上调至正面,同时维持其“A”级投资信用评级不变。这一重要评级调整基于多方面积极因素,尤其是空客近年来持续产生的稳健自由现金流,充分展现了该公司在当前复杂全球经济环境下的卓越财务韧性。标普分析师在报告中指出,随着全球民用航空市场逐步走出疫情阴影,需求呈现显著复苏态势...
01:38
2025年12月19日,科郦有限公司正式向香港交易所递交主板上市申请,标志着这家企业迈向资本市场的重要里程碑。作为本次上市的独家保荐人,中国国际金融公司(中金公司)将为科郦的上市之路提供全方位的专业支持。此次公开募股不仅旨在为科郦筹集发展所需资金,更将助力公司进一步扩大业务版图,增强市场竞争力。目前,关于具体的融资规模及发行价格等关键信息尚未公布,市场普遍期...
01:08
2025年12月,OpenAI在高校市场取得重大突破,已成功向全美约35所公立大学出售超过70万份ChatGPT使用许可,覆盖学生与教职员工两大群体。这一战略举措不仅有效缓解了高校管理层对AI技术的顾虑,更为OpenAI赢得了宝贵的时间窗口,抢先锁定下一代职场用户的核心群体。与微软Copilot主要依托现有软件生态不同,ChatGPT凭借其独立且灵活的应用模...