美团LongCat-Flash-Lite:45亿激活参数性能比肩巨量模型

传统混合专家(MoE)架构在提升模型能力时,常面临专家数量增加带来的边际收益递减及高昂通信开销的挑战。如今,美团LongCat团队发布了革命性的LongCat-Flash-Lite模型,通过引入“嵌入扩展(Embedding Expansion)”这一全新范式,成功突破了大规模语言模型(LLM)的效能瓶颈,为AI模型的发展树立了新标杆。

美团LongCat-Flash-Lite:45亿激活参数性能比肩巨量模型插图1

LongCat团队的深入研究揭示,在特定条件下,扩展嵌入层相比单纯增加专家数量,能带来更为优越的帕累托前沿性能。基于这一创新洞察,LongCat-Flash-Lite模型总参数规模高达685亿,但得益于其独特的N-gram嵌入层设计,每次推理仅需激活29亿至45亿参数,大幅提升了参数效率。其中,超过300亿参数被策略性地分配至嵌入层,利用N-gram机制精准捕获局部语义,尤其在“编程命令”等细分专业场景中,展现出显著增强的理解与生成精度。

为了将理论上的稀疏激活优势转化为实际运行中的卓越性能,美团在系统层面进行了全链路的深度优化。这包括智能参数分配机制,使嵌入层参数占比高达46%,并利用O(1)的查找复杂度,有效避免了计算量随参数扩容而线性增长。同时,LongCat团队设计了类似于KV Cache的N-gram Cache专用缓存机制,并定制了CUDA内核,如AllReduce与RMSNorm的融合优化,极大降低了I/O延迟。此外,模型还协同推测解码技术,通过三步投机推理扩大批次大小,并配合常规嵌入层的草案模型,进一步显著压缩了推理延迟。在典型的负载条件下(输入4K,输出1K),LongCat-Flash-Lite API能够提供每秒500-700 token的极速生成能力,并支持最长达256K的超长上下文窗口。

美团LongCat-Flash-Lite:45亿激活参数性能比肩巨量模型插图2

LongCat-Flash-Lite在多项权威基准测试中展现出跨越式的竞争力与卓越性能。在智能体任务方面,它在$tau^2$-Bench的电信、零售、航空三大核心场景中均斩获最高分,彰显了其强大的决策与执行能力。在代码生成与理解领域,该模型表现尤为突出,SWE-Bench准确率达到54.4%,在TerminalBench(终端命令执行)中更是以33.75分的优异成绩遥遥领先于同类模型。在通用素质方面,LongCat-Flash-Lite的MMLU得分高达85.52,与Gemini2.5Flash-Lite不相上下,并在数学竞赛级AIME24中展现出稳健的解题能力。

目前,美团已秉持开放共赢的理念,全面开源了LongCat-Flash-Lite的模型权重、详尽技术报告及配套的SGLang-FluentLLM推理引擎,旨在推动AI社区的共同进步。开发者可通过LongCat API开放平台申请试用,每日可享受高达5000万 tokens的免费额度,体验这一高性能、高效率的创新AI模型,共同探索未来智能应用的无限可能。

最新快讯

2026年02月08日

16:37
微新创想:阿里千问App春节巨献,30亿红包诚邀全国人民共享AI生活新体验 春节期间,阿里旗下的千问App正掀起一股空前的新年福利热潮。从2月8日起,千问App正式启动“30亿大免单”活动,为广大用户送上诚意满满的新年惊喜。活动期间,用户只需支付象征性的1分钱,即可获得一杯免费奶茶,尽享AI带来的便捷与欢乐。 然而,这场全民狂欢的背后,也出现了一些意料之外的...
16:37
微新创想:雷军官宣小米SU7冰雪实拍图,底盘与操控大幅跃升,细节升级引爆期待 近日,小米创始人雷军在其微博平台上发布了一组备受瞩目的新一代小米SU7冰雪实拍图,并向外界透露了这款备受期待的新车在底盘方面进行了重磅升级,预示着其驾驶体验将得到显著提升,尤其是在冰雪、湿滑等复杂路况下的操控性能将更为出色。更令人振奋的是,雷军还透露新车的小额预订通道已然开启,并预...
16:35
2026年2月,美国消费者研究机构Circana发布调查称,86%的美国受访者知晓科技产品含AI,但35%不希望设备搭载AI功能,主因是‘无必要’;59%担忧隐私泄露,43%拒绝为AI功能额外付费。仅15%认为AI操作复杂。不过65%受访者仍愿在至少一类设备上使用AI,18至24岁人群接受度达82%。语音控制为最普及AI应用,智能手机占语音用户75%。调查...
16:35
微新创想:春节返程高峰将至,全国铁路客运量持续攀升。2月8日,预计全国铁路将承担起高达1325万人次的旅客运输任务,为了满足激增的出行需求,铁路部门计划额外加开1688列列车,并特别在京广、京沪、京哈等重要高铁干线上增设夜间动车组,全力保障旅客的顺畅出行。 为了进一步优化旅客出行体验,鼓励大家合理安排行程,铁路部门在部分非热门线路推出了极具吸引力的票价优惠政...
16:35
微新创想:日本国民级特摄IP“超级战队”系列,承载着无数观众的童年回忆与热血梦想,在走过近半个世纪的光辉历程后,于2026年2月8日通过官方微博发布了一则令人唏嘘的公告——“50年来超级感谢”,正式宣告该系列将暂别荧幕,画下阶段性的休止符。 自1975年首次亮相以来,由日本东映株式会社倾力打造的“超级战队”系列,凭借其经典的英雄设定、炫目的变身特效以及跌宕起...
16:35
微新创想:捷尼赛思电动化与混动新篇章,2027年全新平台孕育未来豪华 韩国豪华汽车品牌捷尼赛思(Genesis)正以前瞻性的战略布局,迈向其激动人心的未来。据官方披露,首款搭载全新专属平台的量产车型将于2027年耀世登场。这一革命性的平台不仅是品牌独立发展的里程碑,更标志着捷尼赛思在电动化与混动技术领域的一次深度革新。 全新平台的设计理念,旨在构建一个与现代...
16:04
2026年2月8日,神州租车发布春节自驾趋势报告。报告显示,受“先返乡、再旅行”新趋势影响,春节租车将出现双高峰:首峰在除夕前最后一个工作日及除夕当日,次峰预计出现在正月初二。用户多采用分段式用车——前半程返乡团圆,后半程携家人周边游或跨城自驾。该模式释放长假消费潜力,反映出行需求多元化升级。
16:04
微新创想:2026春节出行热潮启幕,全国人潮涌动创纪录 2026年2月7日,恰逢农历腊月二十,春运的第六个黄金日,全国范围内的跨区域人员流动量飙升至惊人的22,251万人次。这一激动人心的数据由综合运输春运工作专班权威发布,不仅较前一日实现了5.3%的显著增长,更比去年同期(2025年)劲增3.9%,强劲的增长势头清晰地勾勒出春节出行需求的澎湃与旺盛。 此次...
16:04
微新创想: 珠海免税集团于2月8日,在拱北口岸的进境免税店隆重揭幕了备受瞩目的苹果Apple专区。这一里程碑式的举措标志着苹果品牌首次正式进驻中国口岸进境免税渠道,同时也意味着智能电子产品品类首次被引入此类高端销售场景,为消费者带来了前所未有的购物体验。 该创新项目坐落于我国改革开放前沿的广东省珠海市拱北口岸,由珠免集团精心打造和运营。其盛大启航,正值财政部...
15:30
微新创想:2026年2月8日,短视频电商巨头TikTok Shop重磅宣布,对其备受瞩目的品牌托管服务进行了三项意义深远的优化升级。此次升级的触角已延伸至全球多个关键市场,其核心目标是赋能入驻品牌商家,显著提升其在当地市场的运营深度和广度。 此次升级的三大亮点,为品牌商的全球化战略注入了新的活力。首先,在商品定价方面,品牌商将拥有前所未有的自主权,能够根据不...
15:30
2026年2月,育碧完成全球业务重组,整合工作室并聚焦核心IP。据行业汇总,自2018年起,该公司已取消25款大型游戏项目,涵盖《刺客信条》《幽灵行动》《波斯王子》等系列衍生作及原创IP,包括2026年刚终止的《波斯王子:时之沙重制版》和3个未公布3A项目。取消主因是开发周期过长、在线服务型游戏屡屡受挫及资源向盈利主力倾斜。值得注意的是,《超越善恶2》与新...
15:30
2026年2月7日,特斯拉AI软件副总裁阿肖克·埃卢斯瓦米指出,自动驾驶本质是人工智能问题,非传感器问题。他强调摄像头已提供足够信息,难点在于AI对现实世界的理解与预测。特斯拉认为当前AI能力已足以替代多传感器方案。同日,特斯拉中国区副总裁陶琳确认,2026年将加大在华AI软硬件及能源领域投入,并已启用本地AI训练中心支持FSD本土化落地。