传统 MoE(混合专家)架构通过增加专家数量提升模型能力,却常受困于边际收益递减与高昂的通信开销。今日,美团 LongCat 团队发布了全新模型 LongCat-Flash-Lite,通过“嵌入扩展(Embedding Expansion)”这一新范式,成功打破了效能瓶颈。

QQ20260206-155117.png

核心突破:嵌入扩展优于专家扩展

LongCat 团队的研究表明,在特定条件下,扩展嵌入层相比单纯增加专家数量能获得更优的帕累托前沿。基于此,LongCat-Flash-Lite 拥有 685亿总参数,但由于采用了 N-gram 嵌入层,每次推理仅需激活 29亿至45亿参数。其中,超过300亿参数被高效分配至嵌入层,利用 N-gram 捕获局部语义,精准锁定如“编程命令”等细分场景,显著提升了理解精度。

QQ20260206-155453.png

垂直优化:从架构到系统的全链路进化

为了将理论上的稀疏优势转化为实际性能,美团在系统层面实施了三重优化:

  1. 参数智能分配:嵌入层参数占比达46%,利用 O(1) 的查找复杂度避免了计算量随参数扩容而线性增长。

  2. 专用缓存与内核融合:设计了类似 KV Cache 的 N-gram Cache 机制,并定制 CUDA 内核(如 AllReduce+RMSNorm 融合),大幅降低 I/O 延迟。

  3. 推测解码协同:通过3步投机推理扩大批次大小,配合常规嵌入层的草案模型,进一步压缩延迟。

在典型负载下(输入4K,输出1K),该模型 API 可提供 500-700token/s 的极速生成速度,支持最长 256K 上下文。

性能表现:智能体与代码领跑

在多项权威基准测试中,LongCat-Flash-Lite 展现出跨级别的竞争力:

  • 智能体任务:在 $\tau^2$-Bench 的电信、零售、航空三大场景中均获最高分。

  • 代码能力:SWE-Bench 准确率达 54.4%,在 TerminalBench(终端命令执行)中以33.75分远超同类模型。

  • 通用素质:MMLU 得分 85.52,与 Gemini2.5Flash-Lite 旗鼓相当;数学竞赛级 AIME24表现稳健。

目前,美团已全面开源模型权重、技术报告及配套推理引擎SGLang-FluentLLM。开发者可通过LongCat API 开放平台申请试用,每日享有5000万 tokens 的免费额度。

最新快讯

2026年02月06日

17:01
2026年2月6日,沃尔玛宣布将于2026年初启动跨境发货计划“Walmart Exports”。该计划首批覆盖墨西哥和加拿大,后续将拓展至更多国家。符合条件的沃尔玛履约服务(WFS)商品将自动纳入,无需卖家额外操作。沃尔玛将统一负责拣货、包装及运输。此举旨在提升北美跨境履约效率,强化平台全球供应链能力。
17:01
2026年2月6日,阿里巴巴启动“春节请客计划”,投入30亿元推广千问App。活动即日起上线首波“30亿大免单”,用户更新至最新版即可领取25元无门槛免单卡,支持淘宝闪购、外卖及奶茶一键下单。千问App独家冠名东方卫视、浙江卫视、江苏卫视、河南卫视马年春节晚会。同时,淘宝闪购骑士服新增千问Logo,融入阿里与蚂蚁旗下品牌标识。此举旨在强化AI应用与本地生活...
17:01
2026年2月,深圳升菖电子有限公司完成A轮融资,投资方为世纪华通。该公司专注于PCB线路板加工及全流程组装,涵盖AI自动插件、SMT贴片、MI手插及成品组装。产线配备松下高速贴片机、DEK锡膏印刷机、波峰焊、回流焊等设备,并拥有AOI、X-ray、SPI、FCT、RoHS测试仪等全套检测仪器。本轮融资将用于产能扩充与智能制造升级。
17:01
2026年2月6日,卡普空旗下科幻动作冒险游戏《识质存在(Pragmata)》试玩Demo正式上线,支持PS5及PC平台。游戏将于2026年4月24日登陆PS5、Xbox Series X/S、Nintendo Switch 2和PC,支持简体中文。玩家将操控人类主角休与机器人同伴黛安娜,在月球研究站协同作战,分别运用枪械推进与系统入侵能力破关。Steam...
17:01
2026年2月6日,欣旺达动力科技股份有限公司宣布,就与威睿电动汽车技术(宁波)有限公司的买卖合同纠纷案达成和解。该案源于2021年6月至2023年12月期间电芯质量问题争议,威睿公司于2025年12月25日向宁波市中级人民法院提起诉讼,索赔23亿元。双方经友好协商后签署和解协议,妥善解决纠纷。欣旺达动力强调,此举旨在保障用户权益及产品服务连续性,符合行业...
17:01
2026年2月,微型电声元器件制造商阿木奇宣布获得讯飞创投战略投资。公司总部位于中国,专注助听器、高端耳机等领域的尖端微型电声元器件研发、生产与销售。本轮融资将用于加强微型换能器技术研发及产线升级,以提升在高精度音频传感领域的竞争力。此次合作凸显人工智能产业链上游核心器件环节的持续布局。
17:01
2026年2月9日至3月3日,小米汽车将在全国范围内提供春节出行无忧服务。服务涵盖24小时免费道路救援、500元打车券及异地送车服务。若因车辆自身偶发故障导致途中抛锚,用户可获最高1500元高铁或机票费用报销及500元住宿补贴。此举旨在保障用户春节期间长途出行安全与便利。
17:01
2026年2月12日,河南嘉晨智能控制股份有限公司将接受北交所上市委员会审议。公司总部位于河南,专注工业车辆电控系统研发生产,2025年营收近4亿元。作为国家级专精特新“小巨人”,其自主研发电机控制器实现关键元器件国产替代,产品已配套比亚迪、杭叉集团等头部企业。此次拟募资2.6亿元,用于智能控制系统生产基地及研发中心建设,加速产能提升与AI预测性维护等前沿...
17:01
2026年2月,杭州开普勒KEPLER公司宣布完成亿元级融资,引入A股上市公司柯林电气(688611.SH)作为战略投资者。此次合作聚焦技术、产业与资本协同,将在供应链整合、工业场景落地及资本联动等方面建立长期合作机制。开普勒专注通用人形机器人研发与应用,服务智能制造、仓储物流、智慧巡检、高危作业等垂直领域。本轮融资将加速其具身智能技术在工业级场景的规模化...
17:01
2026年2月6日,至信股份(603352.SH)公告宣布,拟向全资子公司金华至信增资,由其作为主体投资建设“汽车冲焊零部件项目”,总投资不超过11亿元。项目选址金华,建设期36个月,计划于2026年7月1日开工。建成后将新增汽车零部件及汽车座椅骨架产能,配备先进设备、生产线与工作站。此举旨在拓展公司核心业务,强化在汽车零部件领域的垂直整合能力。
17:01
2月7日20:00,国产外设品牌Ninjutso将正式发售无线电竞鼠标Sora V3。该鼠标准备面向抓握用户,重仅40g,搭载原相首款双光学引擎传感器AIMNINJA 2 PRO 45K,支持0.1 DPI步进与最高45000 DPI。其表面识别更强,高回报率及抬鼠场景下功耗更低、延迟更小;配备ESS内骨骼、HyperSwitch微动与HyperScrol...
17:01
2026年2月6日,极氪汽车正式发布旗下全新旗舰SUV——极氪8X的极昼白与极夜黑官图。该车定位“超级电混高性能旗舰SUV”,长宽高为5100×1998×1780mm,轴距3069mm。设计采用0.618黄金比例与1:4轮轴比,配备一体式直瀑格栅、零面差镜车门、浩瀚星钻矩阵大灯及海岸线贯穿尾灯等创新元素。新车强调美学与空气动力学融合,旨在树立高端智能电动S...