Liquid AI推8B参数MoE模型LFM2-8B-A1B 仅1.5B激活 手机端实现4B级AI速度

Liquid AI以创新性的高效MoE架构重新定义边缘AI性能,其LFM2系列首款混合专家模型LFM2-8B-A1B,凭借8.3B的总参数规模与仅激活约1.5B参数的稀疏激活机制,实现了高表示能力与计算效率的完美平衡,专为资源受限的设备端场景量身打造。这一设计颠覆了传统认知,突破了小规模MoE模型效率瓶颈,特别针对实时交互场景进行优化,展现出卓越的边缘计算适应性。

Liquid AI推8B参数MoE模型LFM2-8B-A1B 仅1.5B激活 手机端实现4B级AI速度插图1

该模型基于先进的LFM2混合骨干架构,巧妙融合了18个门控短卷积块与6个分组查询注意力(GQA)块。前两层采用稠密结构以确保稳定性,而其余层则全面集成稀疏MoE前馈网络。每层配备32个专家,通过激活top-4专家的策略,结合归一化sigmoid路由器与自适应偏置技术,实现负载均衡,最大化计算资源利用率。模型支持长达32K的上下文长度,无缝兼容英文、阿拉伯文、中文、法文、德文、日文、韩文和西班牙文等多种语言,展现出强大的跨语言处理能力。

在训练与性能方面,LFM2-8B-A1B通过约12T令牌的预训练铸就了3-4B级强大能力,数据集涵盖55%英文、25%多语言和20%代码,确保了模型的广泛知识覆盖。后续采用Liquid Preference Alignment(长度归一化DPO/APO-Zero融合)进行精细后训练,并运用混合BF16/FP8精度,训练效率提升高达3倍以上。基准测试结果令人瞩目:知识能力方面,MMLU-Pro得分37.4(较LFM2-2.6B提升11.5),IFEval达到77.6,Multi-IF表现58.2;数学能力测试中,GSM8K、GSMPlus和MATH500分别取得84.4、64.8和74.2的优异成绩;多语言处理能力同样突出,MGSM和MMMLU得分分别为72.4和55.3;在编码与写作任务中,HumanEval+、LiveCodeBench v6和EQ-Bench得分分别为69.5、21.0和44.2。综合来看,LFM2-8B-A1B的输出质量堪比3-4B稠密模型,在多轮对话、创意写作、RAG检索增强生成和工具调用等复杂任务中均表现出色。

Liquid AI推8B参数MoE模型LFM2-8B-A1B 仅1.5B激活 手机端实现4B级AI速度插图2

部署与集成方面,LFM2-8B-A1B展现出惊人的性能优势。无论是在CPU还是GPU上,其推理速度均显著领先。在AMD Ryzen AI9HX370和三星Galaxy S24Ultra等设备上,采用int4量化与int8动态激活的自定义XNNPACK MoE内核,解码吞吐量比Qwen3-1.7B、IBM Granite4.0等模型快达5倍。GPU端集成vLLM,支持FlashInfer和CUDA-graph编译技术,实现单请求与在线批处理的高效运行。量化变体已针对高配手机/平板/笔记本进行优化:Q4_0模型体积约4.7GB,F16模型约16.7GB。支持框架包括llama.cpp(需b6709+版本支持lfm2moe)、ExecuTorch(移动/嵌入式CPU)和vLLM(GPU)。此外,Hugging Face上提供GGUF量化文件及Colab微调笔记本,助力开发者快速集成应用。模型已在Liquid Playground上线测试,供开发者体验。

开源与影响方面,LFM2-8B-A1B采用LFM Open License v1.0(基于Apache2.0)开放,权重与技术细节已上传至Hugging Face(LiquidAI/LFM2-8B-A1B)。这一举措不仅大幅降低了AI部署门槛,更为边缘计算领域注入强劲动力——从隐私保护的实时聊天到嵌入式智能系统,各行各业均可从中受益。AIbase观点认为,在云AI成本持续攀升的背景下,LFM2-8B-A1B等高效模型正加速推动”AI下沉”趋势,让智能技术触达更广泛的设备与场景。项目地址:https://huggingface.co/LiquidAI/LFM2-8B-A1B

最新快讯

2025年11月28日

18:28
全球人工智能领域最具影响力的顶级会议 NeurIPS 2025 的获奖名单于今晚重磅揭晓,阿里巴巴通义千问团队凭借其突破性研究成果《Attention Gating Makes Better Foundation Models》一举斩获最佳论文奖,成为本届大会四篇获奖论文中唯一代表中国科技力量的团队。这一成就不仅彰显了我国人工智能技术的领先水平,更在全球范围...
18:28
摩根士丹利最新发布的一份深度研报揭示了谷歌在人工智能芯片领域的重大战略布局:公司已制定出详细的TPU(张量处理单元)对外销售计划。根据这份报告,谷歌计划在2027年实现100万颗TPU的出货量,这一庞大数字中,仅50万颗即可为其云业务贡献约130亿美元的增量收入,相当于谷歌整体云收入的11%,同时有望将每股收益(EPS)提升约3个百分点。 这一消息一经传出,...
18:28
亚洲企业在人工智能领域的战略布局正在迎来历史性变革据 Diligent Institute 与新加坡董事协会(SID)及澳大利亚治理协会(GIA)联合发布的《亚太治理展望 2026》报告显示亚洲企业正将人工智能(AI)置于未来战略的核心位置面对日益严峻的经济与地缘政治挑战近48%的治理领导者将AI应用列为2026年首要战略任务这一比例甚至超过了对增长机会的追...
18:28
谷歌近期宣布对其最新 AI 工具 Gemini 3 Pro 及图像生成工具 Nano Banana Pro 的免费用户使用权限实施进一步调整。这一举措主要源于用户需求的急剧增长给谷歌系统带来了显著的压力。自这两款产品正式上线以来,用户们对其强大的功能表现出了前所未有的热情和高度关注。 最初,谷歌为免费用户设定的使用限额相对宽松。Gemini 3 Pro 的免...
18:28
阿里通义重磅推出全新生图模型 Z-Image,一经发布便引发广泛关注,首日下载量突破50万次,强势登顶Hugging Face趋势榜。这款创新模型以仅6亿参数的精巧规模,实现了令人惊叹的照片级真实感,能够精准捕捉皮肤细腻质感、发丝纤毫之末,以及自然光影与材质纹理的微妙变化,展现出卓越的美学表现力与构图氛围。 Z-Image特别推出优化版本Z-Image-Tu...
18:28
快手重磅发布新一代旗舰多模态模型Keye-VL-671B-A37B,并同步开源代码,标志着公司在人工智能领域的技术实力再攀新高峰。这款模型凭借其卓越的“善看会想”能力,在通用视觉理解、视频分析及数学推理等多项核心benchmark测试中表现惊艳,充分展现了快手在AI领域的深厚积累与创新实力。 Keye-VL-671B-A37B的设计理念聚焦于实现更高层次的多...
18:27
2025年11月28日,南网能源正式发布公告,宣布其全资子公司广州公司将通过北京产权交易所,公开挂牌转让位于海南省三沙市永兴岛的集中供冷项目资产。这一重要决策标志着南网能源在资产优化和运营效率提升方面迈出了关键一步。据悉,此次转让的底价将不低于经专业评估的标的资产价值,最终成交价格及交易对手方将由产权交易所的公开竞价结果决定。通过此次资产转让,南网能源有望进...
18:27
2025年11月28日,一项针对Windows 11预览版中“文件资源管理器后台预加载”功能的专项测试揭示了其在性能优化方面的双重影响。该功能旨在通过在系统启动前预先加载数据来缩短资源管理器的冷启动时间,从而提升整体使用效率。测试结果显示,该功能确实能够有效减少约数秒的启动延迟,但在高负载环境下,用户仍会遭遇右键菜单响应迟缓的困扰,未能完全解决这一长期存在的...
18:27
2025年11月28日,利君股份正式发布重要公告,宣布其全资子公司利君控股与全球知名企业GRANDWAY成功达成高压辊磨机买卖合同,交易金额高达5760.7728万美元,折合人民币约4.08亿元。这一重大合作项目不仅彰显了利君控股在重型工业设备领域的强大竞争力,更标志着公司业务版图迈向国际化新台阶。 此次交易中,利君控股将全面负责设备的供应、先进技术的输出以...
18:27
2025年11月28日,行业内部消息显示,中国汽车巨头一汽集团入股零跑汽车的战略合作已进入最后阶段,预计将在今年内正式完成签约仪式,初步持股比例约为5%。这一消息在汽车界引发广泛关注,尽管零跑汽车董事长朱江明此前公开否认了被一汽收购的传闻,但他同时也确认了双方正在积极探讨股权层面的合作可能性。朱江明强调,零跑汽车的创始团队将始终保持对公司的实际控制权,而一汽...
18:27
11月24日,清洁能源领域的领军企业Powertrust正式宣布与全球科技巨头微软达成战略合作,双方将携手在墨西哥和巴西这两个重要市场,共同推进270兆瓦分布式太阳能项目的建设与运营。根据协议,该项目将在未来四年内分阶段完成,为当地社区提供稳定可靠的绿色电力解决方案。 此次合作的核心亮点在于微软将系统性采购该项目产生的全部可再生能源证书(REC),这不仅...
18:27
2025年11月28日,专注于机器人数据管理技术的创新企业Neuracore成功斩获300万美元种子轮融资,其中Earlybird Venture Capital作为领投方展现了对其发展潜力的坚定信心。作为行业领先的云原生平台提供商,Neuracore致力于解决机器人研究领域长期存在的核心数据管理难题,通过构建智能化、自动化的数据管理解决方案,显著提升了科研...