蚂蚁百灵开源新模型Ring-mini-sparse-2.0-exp 显著提升长序列推理性能

蚂蚁百灵大模型团队近日重磅发布其最新开源成果——高效推理模型 Ring-mini-sparse-2.0-exp,为长序列解码任务带来革命性突破。该模型基于先进的 Ling2.0 架构,通过创新性的稀疏注意力机制,在长序列推理场景中实现了卓越性能。团队将高稀疏比的 Mixture of Expert(MoE)结构与稀疏注意力机制巧妙融合,构建出这一专为复杂长序列推理优化的新架构。得益于架构与推理框架的深度协同设计,Ring-mini-sparse-2.0-exp 在处理长序列时的吞吐量较前代 Ring-mini-2.0 实现了近三倍的飞跃。在多个高难度推理基准测试中,该模型持续保持 SOTA(State of the Art)水平,充分展现了其强大的上下文处理能力与高效推理性能,为开源社区贡献了极具价值的轻量化解决方案。

Ling2.0Sparse 架构的设计理念聚焦于应对大语言模型发展中的两大核心趋势:上下文长度的持续扩展与测试规模的动态增长。团队在 Mixture of Block Attention(MoBA)的启发下,创新性地采用块级稀疏注意力(block-wise sparse attention)机制。该机制将输入的 Key 和 Value 按块划分,每个 query 在 head 维度上进行 top-k 块选择,仅对选中的块执行 softmax 计算,从而显著降低计算开销。更值得一提的是,团队将 MoBA 设计与 Grouped Query Attention(GQA)技术相结合,实现同一组内 query heads 共享 top-k 块选择结果,进一步优化了 I/O 效率。这一系列创新设计使得 Ring-mini-sparse-2.0-exp 在保持高性能的同时,实现了前所未有的推理效率。

蚂蚁百灵开源新模型Ring-mini-sparse-2.0-exp 显著提升长序列推理性能插图1

GitHub:https://github.com/inclusionAI/Ring-V2/tree/main/moba

划重点:
🌟 新模型 Ring-mini-sparse-2.0-exp 在长序列推理中表现卓越,吞吐量实现近三倍提升。
🔍 该模型融合创新稀疏注意力机制,完美平衡高效推理与上下文处理能力。
📥 模型已在多个平台全面开源,为社区提供丰富的应用与研究资源。

最新快讯

2025年10月27日

17:24
2025年10月27日,备受瞩目的第138届广交会第二期在广州圆满落下帷幕。本届展会以"品质家居"为核心主题,为期五天,全面展示了家庭用品、礼品及装饰品、建材及家具三大领域的最新成果。展览总面积高达51.5万平方米,设有2.5万个标准展位,吸引了超过1万家线下企业参展,规模宏大,盛况空前。 展会紧扣当前家居消费升级的明显趋势,通过展示高品质、个性化的家居产品...
17:24
国家发展改革委最新消息显示,近期国际油价波动对我国成品油价格产生显著影响。根据既定的成品油价格形成机制,自10月27日24时起,国内汽、柴油价格迎来新一轮调整,其中汽油每吨下调265元,柴油每吨下调255元。这一调整举措旨在稳定国内能源市场,保障民生需求。 从全国范围来看,此次调价具体表现为:92号汽油每升下调0.21元,95号汽油每升下调0.22元,0号柴...
17:24
2025年至2030年,震裕科技将重点布局浙江宁海县,计划投资总额高达21.1亿元人民币,用于建设精密部件制造装备、人形机器人精密模组及零部件项目。这一战略举措旨在显著扩大公司现有产能,同时前瞻性地布局新兴机器人领域,抢占行业先机。该项目将由震裕科技与宁海县投资促进中心携手合作推进,一期协议预计将在近期正式签署。值得注意的是,该项目已获得公司董事会的一致通过...
17:24
2025年10月27日 格力博官方平台发布重要动态,宣布其与智元机器人在商用清洁机器人领域的深度合作已正式进入实施阶段。双方正积极推动相关技术整合与产品研发落地,目前正处于关键的技术攻关与市场验证阶段。值得注意的是,出于商业策略考量及项目保密需求,此次合作暂未对外披露具体的收入增长预期和产品铺货时间表。尽管如此,该项目的启动已标志着格力博在智能商用清洁设备市...
17:24
圣路易斯华盛顿大学物理学家团队近日取得重大突破,成功研发出一种基于结晶氮化硼的高性能量子传感器。该传感器能够在高达地球大气压三万倍的极端环境下稳定运行,实现对压力与磁场的高精度检测,为科研领域开辟了新的可能性。 该传感器的核心原理在于利用中子辐射在氮化硼薄膜中制造特定的硼空位。这些空位能够形成对磁场、温度和应变高度敏感的电子自旋体系,从而实现对微弱物理量的精...
17:24
2025年10月27日,珠海总部传来喜讯,格力电器宣布与京东今年的合作销售规模有望再次突破200亿元大关,延续了去年已实现的销售佳绩。回顾2023年,双方携手创造的销售额已成功跨越这一里程碑,展现了稳固且持续增长的合作伙伴关系。 自去年底起,格力电器与京东联合推出的空调AI节能王子Pro凭借卓越性能,迅速赢得了市场认可,累计销量高达13万套。此外,京东还郑重...
17:24
前英伟达工程师Chip Huyen在《商业内幕》的深度专访中,为人工智能时代的职场竞争提供了极具价值的启示。她明确指出,想要在这个快速发展的领域保持领先地位,就必须立刻行动起来,将理论付诸实践。这位技术专家建议职场人士从记录日常工作中的痛点开始,选择一个实际问题,尝试运用AI技术进行创新性解决。作为曾深度参与英伟达NeMo平台开发的技术骨干,Huyen强调即...
17:24
央视权威新闻报道,神舟二十一号载人飞船与长征二号F运载火箭组合体已于10月24日顺利转运至酒泉卫星发射中心发射区,并于27日正式启动全系统联合演练。此次演练全面覆盖了从飞行准备到点火起飞,再到船箭分离的完整发射流程,酒泉卫星发射中心测发系统各岗位人员协同配合,确保演练高效有序进行。 经过严格测试,船箭组合体目前状态良好,已成功完成箭塔协调对接、系统功能检查等...
17:24
10月27日,领先的ODM解决方案提供商广和通与前沿AR眼镜科技企业XREAL正式宣布达成战略合作,双方将强强联合,整合各自在技术研发与智能制造领域的核心优势,共同加速消费级AI眼镜产业的创新升级与市场拓展。作为业内知名的ODM服务商,广和通凭借其自主研发的轻量化AI解决方案和低时延通信技术,为AR眼镜赋予了强大的本地智能处理能力,使其能够高效完成语音识别、...
17:24
2025年10月27日,同兴科技在官方互动平台发布重要信息,其自主研发的钠离子电池材料展现出广阔的应用前景,可广泛应用于大型储能领域,同时也能满足启停电源、UPS不间断电源、低速电动车以及两轮电动车等产品的动力需求。这一突破性进展标志着同兴科技在新能源材料领域又迈出了坚实一步。 据悉,公司目前主推的通用型NFPP材料已在第三方专业实验室成功完成50Ah短刀电...
17:15
OpenAI正将ChatGPT从"会聊天的AI"彻底升级为"能办事的智能代理"。近日,其正式向美国和加拿大用户推出首批八大应用深度集成,涵盖旅行、设计、学习、音乐、房产等多个生活场景。这一创新让用户只需在对话中提及应用名称,ChatGPT即可直接调用授权账户,代为执行真实操作——无需跳转、无需手动输入,真正实现"说一句,就搞定"的便捷体验。 目前上线的集成应...
17:15
上线仅一个月,OpenAI 的 AI 视频生成应用 Sora 就创造了历史——在仅限美加地区且仍处邀请制的状态下,其下载量已突破200万大关,强势登顶 App Store 榜首。这款备受瞩目的现象级产品正迎来爆发式成长,其负责人 Bill Peebles 于10月22日在 X 平台重磅宣布,一系列颠覆性更新将在未来几天内陆续推出,覆盖角色扩展、视频编辑、社交...