蚂蚁百灵开源高效思考模型推理成本降50% - 微新创想

2025-09-28 18:15:46 AI动态 24 次阅读

蚂蚁百灵大模型团队近日重磅宣布，正式向全球开源两款突破性的高效思考模型：Ring-flash-linear-2.0与Ring-mini-linear-2.0。这两款模型专为深度推理场景量身打造，通过创新的架构设计与算法优化，实现了前所未有的推理效率。与此同时，团队还发布了自主研发的两款高性能融合算子——FP8融合算子与线性Attention推理融合算子，为”大参数、低激活”的高效推理模式提供了坚实的技术支撑，并支持超长上下文处理能力。

根据团队详细技术说明，得益于架构层面的深度优化与高性能算子的协同工作，这两款新模型在深度推理场景下的计算成本仅为同等规模密集模型的十分之一，较之前的Ring系列模型更是实现了超过50%的推理成本降低。这一显著突破意味着，用户在进行复杂推理任务时，能够大幅减少计算资源消耗，从而显著提升工作效率与处理能力。

除了成本优势外，新模型另一个核心竞争力在于训练与推理引擎算子的高度对齐。这种对齐机制使得模型在强化学习阶段能够进行长周期、稳定且高效的优化，确保模型在多个高难度推理榜单中持续保持顶尖表现（SOTA）。这一技术优势为需要进行复杂推理任务的用户提供了更加强大、可靠的AI工具支持。

作为开放源代码项目，Ring-flash-linear-2.0和Ring-mini-linear-2.0已在Hugging Face和ModelScope等主流平台上正式发布。开发者们可以便捷地获取这些模型的信息，并进行实际应用尝试。此次开源不仅彰显了蚂蚁百灵大模型团队在人工智能领域的领先技术实力，更为广大开发者提供了前所未有的高效工具，有望在未来AI开发与研究中催生更多创新突破。

2025年10月02日

04:49

马斯克突破5000亿美元成首富

2025年10月2日，《福布斯》杂志发布最新财富榜单，特斯拉CEO埃隆·马斯克的个人资产首次突破5000亿美元大关，这一历史性成就使他成为人类历史上第一位跻身这一财富门槛的个体。这一惊人的财富增长主要源于其持有的特斯拉股份以及多家关联企业股份的持续飙升。尽管面临诸多挑战，马斯克依然稳坐全球富豪榜榜首，其财富规模不仅刷新了个人纪录，更在全球范围内引发了广泛关注...

03:43

谷歌云裁员百人聚焦设计团队优化业务结构

2025年10月2日，谷歌云计算部门迎来了一次重大的人事调整，宣布裁减超过100个设计相关职位。根据内部文件披露的信息，此次被解雇的员工主要集中在“定量用户体验研究”和“平台服务体验”两大核心团队，同时部分相邻团队也受到波及。值得注意的是，这些被裁岗位的核心职责是通过数据分析、用户调查等科学方法深入研究用户行为，并以此为基础为产品设计提供决策支持。此次裁员行...

02:42

Claude大模型正式登陆Slack提升团队协作效率

2025年10月2日，人工智能领域迎来重要里程碑——Anthropic正式宣布将旗下强大的大模型Claude无缝集成至Slack工作平台。这一创新功能使企业团队能够在熟悉的Slack环境中直接与Claude进行实时互动，通过简单的消息指令即可触发AI辅助，从而显著提升跨部门协作效率。Anthropic此次战略布局的核心目标，是为现代企业打造更加智能化的工作流...

01:39

西门子计划剥离西门子医疗股份优化业务结构聚焦核心领域

2025年10月2日，一则重磅市场消息引发广泛关注：全球工业自动化与数字化领域的领军企业西门子，正积极酝酿剥离其旗下医疗业务巨头——西门子医疗（Siemens Healthineers）的部分股权。这一战略调整的核心目标，在于进一步优化集团整体业务结构，将资源与精力更精准地聚焦于工业自动化、数字化等核心优势领域，从而提升集团整体竞争力与市场价值。据悉，西门...

01:39

丰田美国召回39.4万辆Tundra Sequoia因燃油缺陷

2025年10月2日，丰田汽车公司正式宣布在美国市场启动一项大规模召回行动，涉及约39.4万辆Tundra、Tundra混合动力版以及Sequoia车型。此次召回范围涵盖2022年至2025年款的部分车辆，核心问题指向燃油系统部件的潜在制造缺陷。据丰田官方说明，该缺陷可能导致发动机意外熄火，存在一定的安全隐患。此次召回事件迅速引发广泛关注，原因在于受影响车...

01:06

Waymo纽约自动驾驶测试许可延至2025年底

2025年10月2日，美国纽约市交通管理局正式宣布，将谷歌母公司Alphabet旗下自动驾驶巨头Waymo的测试运营许可期限延长至2025年12月31日。这一重要决策不仅为Waymo在纽约市的无人驾驶测试项目提供了持续的法律保障，更彰显了当地监管机构对Waymo自动驾驶技术安全性和运营能力的充分信任与高度认可。根据官方公告，此次许可延期意味着Waymo可以继...

01:06

Apple Music限时福利：新用户免费领3个月会员

Apple Music重磅推出全新限时优惠活动“wave 4”，为符合条件的iOS用户带来专属福利。活动面向两类用户群体：一是近期首次使用iPhone的新用户，二是已中断订阅超过90天的沉默用户。只需在指定市场使用合格设备完成兑换，即可免费领取长达3个月的Apple Music个人会员资格。此次优惠活动具有明确的参与条件，用户需通过iPhone设备进行兑换...

00:33

汇丰银行上调耐克目标价至90美元分析预测

2025年10月1日，国际知名投资银行汇丰银行正式发布研究报告，将运动巨头耐克公司的股票目标价从88美元上调至90美元，涨幅达2.27%。这一调整不仅彰显了汇丰对耐克未来市场表现的坚定信心，更预示着其看好品牌长期增长潜力。据汇丰分析师透露，此次目标价上调主要基于耐克在运动消费品领域的持续创新能力和强大的全球品牌影响力。近年来，耐克凭借其在产品研发、营销策略及...

00:33

微软Xbox Game Pass三档升级方案详解价格权益

微软今日正式发布Xbox Game Pass服务的重大升级计划，全新推出Essential、Premium和Ultimate三档会员方案，为玩家带来更丰富的游戏选择和更灵活的订阅体验。这一系列改革旨在满足不同玩家的需求，从休闲玩家到硬核游戏爱好者，都能找到最适合自己的选择。现有Game Pass Core用户将无缝过渡至Essential档，享受每月9.9...

2025年10月01日

23:25

比尔格罗斯警示AI科技股泡沫风险投资需谨慎

2025年10月1日，全球知名投资大师比尔·格罗斯发表了一份引人关注的警示声明，直指当前科技股市场估值过高的风险。这位在金融界享有盛誉的投资家指出，随着人工智能领域众多高科技公司如雨后春笋般涌现，市场的繁荣背后潜藏着巨大的不确定性。格罗斯强调，当前科技股的估值泡沫已经到了令人担忧的程度，投资者必须保持高度警惕。在分析当前市场状况时，格罗斯特别指出，问题的关...

23:25

合肥BEST项目核聚变装置核心部件研制成功主体工程进入新阶段

2025年10月1日，安徽合肥的紧凑型聚变能实验装置BEST项目传来重大喜讯，项目建设取得关键性突破。经过科研团队的不懈努力，装置的主机核心部件——杜瓦底座研制成功，并顺利完成了精准安装。这一里程碑式的进展标志着BEST项目的主体工程正式迈入新阶段，为后续的聚变能研究奠定了坚实的基础。此次成功不仅彰显了我国在聚变能领域的研发实力，更为未来能源探索开辟了新的道...

23:25

谷歌云部门裁员优化资源配置应对市场竞争

2025年10月1日，科技巨头谷歌公司正式宣布对其云计算部门进行组织调整，涉及部分员工裁减。此次优化措施主要针对美国总部及部分海外团队，具体裁减人数尚未公布。谷歌在官方声明中强调，此举旨在通过优化资源配置，全面提升云业务的运营效率，从而在激烈的市场竞争中保持领先地位。对于受影响的员工，公司将提供全面的遣散补偿方案，并配备专业的再就业支持服务，帮助他们顺利过渡...