蚂蚁百灵大模型团队近日重磅宣布,正式向全球开源其最新研发的高性能思考模型——Ring-flash-2.0。这款模型在 Ling-flash-2.0-base 的基础上实现了深度优化,不仅代表了人工智能领域的技术飞跃,更展现了开源社区的强大活力。Ring-flash-2.0 拥有高达100亿的总参数量,但通过创新的稀疏激活机制,每次推理时仅激活其中6.1亿参数,这种高效的设计既保证了强大的计算能力,又显著降低了资源消耗,为大规模智能应用提供了理想解决方案。
从技术细节来看,Ring-flash-2.0 在多个高难度基准测试中取得了令人瞩目的成绩。无论是数学竞赛题的解答能力、代码生成的精准度,还是复杂逻辑推理的表现,该模型均表现出超越同侪的实力。其性能不仅大幅超越了其他40亿参数模型,甚至能够与更大规模的开源稀疏模型(MoE)以及部分闭源的高性能思考模型API展开激烈竞争,充分证明了其技术领先性。
为了全面提升模型能力,蚂蚁百灵团队独创性地设计了双阶段强化学习(RL)训练流程。首先通过轻量化的Long-CoT(长序列链式思考)SFT(有监督微调)训练,赋予基础模型多样化的思考能力;随后采用可验证奖励的RLVR(强化学习可验证奖励)技术,持续激发模型的推理潜能;最后通过强化学习人类反馈(RLHF)阶段,进一步增强模型的通用智能水平。这种系统化的训练方案为模型能力的突破提供了有力保障。
特别值得一提的是,蚂蚁百灵团队秉持开放精神,将Ring-flash-2.0的模型权重、强化学习训练方案以及完整的数据配方全部开源,为全球开发者和研究者提供了宝贵的资源。对这款强大模型感兴趣的用户,可以通过Hugging Face和ModelScope平台获取最新资料,开启探索之旅。随着AI技术的持续演进,Ring-flash-2.0无疑为未来智能应用开辟了无限可能,我们有理由期待它在各领域的创新突破。
模型获取地址:
https://huggingface.co/inclusionAI/Ring-flash-2.0
https://modelscope.cn/models/inclusionAI/Ring-flash-2.0