
字节跳动旗下 Seed AI 团队近日传来重大突破,其自主研发的数学推理模型 Seed Prover1.5 在国际数学奥林匹克(IMO)比赛中斩获金牌,以35分的优异成绩达到金牌标准,这一成就标志着人工智能在数学领域取得了里程碑式的进展。Seed Prover1.5 基于先进的 Scaling Law 理论,在16.5小时内成功攻克IMO2025的前五道题目,仅失手于最后一题,其表现与谷歌 Gemini 并列顶尖,远超字节此前模型的效率——后者完成四道题需耗时三天且仅获银牌。这一突破不仅刷新了AI数学推理的纪录,更确立了Seed Prover1.5作为行业新标杆的地位。

Seed Prover1.5的卓越表现源于其创新的技术架构,核心在于大规模强化学习的深度应用。通过持续训练,模型证明题目的成功率从50%大幅提升至近90%,这一跨越式的进步充分展现了AI在复杂逻辑推理中的潜力。更令人瞩目的是,Seed Prover1.5还在北美数学竞赛Putnam中刷新了历史最佳成绩,进一步印证了其超凡的解题能力。
技术报告揭示了Seed Prover1.5两项关键创新:Agentic Prover与Sketch Model。Agentic Prover采用全新的形式化数学推理范式,借助Lean等形式语言实现可验证的证明过程。相较于传统自然语言推理,该方法更为严谨但也更具挑战性。为攻克这一难题,Seed Prover1.5设计了多工具调用机制,可实时检索Lean数学库Mathlib或编写Python脚本辅助计算,确保推理过程的准确性与高效性。而Sketch Model则模拟人类数学家的解题思维,允许模型先完成非正式的证明草稿,系统会自动生成关键引理与逻辑框架,再转化为形式化证明。通过混合奖励信号的强化学习策略,Sketch Model既提升了整体逻辑规划能力,又显著降低了复杂问题的求解难度。

Seed Prover1.5的成功不仅彰显了字节跳动在AI数学推理领域的研发实力,更为未来数学研究开辟了新路径。该模型在算法设计、工具整合与学习策略上的创新,为AI辅助数学教育提供了宝贵参考。论文完整版已发布于arxiv,链接:https://arxiv.org/pdf/2512.17260
