在2025年国际大学生程序设计竞赛(ICPC)世界总决赛中,OpenAI的AI系统创造了历史性突破,以全对成绩成功解决全部12个编程难题,不仅超越了人类参赛选手,更在性能上超越了谷歌DeepMind的顶尖模型。OpenAI官方明确表示,若该系统以人类团队身份参赛,夺冠毫无悬念。
该AI系统在竞赛中完全遵循标准规则,通过标准PDF格式获取题目,在5小时限时内提交解决方案,所有提交均直接对接官方评审系统,与人类队伍的解题过程同步进行。OpenAI特别强调,整个比赛期间系统未进行任何特殊优化或调整,其表现完全基于模型的固有能力。
然而,谷歌DeepMind并未甘居人后。不久后,DeepMind宣布其升级版Gemini 2.5 Deep Think系统在相同比赛中取得了金牌水平,成功攻克了10个问题,其中包括人类队伍未能解决的C题。尽管Gemini在剩余两个问题上未能成功,但其表现已十分亮眼。但与OpenAI系统的完美12/12成绩相比,仍存在明显差距。
OpenAI对系统的架构进行了详细解读:这是一个由多个通用推理模型组成的集成体,并未针对ICPC进行专项训练。系统核心由GPT-5和一款内部实验性推理模型构成。其中,GPT-5为11个问题提供了正确答案,而实验性模型则负责筛选并提交最终方案。最后一个也是最棘手的难题,由实验模型独立攻克,该过程经历了九次提交才最终被系统接受。反观表现最佳的人类团队,仅解决了11个问题。
这一成就充分证明了复杂模型在深度推理和长时间计算能力方面的巨大潜力。GPT-5在任务中发挥了主导作用,进一步巩固了其作为当前公众可用的最强AI模型之一的地位。OpenAI将这一胜利视为持续进步的成果,其模型此前已在国际数学奥林匹克和国际信息学奥林匹克等权威学术竞赛中斩获金牌。
项目参与者穆斯塔法·罗哈尼贾德表示,ICPC的表现是团队成功系列的完美收官,并突显了系统的多功能性。他补充道,下一步将致力于开发能够自主发现新知识的AI系统,这将被视为人工智能发展的真正里程碑。
🏆 OpenAI的AI系统在2025年ICPC总决赛中完美解决所有12个问题,超越人类选手和谷歌DeepMind。
🤖 系统结合GPT-5和实验性模型,展现了其在复杂推理任务中的卓越能力。
📈 OpenAI将此胜利视为AI能力提升的标志,未来将持续探索新知识的发现。