OpenAI AI系统在ICPC大赛中完美夺冠击败人类谷歌

在2025年国际大学生程序设计竞赛(ICPC)世界总决赛中,OpenAI的AI系统创造了历史性突破,以全对成绩成功解决全部12个编程难题,不仅超越了人类参赛选手,更在性能上超越了谷歌DeepMind的顶尖模型。OpenAI官方明确表示,若该系统以人类团队身份参赛,夺冠毫无悬念。

该AI系统在竞赛中完全遵循标准规则,通过标准PDF格式获取题目,在5小时限时内提交解决方案,所有提交均直接对接官方评审系统,与人类队伍的解题过程同步进行。OpenAI特别强调,整个比赛期间系统未进行任何特殊优化或调整,其表现完全基于模型的固有能力。

然而,谷歌DeepMind并未甘居人后。不久后,DeepMind宣布其升级版Gemini 2.5 Deep Think系统在相同比赛中取得了金牌水平,成功攻克了10个问题,其中包括人类队伍未能解决的C题。尽管Gemini在剩余两个问题上未能成功,但其表现已十分亮眼。但与OpenAI系统的完美12/12成绩相比,仍存在明显差距。

OpenAI对系统的架构进行了详细解读:这是一个由多个通用推理模型组成的集成体,并未针对ICPC进行专项训练。系统核心由GPT-5和一款内部实验性推理模型构成。其中,GPT-5为11个问题提供了正确答案,而实验性模型则负责筛选并提交最终方案。最后一个也是最棘手的难题,由实验模型独立攻克,该过程经历了九次提交才最终被系统接受。反观表现最佳的人类团队,仅解决了11个问题。

OpenAI AI系统在ICPC大赛中完美夺冠击败人类谷歌插图1

这一成就充分证明了复杂模型在深度推理和长时间计算能力方面的巨大潜力。GPT-5在任务中发挥了主导作用,进一步巩固了其作为当前公众可用的最强AI模型之一的地位。OpenAI将这一胜利视为持续进步的成果,其模型此前已在国际数学奥林匹克和国际信息学奥林匹克等权威学术竞赛中斩获金牌。

项目参与者穆斯塔法·罗哈尼贾德表示,ICPC的表现是团队成功系列的完美收官,并突显了系统的多功能性。他补充道,下一步将致力于开发能够自主发现新知识的AI系统,这将被视为人工智能发展的真正里程碑。

🏆 OpenAI的AI系统在2025年ICPC总决赛中完美解决所有12个问题,超越人类选手和谷歌DeepMind。
🤖 系统结合GPT-5和实验性模型,展现了其在复杂推理任务中的卓越能力。
📈 OpenAI将此胜利视为AI能力提升的标志,未来将持续探索新知识的发现。

最新快讯

2025年09月18日

14:13
GPT-5发布后不久,OpenAI却出人意料地决定让GPT-4o等前代模型“复活”,这一决策背后隐藏着用户对旧模型的深厚情感。当GPT-4o被下线时,许多用户表现出强烈的失落感,仿佛失去了一位熟悉的伙伴,这种情感反应远超OpenAI的预期。在最近的一次采访中,OpenAI首席产品官Nick Turley深入剖析了这一现象,坦言GPT-5的发布并未达到预期效果...
14:13
近日,OpenAI高级副总裁Nick Turley在一场深度访谈中坦诚,公司在推出GPT-5模型时遭遇了意想不到的舆论风波。他透露,这场风波的根源在于OpenAI未能制定周密的过渡方案,同时严重低估了用户对GPT-4o形成的情感纽带。作为ChatGPT产品负责人,Turley强调,当前OpenAI面临的最大挑战是如何妥善处理用户与AI模型之间日益增强的"人格...
14:13
科技媒体The Verge最新报道,微软即将随新一代Xbox Ally掌机在下月正式发布全新的Xbox全屏体验功能。不过令人惊喜的是,已有技术爱好者发现这一创新模式并非遥不可及,他们成功在搭载Windows 11 25H2预览版的多款设备上提前体验。通过专业工具ViVeTool的辅助以及精巧的注册表调整,包括微星Claw、华硕ROG Ally等备受关注的便携...
14:13
Synthesize生物医学发现软件开发商近日宣布成功斩获1000万美元种子轮融资,投资方阵容强大,涵盖AI2 Incubator、Point Field Partners等知名机构。这家创新企业专注于将人工智能技术深度应用于生物数据生成与分析领域,通过革命性技术手段将传统耗时数月的科研流程压缩至短短几分钟内完成,极大地降低了科研时间与资源成本。Synthe...
14:13
2025年9月18日,备受瞩目的中国国际城市轨道交通展览会于山东青岛盛大开幕。展会现场,我国首列自主研发的中国标准智能市域列车震撼亮相,引发全场关注。这款时速高达200公里的市域D型车不仅代表了我国轨道交通技术的最新成就,更以其GoA4级全自动驾驶技术,成为全国首列、全球最快的全自动运行轨道车辆,树立了行业新标杆。 该列车在技术创新上实现了多项突破,全面融合...
14:11
近日,演员谢孟伟(网名“嘎子哥”)因直播带货时身着警服的违规行为,引发社会广泛关注并最终受到行政处罚。据悉,谢孟伟在云南拍摄电影期间,利用网络直播平台进行带货活动,期间公然穿着带有警察肩章和臂章的人民警察制式服装,这一行为迅速触发了大量网友的举报。与此同时,谢孟伟在快手平台上的账号也因该事件遭到封禁。9月18日,“嘎子哥”的快手账号已被平台正式封禁,彻底无法...
14:11
近期,蜜雪冰城多地区门店柠檬水出现暂时性缺货,引发广泛关注。不少消费者反映,部分门店柠檬水及相关饮品如柠檬奶等供应紧张,甚至出现排队"抢货"现象。面对这一情况,蜜雪冰城迅速作出回应,展现出高度的责任感。 蜜雪冰城相关人士透露,目前公司柠檬整体储备充足,大量进口柠檬即将到港,同时储存的柠檬已通过严格质量评测,完全符合使用标准,并将陆续下发至各门店。该人士强调,...
14:11
微新创想9月18日重磅报道,备受瞩目的iPhone 17 Pro及iPhone 17 Pro Max终于解除了评测禁令,其搭载的A19 Pro芯片性能表现成为业界焦点。极客湾率先对iPhone 17系列进行了全面测试,通过多款3A级游戏的帧率对比,揭示了A19 Pro在性能上的惊人突破,大幅超越了苹果前代A18 Pro与A17 Pro芯片。 在实测数据中,A...
13:41
央视新闻报道,我国自主研发的首列中国标准智能市域列车在山东青岛举办的2025中国国际城市轨道交通展览会上惊艳亮相。这款时速200公里的市域D型车不仅代表了我国轨道交通技术的最新成就,更以其GoA4级全自动驾驶技术,刷新了全球最快全自动运行轨道车辆的纪录。 该列车通过深度融合数字孪生技术与先进AI算法,实现了智能运维与高效故障预警功能。这一创新技术的应用,...
13:41
2025年9月18日,重庆润生药业传来振奋人心的消息,其自主研发的丙酸氟替卡松吸入粉雾剂正式获批上市。这款创新药物作为国内首款同类吸入粉雾剂,专用于哮喘治疗,凭借其卓越的疗效、便捷的使用方式和高度的安全性,为哮喘患者带来了全新的治疗选择。该产品在重庆两江新区完成研发,不仅彰显了润生药业在高端吸入制剂领域的雄厚实力,更标志着企业在该领域实现了重大技术突破。此次...
13:41
2025年9月18日,备受瞩目的中国—东盟人工智能部长圆桌会议在广西南宁隆重举行。此次盛会由中国国家发展改革委携手广西壮族自治区人民政府联合主办,不仅标志着中国与东盟国家在人工智能领域合作迈入新阶段,更正式宣布启动建设中国—东盟国家人工智能应用合作中心这一里程碑项目。会议期间,与会各方就夯实人工智能发展基础、推动开源服务共享、深化产业精准对接以及优化人才培养...
13:41
智界产品总监近日正式宣布,搭载前沿ADS 4.0智能驾驶系统的最新版本已完成备案,即将全面启动推送工作。根据可靠渠道提供的用户群聊截图,此次升级计划于本周五正式启动,预计在9月23日实现全量覆盖。该消息来源权威可信,与总监此前公开披露的信息高度吻合,充分验证了升级计划的严肃性和执行力。 作为鸿蒙智行生态的重要组成部分,旗下多品牌正同步推进ADS 4.0系统的...