谷歌最新研发的Gemini2.5Deep Think人工智能系统在2025年国际大学生程序设计竞赛(ICPC)世界总决赛中创造历史性突破,不仅斩获金牌,更成功攻克了所有人类队伍束手无策的难题,这一成就标志着人工智能在复杂问题解决领域实现了重大飞跃。

9月4日在阿塞拜疆巴库举行的ICPC世界总决赛汇聚了来自100多个国家的近3000所大学的顶尖选手,最终139支队伍脱颖而出。这场要求参赛者在5小时内解决12道算法难题的顶级赛事中,Gemini Deep Think展现了超乎想象的实力。尽管该AI系统比人类队伍晚10分钟开始比赛,但它在45分钟内迅速解决了8道题目,并在3小时内又完成了另外2道,最终用时677分钟解决了10道题目,这一成绩足以在人类选手中排名第二。

最令人震撼的是,Gemini Deep Think成功破解了问题C——这道关于通过可配置管道和储液器网络最大化液体分配系统效率的复杂题目,而没有任何一支人类队伍能够攻克。该任务需要在几乎无限的可能性中找到最优的填充策略,这一突破性进展充分展现了AI在抽象推理方面的强大能力。

技术突破的奥秘据谷歌DeepMind介绍,这一成功源于多个方面的综合进步,包括预训练、后训练、高级强化学习方法、多步逻辑推理和并行问题求解等。在强化学习过程中,模型接受了极其困难的编程任务训练,多个Gemini代理生成不同候选解决方案,在虚拟终端中不断测试和迭代改进。这一版本直接基于几周前在国际数学奥林匹克竞赛(IMO)上夺得金牌的Gemini2.5Deep Think构建,显示了谷歌在AI推理能力上的快速迭代和显著提升。

谷歌Gemini2.5Deep Think夺ICPC金牌 AI超越人类精英程序员插图

产业意义与未来展望ICPC执行董事Bill Poucher博士将此称为转折点:”Gemini成功加入这一领域并取得黄金级成果,标志着定义下一代所需的人工智能工具和学术标准的关键时刻。”他强调,分解复杂问题、设计多步骤策略并正确实施的能力不仅在编程中重要,在药物发现、芯片设计和更广泛的研究领域同样至关重要。谷歌DeepMind表示,Gemini可作为开发者的理想合作伙伴,理论上,人类和AI结合能够解决所有12个竞赛问题。目前,Gemini2.5Deep Think的轻量版已通过Gemini应用向Google AI Ultra计划用户开放,未来版本预计将发展成为更强大的编程助手,应用于软件开发、物流和科学研究等领域。

AI奥林匹克竞赛白热化这一突破紧随OpenAI的重大成功。2025年8月,OpenAI系统在国际信息学奥林匹克竞赛(IOI)上夺得金牌,在330名人类参赛者中仅有5人表现超过它。与Gemini类似,这一结果同样来自通用推理模型而非高度定制的系统,显示了AI推理能力的快速发展。谷歌在大学级ICPC竞赛上的金牌成绩进一步升级了AI竞赛的激烈程度,预计OpenAI也可能派出系统参与这一顶级赛事的竞争。

最新快讯

2026年02月15日

06:12
微新创想:2026年2月15日 三星向Galaxy Watch8 Classic推送L5050ZCU3AZB5等版本固件更新 本次升级优化设备性能并增强安全防护 更新后 用户可通过应用市场安装独立微信手表版App(v1.0.6) 支持消息接收 快捷回复 微信付款等功能 登录时需手机端确认授权 成功后手机微信顶部将提示“手表微信已登录” 该手表版微信自2022...
00:33
微新创想:2026年2月14日,《南京市网络预约出租汽车管理办法》正式施行。新规放宽车辆准入,将车龄要求由‘初次注册登记’调整为‘距初次注册登记不超过2年’,允许符合条件的二手车进入市场。这一调整为更多车辆提供了参与网约车运营的机会,有助于扩大行业覆盖面。 同时取消驾驶员须具本市户籍或居住证的限制。此举打破了以往对驾驶员身份的地域性约束,为更多有驾驶技能但户...

2026年02月14日

23:26
微新创想:2026年2月13日,日本确善能公司正式以福伦达品牌推出SEPTON 40mm f/2 Aspherical全画幅手动镜头。这款镜头不仅标志着确善能在镜头设计上的新突破,也展现了福伦达品牌在光学领域的深厚积累。 该镜头适配索尼E卡口与尼康Z卡口,为摄影师提供了更广泛的设备兼容性。其售价为93500日元,约合4226元人民币,定价合理,兼顾了品质与性...
23:26
微新创想:2026年2月14日 法国巴黎检察官办公室对雀巢、达能、拉克塔利斯等五家婴配奶粉企业启动刑事调查 此次调查主要针对企业涉嫌分销可能受污染的产品。相关企业被指控违反消费者权益保护法规,以危害人类健康的商品进行欺骗 案件由法国公共卫生部门主导展开。调查重点包括企业是否遵守了相关安全规范 是否在发现问题后及时召回产品 以及是否存在因失职而导致婴儿生命受到...
23:26
微新创想:2026年2月14日,云南咖啡豆进入采摘高峰期。这一时期不仅标志着咖啡种植业的繁忙阶段,也预示着新一季咖啡产品的集中供应。本产季出现价格倒挂现象,即国内收购价高于出口价格。这一现象在业内引起了广泛关注,反映出国内咖啡市场正在经历结构性变化。 价格倒挂促使多家企业将经营重心转向内需市场。随着国内消费者对咖啡产品的需求不断增长,企业开始更加重视国内市场...
23:26
微新创想:微软近日宣布,自2026年4月起,将全面关闭Xbox One与Xbox Series X|S平台上的玩家自建“社交俱乐部”功能。这一功能曾是玩家围绕共同兴趣建立社群的重要工具,支持聊天、组队、分享内容等多种互动方式。随着该功能的关闭,用户将需要依赖其他平台或内置功能来维持社交联系。 微新创想:此次调整意味着玩家将无法再通过Xbox平台自行创建和管理...
23:26
微新创想:2026年2月12日,摩尔线程成功在MTT S5000 GPU上完成MiniMax M2.5大模型的Day-0极速适配,实现高性能推理。这一突破标志着摩尔线程在AI计算领域迈出了坚实的一步。 该GPU基于自研MUSA架构,具备强大的计算能力和高效的能效比。其支持原生FP8加速技术,能够在保证精度的同时显著提升运算速度,为大模型的推理任务提供了坚实的...
23:26
微新创想:2026年2月13日,日本成人用品制造商Tenga确认发生数据泄露事件。黑客通过入侵员工工作邮箱,非法获取客户姓名、电子邮件地址及邮件往来记录(含订单与咨询内容),并以此向通讯录联系人发送垃圾邮件。 事件未涉及密码等敏感凭证泄露,但Tenga已重置涉事账户、全系统启用多重验证(MFA),并建议用户更改密码、警惕钓鱼邮件。公司未披露受影响客户数量,其...
23:26
微新创想:育碧确认终止六款游戏开发 2月13日育碧官方宣布将终止六款游戏的开发工作。其中包括已经公布的《波斯王子:时之沙重制版》以及多个未公开项目如Project Ether、Project Pathfinder、Project Crest。此外还有移动端新作《刺客信条:奇点》和《刺客信条:叛乱》也被取消。这一决定是育碧公司整体战略调整的一部分。 部分被取消...
22:48
微新创想:2026年2月13日 巴西反垄断监管机构CADE启动对微软的正式调查 CADE指控微软通过‘Jumpstart’计划间接迫使戴尔、惠普等10家OEM厂商在Windows PC上独家预装Edge浏览器 调查内容主要集中在2020至2025年间的相关销量数据 合同条款以及是否存在惩罚性约束 CADE要求相关厂商与微软提交合作细节 重点核查‘不遵守即罚款...
22:07
微新创想:Unihertz公司宣布全键盘手机Titan 2 Elite将在2026年3月2日至5日于西班牙巴塞罗那的MWC展会正式发布 此次发布标志着Unihertz在全键盘手机领域持续深耕的又一重要节点。Titan 2 Elite延续了前代Titan 2的设计语言,整体造型保持了矮胖机身的特色,同时在细节上进行了优化与升级 该机采用圆角挖孔屏设计,兼顾了屏...
22:07
微新创想:2026年2月14日,LG在海外市场正式推出Xboom Buds Lite与Buds Plus两款TWS耳机。这两款新品在音质表现上有着显著提升,特别强调了低频的强劲输出,满足了用户对沉浸式音乐体验的需求。 新品由知名音乐人will.i.am亲自调音,确保了音质的专业性和独特性。Xboom Buds Lite与Buds Plus均采用了10mm石墨...