OpenAI o3横扫AI象棋赛夺冠 揭示通用模型真实棋力

在一场备受瞩目的人工智能国际象棋锦标赛中,OpenAI的o3模型以全胜战绩力压群雄,强势夺魁。这场赛事的特别之处在于参赛规则——所有AI模型都必须在未经专门象棋训练的情况下参赛,仅能通过赛前从互联网获取的基础国际象棋知识进行比赛。决赛阶段,o3与来自xAI的Grok4展开巅峰对决,最终以4-0的悬殊比分轻松取胜。更令人惊叹的是,o3在整个锦标赛期间始终保持完美记录,三场比赛均以4-0的比分横扫对手,甚至在半决赛中更是以压倒性优势击败了同为OpenAI开发的o4mini模型。

OpenAI o3横扫AI象棋赛夺冠 揭示通用模型真实棋力插图1

Grok4在晋级决赛的道路上同样表现出色,先后击败了Google的两个强劲对手——Gemini2.5Flash和Gemini2.5Pro。当时,埃隆·马斯克还颇具自信地表示,xAI团队”基本没在象棋上花功夫”,暗示Grok4的天然实力。然而,决赛的结果却让许多观察者大跌眼镜。国际象棋对弈网站Chess.com的总编辑Pedro Pinhata在赛后报道中写道:”直到半决赛,似乎没有什么能够阻止Grok4赢得比赛。但这种幻觉在比赛的最后一天破灭了。”担任解说嘉宾的国际象棋大师中村光在直播中直言不讳地指出:”Grok在比赛中犯了很多错误,但OpenAI没有。”这个简洁的评价道出了胜负的关键。

更有趣的是,世界排名第一的国际象棋大师芒努斯·卡尔森的点评。他表示,决赛中两个AI模型的棋力水平大约相当于刚学会规则的普通棋手,ELO等级分约为800分。作为对比,卡尔森本人的ELO达到2839分,排名第二的中村光也有2807分,两者之间的差距可谓天壤之别。卡尔森进一步分析了这些通用AI模型在象棋方面的局限性。他发现,这些模型的表现极不稳定,棋艺时好时坏。它们在计算吃棋子方面表现尚可,但在真正将死对手这一核心目标上却显得力不从心。”它们懂得物质优势,却不懂如何取胜,”卡尔森形象地比喻道,”这就好比擅长收集食材,却不会做饭一样。”

OpenAI o3横扫AI象棋赛夺冠 揭示通用模型真实棋力插图2

这场比赛的结果与专门设计的象棋AI形成了鲜明对比。回顾历史,1997年击败国际象棋大师加里·卡斯帕罗夫的超级电脑”深蓝”,以及2016年战胜韩国围棋九段李世石的AlphaGo,都是专门为棋类游戏量身打造的程序,拥有深度的领域知识和专业训练。事实上,通用AI模型在专业棋类领域的局限性早有先例。今年早些时候,在国际象棋大师Levy Rozman组织的另一场锦标赛中,Grok和ChatGPT都败给了专为国际象棋设计的人工智能系统Stockfish,进一步证实了通用模型与专业系统之间的实力差距。

这场AI象棋锦标赛不仅展示了当前通用人工智能模型的能力边界,也为我们理解AI在特定领域的表现提供了有价值的参考。尽管这些模型在语言理解和生成方面表现出色,但在需要深度战略思维和专业知识的领域,它们仍有很长的路要走。

OpenAI o3横扫AI象棋赛夺冠 揭示通用模型真实棋力插图3

最新快讯

2026年03月05日

17:03
微新创想:产业阵痛:AI 漫剧规模化生产的三大“大山” 2026 年,AI 漫剧(AI 生成式漫画剧集)已从短剧行业的边缘试验演变为爆发式风口。然而,随着生产规模的扩大,创作者们正面临前所未有的技术瓶颈。 多模型协同难:一部漫剧的诞生需要脚本、分镜、原画、配音等多个环节,涉及海内外数十个模型的联调,接口维护成本极高。 延迟与成本:传统云端处理导致的高延迟...
17:03
微新创想:3月5日,阿里巴巴内部围绕通义千问团队的人事调整出现关键进展。阿里巴巴CEO吴泳铭通过内部邮件宣布,集团已正式批准林俊旸辞去相关职务,并同步决定成立“基础模型支持小组”以加强集团层面对大模型研发资源的统一协调与支持。此次组织调整被视为阿里在大模型研发体系中的一次结构性优化,旨在提升基础模型研发效率并强化内部协同能力。 微新创想:同一时间,围绕顶尖A...
17:03
微新创想:当 AI 聊天机器人开始扮演“全能医生”和“金牌律师”时 法律的紧箍咒也随之而来 美国纽约州立法机构正在审议一项代号为 S7263 的法案 旨在禁止 AI 聊天机器人向公众提供实质性的法律或医疗建议 该法案由纽约州参议院互联网与技术委员会推动 核心矛头直指那些可能涉及“无证执业”的 AI 系统 法案规定 AI 聊天机器人严禁假扮持证专业人士(如医生...
16:50
微新创想:全球最大的卡路里追踪平台 MyFitnessPal 正式宣布,已完成对后起之秀 Cal AI 的收购。CalAI,这个由高中生 Zach Yadegari 发起的创业项目也迎来阶段性的结局,收购后,产品仍将独立运营,Zach Yadegari 在内7名成员均将加入 MyFitnessPal。虽然收购金额尚未披露,但结合 Cal AI 的漂亮数据表现...
16:50
微新创想:2026年短剧赛道迎来首个“漫剧春节档” 《西游,错把玉帝当亲爹》《大小姐,你把恶魔执事调成啥了》等多部漫剧作品强势破圈 不仅创下惊人播放数据 更标志着漫剧从“小众赛道”正式走向大众视野 完成了从“陪跑”到“主角”的身份转变 这场爆火并非偶然 背后是漫剧行业的持续迭代升级 而百度、美团等大厂还在争相入场 漫剧赛道将迎来全新的竞争与发展格局 同时...
16:50
声明:本文来自于微信公众号 窄播,作者:张果,授权站长之家转载发布。作为开年最重要的关键节点,38大促历来是品牌增长策略的试金石。越来越多品牌意识到,过去大水漫灌式的投放与种草模式,已难以适配当下的市场环境,不仅难以触达精准人群,还带来居高不下的CPC(点击成本)。美妆行业是最典型的缩影。以海外小众品牌Murad所处的「抗老」赛...
16:50
微新创想:小米17系列自去年9月发布以来持续引发关注,该系列包括小米17、小米17 Pro和小米17 Pro Max三款机型。随着12月年度影像旗舰小米17 Ultra的亮相,小米数字系列的产品线进一步丰富。近日,有关小米17系列第五款成员的消息再度升温,这款机型被命名为小米17 Max,预计将在5月正式登场。作为小米首款Max高端旗舰,小米17 Max将带...
16:50
微新创想:全国人大代表,海尔集团公司董事局主席、首席执行官周云杰近日回应了去年因走红而与海尔高管集体开通自媒体账号一事。他表示,自己开设自媒体并非为了追逐流量,而是希望通过这种方式更贴近用户,深入了解市场需求,从而推动企业的持续变革。 过去一年,周云杰认真投入内容创作,个人账号几乎每周都有更新。他坦言,如今已经习惯了在日常生活中偶尔被认出的状态。不过,他强调...
16:50
微新创想:2026年3月,上海钜蛟光电科技有限公司宣布完成近千万元人民币天使轮融资,投资方为六禾创投。此次融资标志着公司在智能光学三维成像与检测技术领域迈出了重要的一步。 该公司成立于2024年,专注于智能光学三维成像与检测技术的研发。凭借先进的技术理念和创新的解决方案,公司迅速在行业内崭露头角。其核心产品涵盖数字空间光调制器、高性能DLP模组及系统,广泛应...
16:50
微新创想:2026年3月5日,超融合架构解决方案提供商焱融科技宣布完成近亿元C轮融资,投资方为北京信息产业发展投资基金。此次融资标志着焱融科技在企业级数据基础设施领域迈出了重要一步,进一步巩固了其在行业内的领先地位。 公司总部位于北京,专注于软件定义数据中心技术研发,产品覆盖超融合存储、私有云及云桌面,广泛应用于金融、交通、教育等领域。焱融科技凭借其先进的技...
16:50
微新创想:2026年3月5日,法国运动用品零售商迪卡侬宣布与可穿戴智能安全气囊技术企业Inmotion达成战略合作。双方将在全球市场联合推出两款旗舰级智能安全气囊产品,主要面向骑行、滑雪等高风险运动场景。 此次合作旨在通过实时碰撞感应与毫秒级充气响应技术,提升运动者主动安全防护能力。Inmotion的先进技术能够精准识别潜在危险,为用户提供及时有效的保护。 ...
16:50
微新创想:3月5日,韩国LG CNS宣布推出模块化数据中心解决方案AI Box。该方案无需独立建筑,部署周期由传统2年缩短至6个月。AI Box由电气与算力单元组成,单模块支持1.2MW IT负载及最多576块GPU,集成LG电子CDU、LG新能源UPS等集团内组件。 首期试点将在韩国釜山约2.7万平方米场地部署50套系统,以加速AI基础设施建设。这一创新方...