ChatGPT 5.5 Pro 一小时破解博士级数学难题展现惊人能力

微新创想:近日,剑桥大学数学教授、菲尔兹奖得主 Timothy Gowers 在其博客中分享了他使用尚未公开的 ChatGPT 5.5 Pro 进行数学研究的经历。这款 AI 模型在短短一小时内成功解决了一个组合数学领域的开放性问题,引发了学术界对 AI 数学能力的新一轮关注。

Gowers 教授指出,随着 AI 技术的发展,大语言模型在数学领域的应用经历了显著的变化。早期人们对其能力存在疑虑,认为它只能寻找已知答案或简单推导结果。然而,Gowers 的实验显示,ChatGPT 5.5 Pro 具备了更为独特的能力,能够识别人类数学家可能忽略的简洁论证,并在缺乏完整理论框架的情况下构建原创性的证明思路。

ChatGPT 5.5 Pro 一小时破解博士级数学难题展现惊人能力插图1

此次研究的对象是来自数学家 Mel Nathanson 的一项问题,该问题涉及加性数论中的和集直径上界的估计。Gowers 在引导下,ChatGPT 5.5 Pro 经过多次尝试,从最初的指数上界逐步改进到多项式上界,最终在一个小时内完成了完整的证明。

MIT 本科生 Isaac Rajagopal 在审阅后表示,该证明几乎肯定是正确的,且在核心思想上同样可靠。Gowers 还提出了一个重要的学术伦理问题,即如何处理这些 AI 生成的数学成果。尽管 ChatGPT 的工作已达到了发表标准,但其投稿至传统期刊似乎并不适合,因而建议建立专门的 AI 数学成果仓库,由人类数学家进行审核。

这一变化可能对数学教育、研究生培养及学术评价体系产生深远影响。

最新快讯

2026年05月09日

17:16
微新创想:5月9日,上汽奥迪在AUDI E7X预售发布会上,营销事业副总经理谢施奇公开批评行业刷圈速乱象。他指出,部分品牌使用特调改装车——更换轮胎、改造悬挂、定制软件,以虚假赛道成绩误导消费者。强调用户实际交付车辆无法复现此类性能。 同日,AUDI E7X正式开启预售。新车起售价为28.98万元,展现出强大的市场竞争力。在性能方面,AUDI E7X具备出色...
17:16
微新创想:2026年5月,佛山季华驱界科技有限公司成功完成数千万元天使轮融资,由粤科集团担任领投方。此次融资为公司的发展注入了强劲动力,标志着其在国产机器人底层硬件领域迈出了重要的产业化步伐。 公司专注于具身智能赛道,致力于机器人核心运动执行部件的研发与创新。作为机器人技术的重要组成部分,这些关键部件对于提升机器人性能和应用范围具有决定性作用。季华驱界科技凭...
17:16
微新创想:2026年5月9日,洋河股份通过官方微信号发布声明。针对近期部分网络账号在微信、抖音、今日头条等平台编造传播“酒质缺陷”“工厂被污染”等虚假信息,并恶意扩散发酵的行为,公司已对涉事抖音账号“缘*”“天*”“武**”及今日头条账号“认真***”“淮扬***”“放松***”完成证据保全。 此举严重误导消费者,损害企业声誉。洋河股份强调,对于任何不实言论...
17:11
微新创想:游戏赛道,又有了微妙的变化。此前,仅仅零星的游戏厂商尝鲜AI漫剧,进入2026年之后,越来越多的游戏厂商选择加码AI漫剧,一场围绕注意力的争夺战正在酝酿。这意味着,AI漫剧成为游戏厂商的新战场。 游戏厂商,为何集体青睐AI漫剧?拥抱AI漫剧,是想分一杯羹还是另有所图?“游戏+AI漫剧”的打法,未来还面临怎样的挑战?从心生警惕到主动拥抱,对AI漫剧这...
17:11
微新创想:5月6日杨洋新剧《雨霖铃》的看片会上,制片人侯鸿亮谈及打戏时表示:“在今天这个AI时代,恐怕也是最后一次这样手搓了。”这句话迅速引发热议,正午阳光的第一部武侠剧,也成为了“手搓武侠”的代名词。随着整个4月影视行业对AI的激情鼓吹,大众的逆反情绪也逐渐转向了对AI的反向造神。 “手搓红利”在5月开始显现。无论是民间自制的手搓爆款《吉时已到》《Enem...
17:11
微新创想:不久前,一款名为おぢポ的散步锻炼应用在日本非游戏应用下载总榜中位列前三,引发了市场的广泛关注。类似的爬榜现象也出现在韩国和美国市场,散步类应用正迎来季节性的下载高峰。然而,下载量的上升并未带来收入的增长。据观察,おぢポ在流水表现上几乎为零,这并非个例。散步应用长期处于“有人用,没人付费”的尴尬境地。但「WalkFit」却是一个例外,其月流水曾高达1...
17:11
微新创想:近日数学界发生了一件足以载入史册的轶事。剑桥大学教授、菲尔兹奖得主 Timothy Gowers 在其个人博客中分享了一段令人震撼的经历。他利用尚未公开发布的 ChatGPT 5.5 Pro,在短短一小时内攻克了一个困扰数学界已久的组合数学开放性问题。这一突破不仅展示了人工智能在数学研究中的潜力,也引发了广泛讨论。 长期以来,学术界对大模型处理高深...
17:11
微新创想:马斯克与OpenAI之间的法律博弈近日在美国加利福尼亚州奥克兰法院正式开启庭审,这场诉讼已然进入白热化阶段。庭审期间,OpenAI联合创始人兼总裁格雷戈里·布罗克曼(Gregory Brockman)连续两天出庭作证。值得关注的是,他在公司创立初期的私人日记被作为关键证据当庭出示,为外界勾勒出这家AI巨头早期鲜为人知的权力角逐与战略转型细节。 根据...
16:46
微新创想:2026年5月,易点天下公布其Agentic AI工程化实践成果。公司通过上下文工程、多云基础设施与分层安全治理体系,推动AI Agent在企业场景规模化落地。 微新创想:其六层上下文体系涵盖会话记忆、短期与长期记忆、知识图谱、经验库及组织技能库,并支持主动注入机制,在敏感操作前自动调取历史信息与风险数据。 微新创想:同时采用分层Token治理与渐...
16:46
微新创想:5月9日,市场人士向财联社证实,阿里巴巴与DeepSeek近期并未就投资或合作事项展开谈判。此前有传言称4月DeepSeek启动巨额融资,腾讯与阿里均参与接洽,且双方‘谈崩’。但知情人士明确表示,阿里方面实际未介入相关谈判。 该消息源于市场误传,目前DeepSeek融资进程仍在独立推进中,具体投资方尚未官宣。阿里巴巴作为中国互联网行业的领军企业,一...
16:46
微新创想:2026年5月9日,百度正式发布文心大模型5.1。该模型采用“多维弹性预训练”技术,显著降低了预训练成本,仅为同规模模型的约6%。基础性能达到国内领先水平,并在LMArena搜索榜中位列国内第一。 微新创想:在多个关键维度上,文心大模型5.1表现突出。智能体(Agent)能力得到明显提升,展现出更强的自主决策与任务执行能力。同时,模型在知识理解、逻...
16:46
微新创想:5月9日,第二届空天信息技术大会在北京顺利召开。此次大会汇聚了来自全国各地的百余家企业与科研机构,共同探讨空天信息技术的最新发展与未来趋势。作为大会的重要成果之一,中科曙光联合中国科学院空天信息创新研究院、中科星图等单位正式发布了《共建“太空云”生态倡议书》。 该倡议书旨在推动天基信息服务系统的建设与优化,通过构建开放、可扩展的“太空云”服务平台,...