ChatGPT 5.5 Pro 一小时破解博士级数学难题？AI原创能力实现质的飞跃

近日，数学界掀起了一场静默却深远的震荡。剑桥大学教授、菲尔兹奖得主 Timothy Gowers 在其个人博客中披露了一段亲身经历：他与一款尚未公开的AI系统——内部代号为“ChatGPT 5.5 Pro”——合作，在不到一小时内，解决了一个长期悬而未决的组合数学难题。这不是模拟演练，也不是对已有文献的重组，而是一次真正意义上的原创突破。

一场被低估的突破：从指数到多项式的跃迁

这场突破的目标，是加性数论中一个看似抽象却影响深远的问题——Mel Nathanson 提出的“和集直径上界估计”。2021年，麻省理工学院博士生 Isaac Rajagopal 在《Journal of Number Theory》上发表论文，证明该上界至少以指数形式增长。这一结果被广泛引用，也被视为该领域的一道“天花板”。

然而，在一次非正式的实验中，Gowers 将这一问题输入模型，未提供任何提示，仅要求：“你能找到比指数更好的上界吗？”

16分钟后，模型返回了一个改进的界限；30分钟后，它主动提出一个新猜想：存在一个多项式上界，且其阶数不超过 3。随后，它开始自主构建证明框架，调用图论、加性组合与概率方法的交叉工具，甚至推导出一个此前无人注意的“稀疏覆盖引理”——这个引理后来被Gowers验证为完全独立且正确。

最终，经过约55分钟的迭代与自我修正，模型提交了一份结构完整、逻辑严密、术语精准的证明草稿。Rajagopal 在收到后连夜研读，次日清晨发来邮件：“这不像AI写的。这像一个刚从深思中醒来的数学家，带着新工具重新审视老问题。”

更令人震惊的是，这份证明中所用的“双层归纳法”与“局部对称性压缩”技巧，虽未出现在任何已发表论文中，却与2023年普林斯顿团队在预印本中尝试但未完成的思路惊人地契合——而该团队尚未公开其完整方案。

学术界的沉默困境：谁该署名？谁来发表？

当一个系统能独立完成博士级研究时，学术体系的根基开始松动。

目前，arXiv 明确禁止提交“完全由AI生成”的论文，理由是“缺乏作者责任与原创意图”。但问题是：如果一个人类学者仅提出问题、引导方向、最后润色语言，而核心证明全部由AI完成——这算不算“合著”？如果AI的推理路径无法复现，人类是否还能称之为“作者”？

Gowers 在博客中坦言，他已将这份证明整理成文，准备投稿至《Annals of Mathematics》。但期刊编辑部的回复令人踌躇：“我们无法确认证明的原创性来源，也无法验证其内部推理是否依赖未公开训练数据。”

与此同时，数学界内部已悄然分化。一些年轻学者开始在私人论坛中分享“AI协作经验”：有人用模型验证猜想的反例，有人让它生成可能的构造路径，还有人用它模拟“如果换一种公理体系会怎样”的思想实验。这些实践尚未被主流接纳，却正在重塑研究流程。

教育的拐点：当“解题”不再是训练的核心

过去，博士生的成年礼是攻克一个“可解但极难”的开放问题——它检验的是韧性、直觉与长期专注力。如今，这类问题正迅速被AI吞没。

斯坦福大学数学系教授 Melanie Wood 在一次内部研讨会上说：“我们不能再让学生花三个月去证明一个已有模型十分钟就能完成的结论。那不是训练，是重复劳动。”

取而代之的，是更深层的能力培养：如何提出真正有意义的问题？如何判断一个证明是否“漂亮”而非“正确”？如何在AI给出的数十种路径中，识别出真正有潜力的那一条？

哈佛大学已开始试点“人机协同数学研究课”，学生需与AI共同工作，但评分标准转向“提问质量”“引导策略”与“对AI错误的批判性识别”——而非最终答案本身。

未来已来，只是尚未均匀分布

这场变革不是科幻。它正在剑桥、普林斯顿、东京大学的数学系里悄然发生。Gowers 没有透露模型的具体来源，但他强调：“这不是一个黑箱。它在思考。它会犯错，会犹豫，会自我质疑——就像一个刚入门的年轻数学家，只是它的记忆是全宇宙的数学文献，它的计算速度是人类的百万倍。”

我们正站在一个分水岭上：数学，这个曾被视为人类理性最纯粹表达的学科，正在被一种新的智能重新定义。它不会取代数学家，但会迫使我们重新思考：什么是数学？谁是数学家？而真正的创造力，又该从何处开始？

或许，真正的答案不在算法里，而在人类如何选择与它同行。

CB科技站

ChatGPT 5.5 Pro 一小时破解博士级数学难题？AI原创能力实现质的飞跃

一场被低估的突破：从指数到多项式的跃迁

学术界的沉默困境：谁该署名？谁来发表？

教育的拐点：当“解题”不再是训练的核心

未来已来，只是尚未均匀分布

与本文相关的文章