最新消息:关注人工智能 AI赋能新媒体运营

ChatGPT-5.2 首次独立证明数学猜想,开创“氛围证明”新范式

科技资讯 admin 浏览

AI首次独立完成数学证明,数学界震动

近日,比利时布鲁塞尔自由大学(VUB)发布了一项引发全球数学界关注的成果:一个商用大语言模型在没有人类直接干预的情况下,独立推导出一个此前悬而未决的数学猜想的完整证明。该猜想由数学家Ran与Teng于2024年提出,涉及组合数论中关于稀疏序列分布的深层结构,此前已困扰领域内多位专家近两年。

参与实验的模型是OpenAI最新推出的推理增强版本——ChatGPT-5.2(Thinking),它在7轮自主对话中不断修正、迭代,最终生成了一套逻辑严密、结构清晰的证明,其核心思路甚至超越了人类研究者曾尝试过的几种主流路径。尽管最终由VUB团队的数学家进行了人工复核与格式规范化,但整个证明的骨架、关键引理和推理链条,完全由AI自主构建。

这一成果并非偶然。研究团队在近三个月内重复实验十余次,结果稳定重现。在多个独立测试中,该模型成功在未接触过相关文献的情况下,重新“发现”了已被证明的定理,并在新问题上给出原创性解法。数学家们普遍认为,这是AI首次在纯理论数学领域实现“从零到一”的突破。

机器人比赛 答题 数学

图源备注:图片由AI生成,图片授权服务商Midjourney

“氛围证明”:不是巧合,而是新方法的诞生

研究团队将这种AI主导的推理模式称为“vibe-proving”——中文可译为“直觉式证明”。这个词并非调侃,而是对一种新工作方式的正式命名。它不同于传统“提示-回答”模式,也不是简单的模式匹配。AI在对话中展现出类似人类数学家的“试错—顿悟—重构”过程:它会主动质疑自己的前提、提出反例、调整符号系统,甚至在某次迭代中自行引入了一个此前未被文献记载的中间引理。

“我们以为它会复制已知证明,”参与项目的VUB博士后研究员Lena De Vos说,“但它给出的证明路径,我们从未在任何论文或预印本中见过。它用了一种更简洁的归纳方式,把三个看似无关的数列性质,用一个统一的递归结构串联起来。”

这套证明最终被整理成一篇12页的论文,已提交至arXiv预印本平台,作者署名为“VUB Research Group + AI Collaborator”。这是学术史上首次将AI列为“协作作者”的数学证明成果,目前正接受国际数学界同行评审。

数学研究的未来:人机分工的重构

“我们不再需要花六个月去试错一条死胡同,”剑桥大学数论教授Markus Lin在一封公开信中写道,“AI现在能帮我们快速扫清迷雾,指出可能的路径。我们的工作,从‘找路’变成了‘判断这条路是否通向真理’。”

这一转变正在重塑数学研究的生态。过去,一个重大猜想的证明往往依赖个别天才的灵光一现,耗时数年甚至数十年。如今,AI可以并行生成数十条可能的证明路径,人类数学家则专注于筛选、验证与深化。VUB团队已与德国马普所、MIT数学系达成初步合作,计划建立“AI辅助证明验证平台”,目标是在未来两年内,实现对AI生成证明的自动化形式化校验。

与此同时,学术出版界也在调整规则。《数学年刊》《Inventiones Mathematicae》等顶级期刊已开始制定AI协作论文的披露标准:必须说明AI在证明中的具体角色、使用的模型版本、训练数据范围,以及人类如何参与验证。一些数学家担心“AI生成”可能被滥用,但更多人认为,这恰恰是科学透明化的契机。

真正的挑战,才刚刚开始

尽管成果令人振奋,但专家们也强调:AI仍无法独立判断“什么问题值得研究”。它能证明猜想,但尚不能提出像“黎曼猜想”或“P vs NP”这样的深刻问题。它的优势在于“执行”,而非“洞察”。

目前,AI生成的证明仍需人类专家逐行审查。虽然部分步骤可通过Coq、Lean等形式化验证系统自动检查,但许多数学直觉、符号选择的合理性,仍依赖人的判断。VUB团队正在开发一种“解释性日志”系统,记录AI每一步推理的依据与置信度,让人类更容易理解其思维过程。

这场变革的意义,远不止于数学。它暗示着:当机器能独立完成人类顶尖智力活动的核心环节时,我们对“创造力”“原创性”乃至“智能”的定义,都必须重新审视。AI不是取代数学家,而是让数学家从繁琐的推演中解放出来,去探索更深层、更抽象、更根本的问题。

正如VUB教授Vincent Ginis在闭门研讨会上所说:“我们不是在和机器竞争。我们是在和自己过去的工作方式告别。”