GPT-5.5意外曝光,OpenAI的下一步藏不住了
就在OpenAI刚发布ChatGPT Images 2.0的当天,一群开发者在使用Codex CLI工具时,发现终端里多了一个从未见过的模型名称:GPT-5.5。
这不是什么系统错误提示,也不是测试版的临时标签——它清清楚楚地出现在模型列表里,旁边标注着“最前沿的智能体编程模型”。更让人惊讶的是,和它一起出现的还有另一个名字:oai-2.1。两者都属于内部测试环境的产物,本不该出现在公开终端中。
Reddit用户DavidAGMM上传了一段视频,记录了他在公司内网环境操作时的截图。画面里,模型列表里除了常见的gpt-4-turbo、o1-preview等,赫然多了这两个名字。视频发出后,迅速在GitHub、Hacker News和X(原Twitter)上刷屏。不少人怀疑:OpenAI是不是把测试环境误连到生产系统了?

短短几小时后,这个列表被紧急下线。但截图和视频已经传开,没人能当没看见。开发者们开始翻查OpenAI的API文档、GitHub仓库和开源项目提交记录,试图找到更多线索。有人发现,最近几个月,OpenAI在GitHub上悄悄提交了大量关于“autonomous agent framework”的代码,注释里频繁出现“task decomposition”“tool use planning”“long-horizon reasoning”这类词——全都是智能体(AI Agent)的核心能力。
不止是GPT-5.5,一串神秘代号暴露了OpenAI的野心
这次泄露的不只是一个型号,而是一整张“秘密项目清单”。
比如“Heisenberg”——这个名字来自量子力学中的不确定性原理。在文档片段中,它被标记为“生命科学推理引擎”。有生物信息学背景的开发者指出,这个模型可能正在尝试分析蛋白质折叠结构,或预测基因编辑后的脱靶效应。去年底,DeepMind的AlphaFold 3刚在Nature发表突破,而OpenAI这边,似乎也在悄悄布局AI驱动的科研。
还有个叫“Arcanine”的模型,名字取自宝可梦里那只火系神兽。它的描述很奇怪:“对淀粉类食物有传奇般的食欲”。听起来像段子,但仔细一想,这可能是内部测试的隐喻——“淀粉”在AI圈常被用来代指“高计算负载任务”,比如大模型训练中的密集矩阵运算。换句话说,这个模型可能专攻高算力场景下的推理优化,甚至在模拟模型“吃掉”大量计算资源时的表现。
而“Glacier-alpha”系列,名字听着像冰川,描述却更吓人:“撼动大陆的智慧”“冰冷的智慧”。有工程师推测,这可能是OpenAI正在构建的下一代基座模型,规模远超GPT-4,训练数据量可能达到数十万亿token,且专为长上下文、多轮复杂推理设计。有人在论文库中发现,今年3月,OpenAI提交了一篇未公开的预印本,标题是《Scaling Reasoning Beyond Context Windows》,里面提到“模型在100万token上下文下仍能保持逻辑连贯性”——这正是Glacier系列可能的目标。
AI不再只是聊天,它开始写代码、解数学题、做科研
如果你以为GPT-5.5只是个更会聊天的版本,那你就太小看它了。
就在上个月,斯坦福大学发布了一份内部测试报告:一个未命名的OpenAI模型,在不依赖人类提示的情况下,独立完成了对“ABC猜想”的部分形式化证明草稿。这个猜想是数论界悬而未决30年的难题之一,连陶哲轩都曾公开表示“目前没有清晰路径”。而这个模型,在只给它输入了基础公理和少量参考文献后,自行构建了推理链条,甚至指出了现有证明中的潜在漏洞。
更早前,一位在纽约一家对冲基金工作的程序员告诉我,他们团队用OpenAI的某个新模型做量化策略生成,结果它自己写出了一个基于期权波动率曲面的套利算法,比他们团队半年的成果还高效。他没敢上报,怕被当成“AI幻觉”,但偷偷保留了代码。
这些都不是孤立案例。越来越多的科研人员、工程师、创业者开始在私下交流:OpenAI正在从“对话机器人”转向“自主执行者”。它不再等你问“帮我写个Python脚本”,而是主动问:“你上次说要自动化处理财报数据,我帮你拆解了四个子任务,现在开始执行?”
OpenAI沉默,但整个行业已经坐不住了
截至目前,OpenAI官方没有回应任何关于GPT-5.5或这些代号的传闻。没有辟谣,也没有确认。这种沉默,比任何声明都更说明问题。
但业界的反应已经很明显。Anthropic、Google DeepMind、Mistral等公司内部紧急召开会议,重新评估研发节奏。一家硅谷AI初创公司的CTO告诉我:“我们原计划明年发布Agent平台,但现在……我们得提前了。”
与此同时,GitHub上出现了多个开源项目,试图复现“智能体自主规划”的行为。有人用Llama 3和LangChain搭了个简易版本,能自动读取GitHub issue、写代码修复bug、提交PR——虽然还很粗糙,但方向已经清晰。
技术圈里流传着一句话:“GPT-4是工具,GPT-5是同事。”
现在,GPT-5.5的出现,可能意味着这个“同事”已经悄悄入职了。它不需要你发指令,它自己会判断该做什么。
你准备好和它共事了吗?