GPT-5.3-Codex 正式发布:能写代码,更能操作电脑
OpenAI 首席执行官 Sam Altman 今天正式发布了 GPT-5.3-Codex —— 一个不再只是“写代码”的AI,而是一个能真正帮你操作电脑的智能助手。
过去几年,AI 编程工具主要解决的是“你写个需求,它生成代码”的问题。但现实中的开发工作远不止写几行函数。你得部署服务、调试环境、处理权限报错、修改配置文件、甚至重启崩溃的服务器。GPT-5.3-Codex 的突破在于:它能直接在终端里执行这些操作,像一个有经验的工程师那样,一步步解决问题。
在权威测试中,它在 SWE-Bench Pro 上达到 57% 的准确率——这意味着它能独立完成超过一半的真实开源项目修复任务。更惊人的是,在 TerminalBench 2.0 和 OSWorld 两项系统级任务测试中,它分别拿下 76% 和 64% 的分数。这些测试要求模型在真实 Linux 环境中执行命令、安装依赖、修改系统设置,甚至处理权限冲突。它不再只是“看起来像在写代码”,而是真的在“干活”。

更快、更省、更实用
效率是开发者最关心的。GPT-5.3-Codex 在完成相同任务时,Token 消耗比上一代减少了超过一半。这意味着你用同样的预算,能多跑一倍的自动化脚本。同时,单个 Token 的处理速度提升 25% 以上,响应更流畅,等待时间更短。
举个例子:以前你让 AI 帮你部署一个 Django 项目,可能要分三轮对话:先写代码,再改配置,最后调权限。现在,它能一次性完成全部流程,中间还能自己发现端口被占用,自动换端口,然后继续执行。不需要你反复提醒,它能自己“看情况”调整。
更重要的是,它支持实时干预。如果你发现它执行错了某一步,可以直接在终端里输入一条命令,比如“取消上一步,改用 sudo”,它会立刻理解上下文,调整后续动作。这不是“预设指令”,而是真正的交互式协作。
安全,不再是事后补漏
过去,AI 编程工具常被质疑“会不会误删文件”“会不会执行恶意指令”。GPT-5.3-Codex 是 OpenAI 第一个通过网络安全维度“高等级”评估的模型。它的操作权限被严格限制在沙箱环境中,任何涉及系统写入、网络连接或敏感路径的操作,都会被自动拦截并提示用户确认。
为推动行业安全标准,OpenAI 同步启动“可信访问框架”试点计划,向全球安全团队免费开放 1000 万美元的 API 额度,支持他们用 GPT-5.3-Codex 自动检测漏洞、分析日志、生成修复方案。已有包括 Cloudflare、Datadog、GitLab 等多家企业加入首批测试。
现在就能用,但不是人人都能随便开
GPT-5.3-Codex 已向部分企业客户开放,通过 OpenAI API 接入。个人开发者可通过 ChatGPT Plus 订阅用户逐步获得访问权限,预计将在未来两个月内全面开放。
它不会取代程序员,但会彻底改变开发流程:不再需要花半天查文档、翻 Stack Overflow,也不用再为环境配置崩溃而抓狂。它更像是你身边那个懂所有工具、从不抱怨、24 小时在线的资深同事——只是,它不喝咖啡,也不需要休假。