OpenAI 发布了面向软件开发的专用模型 GPT-5.2-Codex,该模型是基于 GPT-5.2 针对 Codex 场景进行调优的版本,主打专业软件工程与防御性安全能力。该模型已上线至付费版 ChatGPT 用户可使用的全部 Codex 接口,并计划在未来数周内逐步开放 API 访问权限。同时,OpenAI 正在测试邀请制的可信访问(Trusted Access),允许经过审核、以防御性用途为主的专家和组织优先参与后续能力及更开放模型的测试。
官方指出,GPT-5.2-Codex 的核心改进在于长期任务的上下文压缩,提升了在大型代码变更场景下的稳定性,例如代码重构与系统迁移;同时优化了在 Windows 环境中的代理式编程表现,并提供了 Codex CLI 作为主要使用入口。
OpenAI 表示,GPT-5.2-Codex 能更好地处理长上下文和大型代码库,工具调用更可靠,目标是在长时间工作会话中保持上下文一致性,完成重构、代码库迁移和功能开发等复杂任务,即使计划调整或尝试失败,也能持续迭代。
OpenAI 还提到,模型的视觉理解能力得到增强,能够更准确地解析屏幕截图、技术图表与用户界面,用于加速将设计稿转化为可运行的原型。
在基准测试方面,OpenAI 称 GPT-5.2-Codex 在 SWE-Bench Pro 上的准确率达到 56.4%,在 Terminal-Bench 2.0 上达到 64.0%,显示出其在真实软件工程任务与终端操作场景中的代理式编程能力提升。对比此前公布的 GPT-5.2 在 SWE-Bench Pro 上的 55.6%、GPT-5.1 的 50.8%,GPT-5.2-Codex 在同类软件工程基准测试中略有提升,并在终端型任务上优于 GPT-5.1-Codex-Max 的 58.1%。
此次 OpenAI 将安全能力作为重点强化方向,但同时也意识到模型在安全领域的进步可能带来双重用途风险,因此采取了更为谨慎的部署策略。系统附录显示,GPT-5.2-Codex 在准备度框架(Preparedness Framework)下未达到“高”级别安全能力等级,因此在模型层与产品层均增加了额外防护机制,包括针对有害任务与提示注入的安全训练,以及代理沙箱和可配置的网络访问控制等措施。
官方还提到,此前有安全研究人员利用 GPT-5.1-Codex-Max 搭配 Codex CLI 对 React 服务端组件进行漏洞研究,并负责任地进行了通报。该研究原本旨在复现并分析此前披露的重大漏洞 React2Shell(CVE-2025-55182)的修复内容,过程中额外发现了三个新漏洞。React 团队随后公开了这三项漏洞,其中两项可导致拒绝服务(DoS),另一项可能导致源代码泄露。
关于后续开放策略,OpenAI 表示将分阶段推出,并配合更严格的访问控制。除付费 ChatGPT 用户外,API 也将逐步开放,并通过邀请制优先向经过审核的防御性安全研究人员开放。