GPT-5-Codex发布，升级为更完整的开发代理系统

OpenAI于9月15日发布了GPT-5-Codex，它是基于GPT-5的程序开发工具Codex的最新版本。这一代的Codex已经强化了环境整合与持续上下文追踪能力，并具备较强的代理行为，被视为从单纯模型向具备代理功能系统（agentic system）的一大转变，OpenAI称它是“更可靠的队友”。

更强的环境整合能力

GPT-5-Codex的重大升级之一是强化了环境整合能力：它现在能在命令行界面（CLI）、集成开发环境（IDE）、云端/网页端、GitHub、甚至ChatGPT App等地方使用，且工作进度与项目上下文可以在这些环境中无缝保留。

具体而言，开发者可以先在CLI启动一个重构任务，之后转到VS Code或IDE扩展中预览或修改，再切换到云端/网页版本进行较复杂的结构调整，整个过程中GPT-5-Codex能维持对项目状态与文件内容的理解。

利用特定环境上下文进行智能辅助

GPT-5-Codex也能在不同环境中理解并利用特有的上下文信息。例如，在IDE中，它会参考打开的文件与被选中的代码片段；在云端环境中，能扫描项目结构，了解依赖关系，执行测试，并在代码库中查找错误。

主动执行与监控开发任务

此外，GPT-5-Codex表现出较强的主动执行与监控开发任务能力。当任务简单时，它响应快速；当任务复杂、重构范围大或涉及多文件时，它会投入更多思考。在测试中，有超过七小时连续自主工作、修正测试失败、最终成功交付实现的案例。

GPT-5-Codex在代码库上也能主动浏览、分析依赖性、执行测试来验证代码正确性，并在发现潜在问题时提供具体修改建议。

性能与准确度提升显著

在性能与准确度的量化比较上，GPT-5-Codex的重构任务准确率为51.3%，高于GPT-5的33.9%；其用来评估真实软件开发任务的SWE-bench Verified成绩为74.5%，超过GPT-5的72.8%；在简单任务上，GPT-5-Codex使用的Token比GPT-5少了93.7%，而在最复杂的任务上，GPT-5-Codex思考的时间则是GPT-5的两倍。

GPT-5-Codex

CB科技站

GPT-5-Codex发布，升级为更完整的开发代理系统

更强的环境整合能力

利用特定环境上下文进行智能辅助

主动执行与监控开发任务

性能与准确度提升显著

与本文相关的文章