最新消息:关注人工智能 AI赋能新媒体运营

GPT-5-Codex发布,升级为更完整的开发代理系统

科技智能 admin 浏览 评论

OpenAI于9月15日发布了GPT-5-Codex,它是基于GPT-5的程序开发工具Codex的最新版本。这一代的Codex已经强化了环境整合与持续上下文追踪能力,并具备较强的代理行为,被视为从单纯模型向具备代理功能系统(agentic system)的一大转变,OpenAI称它是“更可靠的队友”。

更强的环境整合能力

GPT-5-Codex的重大升级之一是强化了环境整合能力:它现在能在命令行界面(CLI)、集成开发环境(IDE)、云端/网页端、GitHub、甚至ChatGPT App等地方使用,且工作进度与项目上下文可以在这些环境中无缝保留。

具体而言,开发者可以先在CLI启动一个重构任务,之后转到VS Code或IDE扩展中预览或修改,再切换到云端/网页版本进行较复杂的结构调整,整个过程中GPT-5-Codex能维持对项目状态与文件内容的理解。

利用特定环境上下文进行智能辅助

GPT-5-Codex也能在不同环境中理解并利用特有的上下文信息。例如,在IDE中,它会参考打开的文件与被选中的代码片段;在云端环境中,能扫描项目结构,了解依赖关系,执行测试,并在代码库中查找错误。

主动执行与监控开发任务

此外,GPT-5-Codex表现出较强的主动执行与监控开发任务能力。当任务简单时,它响应快速;当任务复杂、重构范围大或涉及多文件时,它会投入更多思考。在测试中,有超过七小时连续自主工作、修正测试失败、最终成功交付实现的案例。

GPT-5-Codex在代码库上也能主动浏览、分析依赖性、执行测试来验证代码正确性,并在发现潜在问题时提供具体修改建议。

性能与准确度提升显著

在性能与准确度的量化比较上,GPT-5-Codex的重构任务准确率为51.3%,高于GPT-5的33.9%;其用来评估真实软件开发任务的SWE-bench Verified成绩为74.5%,超过GPT-5的72.8%;在简单任务上,GPT-5-Codex使用的Token比GPT-5少了93.7%,而在最复杂的任务上,GPT-5-Codex思考的时间则是GPT-5的两倍。

发表我的评论
取消评论

表情

您的回复是我们的动力!

  • 昵称 (必填)
  • 验证码 点击我更换图片

网友最新评论