
OpenAI
OpenAI公布ChatGPT程序撰写代理人Codex研究预览版,可帮工程师撰写程序、回答问题、并且为程序除错。
Codex上周已开放给ChatGPT Pro、Team与Enterprise方案,很快会开放给Plus和Edu方案用户使用。
Codex使用codex-1模型,后者是OpenAI o3模型为软工优化的版本,是以各种环境的真实程序编写作业为训练资料集,利用强化学习方法训练而成。
作为软工工程师辅助工具,Codex能模仿人类工程师形式及拉取(pull request)偏好撰写功能程序码、回答codebase问题、除错、并建议检查的pull request。它会确实遵守指示,还能反覆测试直到获得程序通过的结果。每项任务都在各自云端沙箱环境分开执行。
Codex可经由开发人员程序库中的AGENTS.md档加以引导。和人类一样,如果提供它开发环境配置、稳定的测试设定和明确的文件,Codex代理人效果会更好。AGENTS.md文件是类似README.md的文字文件,开发团队可在其中指示Codex如何跑程序codebase、执行测试、遵循专案的标準作业。
不过即使没有AGENT.md,Codex也有优异表现。OpenAI公布SWE-Bench Verified标竿测试,显示codex-1的準确率高出o4-mini-high及o3-high的跑分结果。
具有启用资格的开发人员现在就可从ChatGPT侧边工具栏使用Codex。OpenAI详细说明,使用者可在提示列中输入「Code」让Codex写新程序,输入「Ask」询问程序问题。每项任务都是在分开执行。Codex能读取和编辑文件、执行指令,像是test harnesses、linters和 type checkers。视任务複杂性而定一般可在1到30分钟内完成,用户也能即时监控Codex进度。一旦完成,它会并提供log及测试结果供开发人员检视。用户可要求它进一步修改、开启GitHub pull request或直接将其变更整合到环境中。图片来源/OpenAI