OpenAI公布ChatGPT程序撰写代理人Codex 可多任务平行作业

图片来源:

OpenAI

OpenAI公布ChatGPT程序撰写代理人Codex研究预览版，可帮工程师撰写程序、回答问题、并且为程序除错。

Codex上周已开放给ChatGPT Pro、Team与Enterprise方案，很快会开放给Plus和Edu方案用户使用。

Codex使用codex-1模型，后者是OpenAI o3模型为软工优化的版本，是以各种环境的真实程序编写作业为训练资料集，利用强化学习方法训练而成。

作为软工工程师辅助工具，Codex能模仿人类工程师形式及拉取（pull request）偏好撰写功能程序码、回答codebase问题、除错、并建议检查的pull request。它会确实遵守指示，还能反覆测试直到获得程序通过的结果。每项任务都在各自云端沙箱环境分开执行。

Codex可经由开发人员程序库中的AGENTS.md档加以引导。和人类一样，如果提供它开发环境配置、稳定的测试设定和明确的文件，Codex代理人效果会更好。AGENTS.md文件是类似README.md的文字文件，开发团队可在其中指示Codex如何跑程序codebase、执行测试、遵循专案的标準作业。

不过即使没有AGENT.md，Codex也有优异表现。OpenAI公布SWE-Bench Verified标竿测试，显示codex-1的準确率高出o4-mini-high及o3-high的跑分结果。

具有启用资格的开发人员现在就可从ChatGPT侧边工具栏使用Codex。OpenAI详细说明，使用者可在提示列中输入「Code」让Codex写新程序，输入「Ask」询问程序问题。每项任务都是在分开执行。Codex能读取和编辑文件、执行指令，像是test harnesses、linters和 type checkers。视任务複杂性而定一般可在1到30分钟内完成，用户也能即时监控Codex进度。一旦完成，它会并提供log及测试结果供开发人员检视。用户可要求它进一步修改、开启GitHub pull request或直接将其变更整合到环境中。图片来源／OpenAI

CB科技站

OpenAI公布ChatGPT程序撰写代理人Codex 可多任务平行作业

与本文相关的文章