最新消息:关注人工智能 AI赋能新媒体运营

OpenAI公布ChatGPT程序撰写代理人Codex 可多任务平行作业

科技智能 admin 浏览 评论
图片来源:

OpenAI

OpenAI公布ChatGPT程序撰写代理人Codex研究预览版,可帮工程师撰写程序、回答问题、并且为程序除错。

Codex上周已开放给ChatGPT Pro、Team与Enterprise方案,很快会开放给Plus和Edu方案用户使用。

Codex使用codex-1模型,后者是OpenAI o3模型为软工优化的版本,是以各种环境的真实程序编写作业为训练资料集,利用强化学习方法训练而成。

作为软工工程师辅助工具,Codex能模仿人类工程师形式及拉取(pull request)偏好撰写功能程序码、回答codebase问题、除错、并建议检查的pull request。它会确实遵守指示,还能反覆测试直到获得程序通过的结果。每项任务都在各自云端沙箱环境分开执行。

Codex可经由开发人员程序库中的AGENTS.md档加以引导。和人类一样,如果提供它开发环境配置、稳定的测试设定和明确的文件,Codex代理人效果会更好。AGENTS.md文件是类似README.md的文字文件,开发团队可在其中指示Codex如何跑程序codebase、执行测试、遵循专案的标準作业。

不过即使没有AGENT.md,Codex也有优异表现。OpenAI公布SWE-Bench Verified标竿测试,显示codex-1的準确率高出o4-mini-high及o3-high的跑分结果。

具有启用资格的开发人员现在就可从ChatGPT侧边工具栏使用Codex。OpenAI详细说明,使用者可在提示列中输入「Code」让Codex写新程序,输入「Ask」询问程序问题。每项任务都是在分开执行。Codex能读取和编辑文件、执行指令,像是test harnesses、linters和 type checkers。视任务複杂性而定一般可在1到30分钟内完成,用户也能即时监控Codex进度。一旦完成,它会并提供log及测试结果供开发人员检视。用户可要求它进一步修改、开启GitHub pull request或直接将其变更整合到环境中。图片来源/OpenAI

发表我的评论
取消评论

表情

您的回复是我们的动力!

  • 昵称 (必填)
  • 验证码 点击我更换图片

网友最新评论