OpenAI推出AI代理式编码模型GPT-5.3-Codex，速度提升25%

OpenAI接连推出开发工具，上周发布Codex桌面版及代理管理平台Frontier后，又推出了最新版AI代理式编程模型GPT-5.3-Codex。OpenAI称，这是该公司第一个“能够自主构建自身”的AI模型。

OpenAI表示，GPT-5.3-Codex可将Codex的应用场景扩展至桌面电脑的各类专业工作，号称是目前能力最强的智能代理式代码编写模型。GPT-5.3-Codex继承了GPT-5.2 Codex的编程能力，上下文窗口同样为400k，具备GPT-5.2的推理与专业知识，可支持研究、工具调用或复杂执行流程的长时间任务。得益于基础设施与推理堆栈的优化，Codex用户的整体运行速度提升了25%。

GPT-5.3-Codex是专为NVIDIA GB200 NVL72系统共同设计、训练并部署的模型。OpenAI强调，GPT-5.3-Codex在基准测试SWE-Bench Pro和Terminal-Bench中的表现位居业界第一。根据SWE-Bench Pro的运行成绩，在相同输出token数（少于20K token）情况下，GPT-5.3-Codex（>50%）的表现优于其自家的GPT-5.2-Codex及GPT-5.2（<50%）。而在Terminal-Bench 2.0测试中，GPT-5.3-Codex的准确率（77%）也高于两个自家模型（64.0%及62.2%）。

该新模型紧随Anthropic上周发布的Claude Opus 4.6，颇具竞争意味。根据Terminal-Bench 2.0的测试结果，在搭配不同代理的情况下，GPT-5.3-Codex部分测试得分可达75.1–77.3%，而Claude Opus 4.6的得分约为65.4–69.9%。

在整体开发能力方面，OpenAI强调GPT-5.3-Codex具备更强的编码、美学设计与压缩优化能力，能在数天内从零开始完成复杂游戏和应用程序的构建。例如，配合Codex App与GPT-5.3-Codex，可自主反复迭代开发出第二代赛车和潜水游戏；在普通网站开发中，新模型更能理解开发者意图，即使提示词不够精确或简略。OpenAI举例称，它可在开发电商网站时，自动生成三个推荐轮播模块，或将年费自动拆解为比月费更优惠的定价方案。

正如对Codex桌面版的描述，OpenAI称GPT-5.3-Codex是为支持整个软件生命周期打造的，涵盖调试、部署、监控、撰写PRD、文案编辑、用户研究、测试、指标分析等各类工作。OpenAI表示，这一新模型标志着向单一通用智能代理迈出关键一步。

值得注意的是，OpenAI宣称GPT-5.3-Codex是该公司首个在“自我构建”过程中发挥关键作用的模型。也就是说，它的早期版本协助开发了正式版本。OpenAI描述，Codex团队使用GPT-5.3-Codex的早期版本进行训练流程调试、部署管理、测试结果诊断与评估。据专业网站指出，这是业界专家所称“AI辅助AI开发”的重大突破。

GPT-5.3-Codex现已可通过付费ChatGPT方案使用，支持所有Codex可用的平台，包括应用程序、CLI、IDE插件和网页版。OpenAI也正在积极准备，在确保安全的前提下，近期开放API访问权限。

CB科技站

OpenAI推出AI代理式编码模型GPT-5.3-Codex，速度提升25%

与本文相关的文章