最新消息:关注人工智能 AI赋能新媒体运营

OpenAI推出AI代理式编码模型GPT-5.3-Codex,速度提升25%

科技资讯 admin 浏览

OpenAI接连推出开发工具,上周发布Codex桌面版及代理管理平台Frontier后,又推出了最新版AI代理式编程模型GPT-5.3-Codex。OpenAI称,这是该公司第一个“能够自主构建自身”的AI模型。

OpenAI表示,GPT-5.3-Codex可将Codex的应用场景扩展至桌面电脑的各类专业工作,号称是目前能力最强的智能代理式代码编写模型。GPT-5.3-Codex继承了GPT-5.2 Codex的编程能力,上下文窗口同样为400k,具备GPT-5.2的推理与专业知识,可支持研究、工具调用或复杂执行流程的长时间任务。得益于基础设施与推理堆栈的优化,Codex用户的整体运行速度提升了25%。

GPT-5.3-Codex是专为NVIDIA GB200 NVL72系统共同设计、训练并部署的模型。OpenAI强调,GPT-5.3-Codex在基准测试SWE-Bench Pro和Terminal-Bench中的表现位居业界第一。根据SWE-Bench Pro的运行成绩,在相同输出token数(少于20K token)情况下,GPT-5.3-Codex(>50%)的表现优于其自家的GPT-5.2-Codex及GPT-5.2(<50%)。而在Terminal-Bench 2.0测试中,GPT-5.3-Codex的准确率(77%)也高于两个自家模型(64.0%及62.2%)。

该新模型紧随Anthropic上周发布的Claude Opus 4.6,颇具竞争意味。根据Terminal-Bench 2.0的测试结果,在搭配不同代理的情况下,GPT-5.3-Codex部分测试得分可达75.1–77.3%,而Claude Opus 4.6的得分约为65.4–69.9%。

在整体开发能力方面,OpenAI强调GPT-5.3-Codex具备更强的编码、美学设计与压缩优化能力,能在数天内从零开始完成复杂游戏和应用程序的构建。例如,配合Codex App与GPT-5.3-Codex,可自主反复迭代开发出第二代赛车和潜水游戏;在普通网站开发中,新模型更能理解开发者意图,即使提示词不够精确或简略。OpenAI举例称,它可在开发电商网站时,自动生成三个推荐轮播模块,或将年费自动拆解为比月费更优惠的定价方案。

正如对Codex桌面版的描述,OpenAI称GPT-5.3-Codex是为支持整个软件生命周期打造的,涵盖调试、部署、监控、撰写PRD、文案编辑、用户研究、测试、指标分析等各类工作。OpenAI表示,这一新模型标志着向单一通用智能代理迈出关键一步。

值得注意的是,OpenAI宣称GPT-5.3-Codex是该公司首个在“自我构建”过程中发挥关键作用的模型。也就是说,它的早期版本协助开发了正式版本。OpenAI描述,Codex团队使用GPT-5.3-Codex的早期版本进行训练流程调试、部署管理、测试结果诊断与评估。据专业网站指出,这是业界专家所称“AI辅助AI开发”的重大突破。

GPT-5.3-Codex现已可通过付费ChatGPT方案使用,支持所有Codex可用的平台,包括应用程序、CLI、IDE插件和网页版。OpenAI也正在积极准备,在确保安全的前提下,近期开放API访问权限。