OpenAI发布代理开发工具AgentKit

OpenAI发布AgentKit，助力开发者高效构建AI代理

OpenAI本周一在年度开发者大会Dev Day上发布了代理开发工具AgentKit，帮助开发者更快速地开发并部署AI代理，同时增强相关评估工具和微调功能。

AgentKit是一套完整的工具集，支持企业和开发者构建、部署和优化AI代理。今年三月，OpenAI推出了Responses API和Agents SDK，已被众多开发者和企业用于构建深度研究或客服支持等场景的代理工作流。AgentKit在此基础上进一步发展，旨在提供一体化的代理开发与部署解决方案。

过去，开发AI代理需要开发者自行整合分散的工具，涉及无版本管理、自定义连接器、手动评估以及提示词调优等繁琐流程，通常需耗时数周才能上线。借助AgentKit，开发者可以使用其提供的组件，通过可视化界面设计工作流，并更快地将代理UI集成到应用中。

AgentKit包含三大核心组件：Agent Builder、Connector Registry 和 ChatKit。

Agent Builder是一个可视化工作区（画布），用于构建多代理工作流并进行版本管理。用户可通过拖拽节点和连线的方式搭建控制逻辑，并设置安全限制。该工具支持执行预览、内联自定义评估以及完整的版本追踪。

Connector Registry是管理员统一管理所有OpenAI产品数据源和工具连接的中心化平台。它能将ChatGPT与API的数据源整合至一个管理界面。注册中心还提供预建连接器，使代理能够接入Dropbox、Google Drive、SharePoint、Microsoft Teams以及MCP服务器等第三方系统。

ChatKit是一套用于将可定制的聊天代理嵌入应用程序的工具包。OpenAI指出，部署代理聊天界面其实相当复杂，涉及响应流处理、对话历史管理、模型思考过程展示以及用户体验设计等环节。ChatKit可帮助开发者轻松将代理集成到自有App或网站中，并适配品牌风格与主题样式。

为测试代理性能，OpenAI也对评估工具Eval进行了升级。去年推出的Eval工具可用于提示测试和模型行为度量。此次新增四项功能：支持基于数据集从零快速构建代理评估体系，并持续迭代优化；对代理工作流进行端到端评估，并以评分定位问题所在；还能根据人工标注结果和评分器输出自动优化提示词。该评估工具不仅适用于OpenAI自家模型，也支持第三方模型。

OpenAI还推出了强化式微调（Reinforcement Fine-Tuning, RFT）功能，允许开发者对OpenAI的推理模型进行个性化调整。目前RFT已在o4-mini模型上开放使用，并在GPT-5上以私有测试版形式提供。OpenAI正与数十家客户合作，持续改进GPT-5的RFT能力。

RFT新增两项与代理相关的功能：支持调用自定义工具，以及为评估任务创建自定义评分器。

在发布节奏方面，ChatKit和新版评估工具（Evals）现已面向所有开发者全面开放。Agent Builder目前处于Beta阶段，Connector Registry则以Beta形式向部分API用户，以及拥有全局管理控制台的ChatGPT Enterprise和Edu客户开放。

OpenAI计划 soon 将独立的Workflows API及代理部署选项集成至ChatGPT中。

CB科技站

OpenAI发布代理开发工具AgentKit

OpenAI发布AgentKit，助力开发者高效构建AI代理

与本文相关的文章