Anthropic 发布了 Claude Managed Agents 托管服务,开发者无需自行构建代理循环、沙箱或工具执行层,即可通过 API 部署能够执行长时间、多步骤任务的 AI 代理。其架构核心是将模型推理、执行环境与会话记录解耦,以降低控制程序中因模型演进而失效的既有假设风险。
Anthropic 指出,代理控制程序本质上是用来弥补模型当前能力边界的机制,但这些补偿性假设会随着模型进步而过时。官方举例,Claude Sonnet 4.5 在接近上下文长度上限时,会出现提前终止任务的情况,团队当时因此在控制程序中加入了上下文重置机制;但同一套控制程序应用到 Claude Opus 4.5 后,这种现象已不再发生,原有的重置设计反而成了冗余负担。
Managed Agents 的设计灵感来源于操作系统的抽象化原则:如同操作系统将硬件虚拟化为进程(Process)和文件(File)等抽象接口,使应用程序无需处理底层硬件细节,Managed Agents 也将代理系统拆分为三个彼此独立的接口:负责推理决策的“大脑”,即模型与控制循环;负责实际执行的“双手”,即沙箱容器与工具;以及独立存储的会话日志。三者通过标准化接口通信,任一部分出现故障或需要替换,都不会影响其他部分的运行。
完成解耦后,容器变为可随时重建与替换的执行单元,控制程序不再部署在容器内部,而是通过标准接口与容器交互,如同调用其他工具一样。当容器发生故障时,控制程序会将错误信息返回给 Claude,由 Claude 判断是否重试并启动新容器。由于会话日志独立存储于外部,控制程序本身也成为无状态组件,即使发生故障,也能在重新读取事件记录后继续执行。
由于推理不再需要等待容器启动,Anthropic 表示,首次令牌响应时间(TTFT)的 p50 降低约 60%,p95 降低超过 90%。
解耦架构也提升了安全性。过去所有组件共存于同一容器时,Claude 生成的代码与认证凭证位于同一环境中,提示词注入攻击只需说服 Claude 读取环境变量,就可能获取访问令牌。新架构下,OAuth 凭证存储在沙箱之外的独立密钥库中,Claude 通过专用代理服务调用 MCP 工具,控制程序与沙箱全程不接触任何认证数据。