Anthropic释出Claude Opus 4.1，强化代理任务、程序码与推理能力

图片来源:

Anthropic

Anthropic周二（8/5）释出Claude Opus 4.1，称其为Claude Opus 4在代理任务、真实世界程序码撰写与推理能力上的升级版，并预告将在未来数周发表更大幅度的模型升级。

Opus系列是Claude模型家族中最强的等级。根据Anthropic公布的基準测试结果，Claude Opus 4.1在多数项目中表现超越Opus 4，并于代理程序码任务（SWE-bench Verified、Terminal-Bench）、代理工具使用（TAU-bench）、以及多语言问答任务（MMMU）等测试中，领先OpenAI的o3与Gemini 2.5 Pro。

Claude Opus 4.1被视为当前最强的程序码模型之一，可更準确地辨识并修复错误、有效处理多文件重构，并减少冗赘与错误的产生。

目前Claude Opus 4.1已可透过Claude Code、API、Amazon Bedrock与Google Cloud Vertex AI等平台存取，并已在GitHub Copilot中开放预览，预计两周后将正式取代Opus 4。定价维持不变，每百万个Token输入15美元、输出75美元。

CB科技站

Anthropic释出Claude Opus 4.1，强化代理任务、程序码与推理能力

与本文相关的文章