
Anthropic
Anthropic周二(8/5)释出Claude Opus 4.1,称其为Claude Opus 4在代理任务、真实世界程序码撰写与推理能力上的升级版,并预告将在未来数周发表更大幅度的模型升级。
Opus系列是Claude模型家族中最强的等级。根据Anthropic公布的基準测试结果,Claude Opus 4.1在多数项目中表现超越Opus 4,并于代理程序码任务(SWE-bench Verified、Terminal-Bench)、代理工具使用(TAU-bench)、以及多语言问答任务(MMMU)等测试中,领先OpenAI的o3与Gemini 2.5 Pro。
Claude Opus 4.1被视为当前最强的程序码模型之一,可更準确地辨识并修复错误、有效处理多文件重构,并减少冗赘与错误的产生。
目前Claude Opus 4.1已可透过Claude Code、API、Amazon Bedrock与Google Cloud Vertex AI等平台存取,并已在GitHub Copilot中开放预览,预计两周后将正式取代Opus 4。定价维持不变,每百万个Token输入15美元、输出75美元。