最新消息:关注人工智能 AI赋能新媒体运营

Anthropic释出Claude Opus 4.1,强化代理任务、程序码与推理能力

科技智能 admin 浏览 评论
图片来源:

Anthropic

Anthropic周二(8/5)释出Claude Opus 4.1,称其为Claude Opus 4在代理任务、真实世界程序码撰写与推理能力上的升级版,并预告将在未来数周发表更大幅度的模型升级。

Opus系列是Claude模型家族中最强的等级。根据Anthropic公布的基準测试结果,Claude Opus 4.1在多数项目中表现超越Opus 4,并于代理程序码任务(SWE-bench Verified、Terminal-Bench)、代理工具使用(TAU-bench)、以及多语言问答任务(MMMU)等测试中,领先OpenAI的o3与Gemini 2.5 Pro。

Claude Opus 4.1被视为当前最强的程序码模型之一,可更準确地辨识并修复错误、有效处理多文件重构,并减少冗赘与错误的产生。

目前Claude Opus 4.1已可透过Claude Code、API、Amazon Bedrock与Google Cloud Vertex AI等平台存取,并已在GitHub Copilot中开放预览,预计两周后将正式取代Opus 4。定价维持不变,每百万个Token输入15美元、输出75美元。

发表我的评论
取消评论

表情

您的回复是我们的动力!

  • 昵称 (必填)
  • 验证码 点击我更换图片

网友最新评论