最新消息:关注人工智能 AI赋能新媒体运营

Anthropic发布市场上首款混合推理模型Claude 3.7 Sonnet

科技智能 admin 浏览 评论

Anthropic正式推出新一代大型语言模型Claude 3.7 Sonnet,官方提到,这是目前市场上第一款混合推理模型,能够根据需求快速回应或进行更深入的思考,并让使用者可自行调整思考时间。这次更新特别强化了程序设计与前端开发能力,并同步推出命令列工具Claude Code,让开发者能直接透过终端机与人工智慧进行更深入的协作。

Claude 3.7 Sonnet在基础运作模式下,是Claude 3.5 Sonnet的升级版本,提供更强的指令理解与回应能力,而在延伸思考模式(Extended Thinking Mode)下,模型能在回应前先进行自我反思,提升数学、物理、程序设计、指令遵循等任务的準确度。API使用者还可透过参数设定,限制模型思考的Token数量,以在执行时间与答案品质之间取得平衡。

程序设计能力一直是Claude模型的强项,更是这次更新的重点之一。Claude 3.7 Sonnet在软件工程SWE-bench Verified和代理工具使用TAU-bench基準测试中取得良好的分数。在SWE-bench Verified测试中,以62.3%的準确度超越Claude 3.5 Sonnet、OpenAI o1及DeepSeek R1。此外,在TAU-bench测试中,Claude 3.7 Sonnet在零售场景达到81.2%的準确度,在航空场景则为58.4%,均优于Claude 3.5 Sonnet与OpenAI o1。

Anthropic进一步扩展Claude在程序设计领域的应用,这次同步推出Claude Code,这是一款针对开发者设计的命令列工具,目前仍处于限制研究预览阶段。Claude Code能够主动搜寻与阅读程序码、编辑文件、撰写与执行测试、提交GitHub变更,甚至与其他命令列工具整合。Anthropic内部测试显示,Claude Code可将原本手动45分钟的开发时间,缩短至单次操作内完成,特别适用于测试驱动开发(TDD)、除错及大规模重构等情境。Anthropic计画持续改进这项工具,未来将强化指令执行的稳定性、支援长时间运行的命令,并提升Claude在此环境中的应用範围。

Claude 3.7 Sonnet现已在所有Claude方案中提供,包括Free、Pro、Team和Enterprise,但延伸思考模式不适用于免费方案。用户也可透过Anthropic API、Amazon Bedrock及Google Cloud Vertex AI取用Claude 3.7 Sonnet模型。

发表我的评论
取消评论

表情

您的回复是我们的动力!

  • 昵称 (必填)
  • 验证码 点击我更换图片

网友最新评论