最新消息:关注人工智能 AI赋能新媒体运营

Claude Opus 4.5发布:成本更低,工程能力显著提升

科技资讯 admin 浏览

Claude Opus 4.5 正式发布:更聪明、更便宜、更懂干活

Anthropic 正式推出 Claude Opus 4.5,这次不再只是“升级”,而是一次全面的生产力重构。官方将其定位为“最能干实事”的AI助手——不是夸夸其谈的理论派,而是能真正在工程、业务和日常工作中扛任务、压成本、稳输出的实战派。

在软件开发领域,Opus 4.5 的表现堪称颠覆。在权威的 SWE-Bench Verified 测试中,它以 80% 的准确率拿下当前所有商用模型中的最高分,远超前代 Opus 4.1 和 Sonnet 4.5。这不是实验室里的“理想环境”成绩——它能处理真实企业级代码库中的复杂重构、跨语言依赖修复、遗留系统适配等棘手问题。许多开发者反馈,过去需要人工反复调试、甚至求助资深工程师才能解决的“难缠 Bug”,现在 Opus 4.5 几乎能一键定位并给出可直接合并的修复方案。

不只是写代码:多模态、长链条、真实场景全面进化

Opus 4.5 的能力远不止于代码。在视觉理解(Vision)方面,它能更准确地解析图表、UI界面截图和复杂文档,甚至能根据一张产品原型图自动生成前端组件代码。在数学推理和多步逻辑推导中,它的错误率比上一代降低近 40%,尤其擅长处理带约束条件的优化问题,比如供应链排产、资源调度等企业高频需求。

一个让内部测试团队震惊的案例是:在 τ? 代理任务中,模型需要为一名乘客改签航班——但系统限制基础舱位不可直接变更。多数模型卡在规则里,而 Opus 4.5 却主动提出:“建议先将舱位升级至经济舒适舱(无需补差价),再修改行程,最后申请原舱位退款。” 这一方案完全符合航空公司政策,却超出了测试设计的预期路径。这不是“绕过规则”,而是“理解规则背后的逻辑”。正如一位工程师所说:“它不像AI,倒像一个有经验的客服,知道什么时候该‘灵活处理’。”

“想快还是想深”?一个旋钮,掌控AI的思考深度

这次 Anthropic 做了一件开发者最想看到的事:给模型装上“油门”和“刹车”。全新推出的 effort 参数,让你能自由调节模型的思考强度:

  • Low Effort:快速响应,适合简单查询、草稿生成,响应速度提升 2 倍以上
  • Medium Effort(默认):平衡速度与精度,输出量比 Sonnet 4.5 少 76%,准确率却持平甚至更高
  • High Effort:深度推理、多轮验证,适合复杂架构设计、安全审计等关键任务,准确率再提升 15%,而 token 成本仍低于竞品

这意味着,你不再需要为了“省钱”而牺牲质量,或为了“精准”而烧掉预算。同一个模型,既能当你的快速助手,也能当你的首席架构师。

价格直降 66%:AI成本的转折点

如果说性能是“能干”,那价格就是“敢用”。Opus 4.5 的定价直接砍半:

版本 输入价格(每百万 token) 输出价格(每百万 token)
Claude Opus 4.1 $15 $75
Claude Opus 4.5 $5 $25

换算下来,同等任务下,成本下降幅度超过 66%。对中小企业和独立开发者而言,这不再是“试用AI”,而是可以大规模部署的生产力工具。有用户测算,用 Opus 4.5 替代人工代码审查,每月可节省数千美元人力成本。

生态全面升级:从 App 到 Excel,无处不在的智能助手

Opus 4.5 不只是模型升级,而是整个生态的跃迁:

  • Claude App:支持多会话并行,现在你可以同时处理工作邮件、写周报、查财报,互不干扰
  • Claude Code:新增“计划模式”,能自动生成开发任务清单、预估工时、提醒依赖项,真正成为你的项目管家
  • Claude for Excel:支持更复杂的公式生成、数据清洗和可视化建议,财务、运营人员已开始用它替代 VBA 脚本
  • Claude for Chrome:扩展功能增强,网页摘要、表格提取、邮件草稿生成更精准
  • 长对话优化:系统自动总结历史上下文,避免“对话断片”——你不再需要反复重复前情提要

更安全,更可靠:企业级信任的基石

在 AI 安全日益成为企业采购门槛的今天,Opus 4.5 在抗提示注入(Prompt Injection)测试中,成为目前业内误触发率最低的模型之一。在 Anthropic 自建的“高风险行为检测”体系中,它对诱导生成恶意代码、绕过合规限制等行为的拒绝率高达 98.7%,远超 GPT-4o 和 Gemini 1.5 Pro。

更重要的是,它没有“为了安全而僵化”。在合规与效率之间,它找到了平衡点——比如在金融合规场景中,它能识别出“风险提示不足”的文本,并主动建议补充监管依据,而不是简单拒绝。

老用户福利:无需加钱,直接升级

Anthropic 为现有用户送上一份“隐形红包”:在原有 Sonnet 的使用配额内,系统将自动为你分配 Opus 4.5 的使用权。这意味着,你不用多花一分钱,就能获得当前最强的 AI 工程能力。

官方也明确表示,未来当更强版本(如 Opus 5)上线时,将继续沿用“配额平移”策略,确保用户不会因模型迭代而被迫“重新付费”。这种对用户的尊重,正在重新定义 AI 服务的商业伦理。

Opus 4.5 不是下一个“大模型”,它是第一个真正把“实用主义”刻进基因的 AI。它不炫技,不造词,只做一件事:让你的工作,变得更轻松、更高效、更省钱。