Anthropic 说明 Claude Code 近期收到用户反馈质量下降的原因,表示问题并非来自 API 或推理层异常,而是三项产品层面的变更分别影响了不同流量与时间点,波及 Claude Code、Claude Agent SDK 与 Claude Cowork。官方指出,相关问题已在 4 月 20 日发布的 v2.1.116 版本中修复,并从 4 月 23 日起重置所有订阅用户的使用额度。
由于部分用户在过去一个月反映 Claude 回复质量变差,特别是在 Claude Code 使用场景中,出现判断能力下降、重复回答、遗忘上下文或工具选择异常等问题。Anthropic 表示,经调查确认 API 与底层推理服务未受影响,也否认刻意降低模型性能。
第一项原因是 Claude Code 默认推理强度调整。Anthropic 在 3 月 4 日将 Claude Code 的默认推理强度从 high 降低为 medium,官方解释,初衷是为了减少部分用户在 high 模式下遇到的长延迟,避免界面看似卡顿,同时降低 Token 消耗。但用户随后反馈 Claude Code 变得不够智能,官方于 4 月 7 日恢复为较高推理强度,目前 Opus 4.7 默认为 xhigh,其他模型默认为 high。
第二项问题源于缓存优化。Anthropic 在 3 月 26 日上线一项调整,原计划仅在会话闲置超过一小时后清除此前积累的推理上下文,以降低用户恢复该会话时的成本与延迟。但实现错误导致系统在后续每一轮对话中持续清除旧的推理历史,使 Claude 在执行任务时逐步丢失上下文,从而出现重复回答和异常工具调用。该问题已于 4 月 10 日修复。
第三项原因是系统提示词调整。为减少 Opus 4.7 回复过于冗长的情况,Anthropic 于 4 月 16 日在 Claude Code 中引入新提示词,限制工具调用间的文字长度与最终回复篇幅。但该变更意外影响了 Sonnet 4.6、Opus 4.6 与 Opus 4.7。经后续评估测试发现,该提示词导致 Opus 4.6 与 Opus 4.7 表现下降约 3%,因此已于 4 月 20 日撤回。
Anthropic 表示,后续将让更多内部员工使用与外部用户相同的 Claude Code 公开版本,并加强内部代码审查工具。对于 Claude Code 的系统提示词变更,官方承诺将对不同模型进行更全面的评估,通过提示词拆解测试、长时间观察与渐进式发布,尽早发现可能影响代码质量的改动。