社区反对后 Anthropic 调整 Claude Fable5 限制机制

科技资讯 admin 2026-06-15 11:24 浏览

Anthropic致歉：Claude Fable5将取消后台降权限制

AI企业Anthropic发布新模型Claude Fable5后，因一项隐蔽的性能限制措施引发AI研究社区强烈反对。官方已正式道歉，并宣布全面调整安全管控规则。

该模型原设有针对网络安全、生物与化学等高危领域的自动防护机制。服务条款本就明文禁止用户利用Claude训练同类竞争模型。此前，系统会在用户不知情的情况下，刻意降低试图研发竞品AI的账户性能。这套暗中降级的方案遭到广泛批评。不少研究者指出，这种操作容易阻碍技术交流，也可能造成赛道资源集中。

Anthropic,克劳德，claude

面对外界反馈，Anthropic公布具体整改步骤。新版规则要求所有限制动作对外完全透明。一旦系统检测到用户试图研发高性能竞品，将直接发出提醒，明确拒绝相关请求，或是公开切换至低配模型。后台悄悄削弱算力的做法正式停用。

Anthropic claude-fable5 隐蔽限制暗中降级规则调整

与本文相关的文章