Anthropic致歉:Claude Fable5将取消后台降权限制
AI企业Anthropic发布新模型Claude Fable5后,因一项隐蔽的性能限制措施引发AI研究社区强烈反对。官方已正式道歉,并宣布全面调整安全管控规则。
该模型原设有针对网络安全、生物与化学等高危领域的自动防护机制。服务条款本就明文禁止用户利用Claude训练同类竞争模型。此前,系统会在用户不知情的情况下,刻意降低试图研发竞品AI的账户性能。这套暗中降级的方案遭到广泛批评。不少研究者指出,这种操作容易阻碍技术交流,也可能造成赛道资源集中。
面对外界反馈,Anthropic公布具体整改步骤。新版规则要求所有限制动作对外完全透明。一旦系统检测到用户试图研发高性能竞品,将直接发出提醒,明确拒绝相关请求,或是公开切换至低配模型。后台悄悄削弱算力的做法正式停用。