受安全机制限制 Claude无法解答基础生物题

Anthropic 发布 Claude Fable5 模型，因安全策略限制基础生物学问答

Anthropic 正式推出新一代人工智能模型 Claude Fable5。该模型面向公众开放，在生物学和网络安全方向具备处理潜力。测试显示，它在实际使用中出现了“选择性失忆”。面对高中难度的基础生物学问题，模型通常会拒绝回答，并把请求转给前代旗舰模型 Claude Opus4.8。

这种现象不是能力不足，而是安全限制的结果。Claude Fable5 属于 Mythos 级模型，高阶任务处理能力强，伴随的滥用风险也更高。Anthropic 将生物学划为安全红线，防护标准设定得较为严格。

严格的策略带来了明显的副作用。细胞线粒体功能科普、花粉症成因、哮喘药物作用机制等无害内容均被驳回。埃博拉病毒相关的公共卫生讨论也会触发屏蔽。正常的科普与学术交流因此被迫中断。

公司发言人帕鲁尔?马赫什瓦里表示，此举的核心目的是防范恶意用户利用 AI 进行高风险生物研究，例如开发生物武器。团队为了推动模型尽早上线，选择了保守路线，并承认当前存在较多的识别误判。

在化学和网络安全领域，模型的限制尺度相对灵活。涉及炸药制作或炭疽杆菌培养的危险请求会被拦截。氯气用途、密码安全或物理学原理等中性技术问题可以正常作答。只有涉及剧毒物质等极端场景时，系统才会调用前代模型辅助处理。

Anthropic 正在优化识别机制以降低误判率。公司计划后续面向生物医学专业用户推出特定版本，解锁相关限制。这种受限发布模式，反映了当前 AI 开发在性能与安全之间寻找平衡的实际路径。