最新消息:关注人工智能 AI赋能新媒体运营

受安全机制限制 Claude无法解答基础生物题

科技资讯 admin 浏览

Anthropic 发布 Claude Fable5 模型,因安全策略限制基础生物学问答

Anthropic 正式推出新一代人工智能模型 Claude Fable5。该模型面向公众开放,在生物学和网络安全方向具备处理潜力。测试显示,它在实际使用中出现了“选择性失忆”。面对高中难度的基础生物学问题,模型通常会拒绝回答,并把请求转给前代旗舰模型 Claude Opus4.8。

这种现象不是能力不足,而是安全限制的结果。Claude Fable5 属于 Mythos 级模型,高阶任务处理能力强,伴随的滥用风险也更高。Anthropic 将生物学划为安全红线,防护标准设定得较为严格。

Claude Fable5 模型相关界面截图

严格的策略带来了明显的副作用。细胞线粒体功能科普、花粉症成因、哮喘药物作用机制等无害内容均被驳回。埃博拉病毒相关的公共卫生讨论也会触发屏蔽。正常的科普与学术交流因此被迫中断。

公司发言人帕鲁尔?马赫什瓦里表示,此举的核心目的是防范恶意用户利用 AI 进行高风险生物研究,例如开发生物武器。团队为了推动模型尽早上线,选择了保守路线,并承认当前存在较多的识别误判。

在化学和网络安全领域,模型的限制尺度相对灵活。涉及炸药制作或炭疽杆菌培养的危险请求会被拦截。氯气用途、密码安全或物理学原理等中性技术问题可以正常作答。只有涉及剧毒物质等极端场景时,系统才会调用前代模型辅助处理。

Anthropic 正在优化识别机制以降低误判率。公司计划后续面向生物医学专业用户推出特定版本,解锁相关限制。这种受限发布模式,反映了当前 AI 开发在性能与安全之间寻找平衡的实际路径。