Claude Mythos完成多步骤攻击测试，AI安全能力迈入新阶段

英国AI安全研究所（AI Security Institute，AISI）于周一（4月13日）公布了针对Anthropic最新模型Claude Mythos Preview的评估结果，显示该模型已在受控环境中自主执行多步骤网络攻击。在网络安全夺旗赛（Capture the Flag，CTF）专家级任务中，成功率高达73%，并成为首个完整破解32步企业攻击链的AI模型。

AISI成立于2023年，隶属于英国科学、创新与科技部，主要负责评估前沿AI模型的潜在风险。此次评估通过CTF与企业攻击模拟环境，检验模型能否自主完成漏洞发现、权限提升与横向移动等攻击步骤，以评估其在真实世界中可能带来的网络安全威胁。

Claude Mythos Preview是Anthropic最新发布的通用模型，在网络安全任务中表现突出，不仅发现了大量零日漏洞，还能生成漏洞利用代码。由于该能力可能带来安全风险，Anthropic已启动全球网络安全防御计划Project Glasswing，并仅限特定合作伙伴访问该模型，以加速漏洞修复。

根据AISI的测试，在网络安全夺旗赛（Capture the Flag，CTF）测试中，Claude Mythos Preview在专家级任务中的成功率达73%。这类任务在2025年以前尚无任何模型能够完成，表明其在高难度漏洞利用能力上已取得显著突破。

在企业攻击模拟部分，AISI构建了名为“The Last Ones”的测试环境，模拟从初始侦察到全面控制系统控制的32个攻击步骤，预计人类专家需约20小时完成。Claude Mythos Preview在10次测试中平均完成22步，并有3次完整走完全部流程，是目前唯一能够从头到尾破解该攻击链的模型。

不过，AISI也指出，该测试环境并未纳入真实世界常见的防御机制，例如实时监控、入侵检测与事件响应系统，且模型在执行攻击过程中不会收到警告或中断，因此结果仍不能完全代表其在实际高防护环境中的表现。

此外，在部分工业控制系统（OT）测试中，Claude Mythos Preview未能完成攻击流程，主要卡在前期IT环节，表明其跨环境攻击能力仍存在局限。

AISI提醒，随着模型能力持续提升，未来AI可能被用于自动化漏洞挖掘与攻击行动，对防护薄弱的企业系统构成威胁；建议企业强化基础网络安全措施，包括定期更新系统、落实访问控制与加强日志记录，同时提前提升防御能力，以应对AI驱动攻击能力的快速演进。

Claude Mythos AI资安能力多步骤攻击测试

CB科技站

Claude Mythos完成多步骤攻击测试，AI安全能力迈入新阶段

与本文相关的文章