最新消息:关注人工智能 AI赋能新媒体运营

Claude Mythos完成多步骤攻击测试,AI安全能力迈入新阶段

科技资讯 admin 浏览

英国AI安全研究所(AI Security Institute,AISI)于周一(4月13日)公布了针对Anthropic最新模型Claude Mythos Preview的评估结果,显示该模型已在受控环境中自主执行多步骤网络攻击。在网络安全夺旗赛(Capture the Flag,CTF)专家级任务中,成功率高达73%,并成为首个完整破解32步企业攻击链的AI模型。

AISI成立于2023年,隶属于英国科学、创新与科技部,主要负责评估前沿AI模型的潜在风险。此次评估通过CTF与企业攻击模拟环境,检验模型能否自主完成漏洞发现、权限提升与横向移动等攻击步骤,以评估其在真实世界中可能带来的网络安全威胁。

Claude Mythos Preview是Anthropic最新发布的通用模型,在网络安全任务中表现突出,不仅发现了大量零日漏洞,还能生成漏洞利用代码。由于该能力可能带来安全风险,Anthropic已启动全球网络安全防御计划Project Glasswing,并仅限特定合作伙伴访问该模型,以加速漏洞修复。

根据AISI的测试,在网络安全夺旗赛(Capture the Flag,CTF)测试中,Claude Mythos Preview在专家级任务中的成功率达73%。这类任务在2025年以前尚无任何模型能够完成,表明其在高难度漏洞利用能力上已取得显著突破。

在企业攻击模拟部分,AISI构建了名为“The Last Ones”的测试环境,模拟从初始侦察到全面控制系统控制的32个攻击步骤,预计人类专家需约20小时完成。Claude Mythos Preview在10次测试中平均完成22步,并有3次完整走完全部流程,是目前唯一能够从头到尾破解该攻击链的模型。

不过,AISI也指出,该测试环境并未纳入真实世界常见的防御机制,例如实时监控、入侵检测与事件响应系统,且模型在执行攻击过程中不会收到警告或中断,因此结果仍不能完全代表其在实际高防护环境中的表现。

此外,在部分工业控制系统(OT)测试中,Claude Mythos Preview未能完成攻击流程,主要卡在前期IT环节,表明其跨环境攻击能力仍存在局限。

AISI提醒,随着模型能力持续提升,未来AI可能被用于自动化漏洞挖掘与攻击行动,对防护薄弱的企业系统构成威胁;建议企业强化基础网络安全措施,包括定期更新系统、落实访问控制与加强日志记录,同时提前提升防御能力,以应对AI驱动攻击能力的快速演进。