Claude Mythos 被曝漏洞注水：数千漏洞中仅约10个为严重问题

“最强AI”神话破灭：Claude Mythos 的真实表现远没那么可怕

最近，Anthropic 推出的所谓“Claude Mythos Preview”被渲染成能“一键摧毁全球软件安全”的核武级AI，引发金融机构和安全团队集体焦虑。多家银行甚至紧急召开内部会议，评估“AI漏洞猎手”可能带来的系统性风险。但当独立技术团队真刀真枪地测试后，现实却远比宣传冷淡得多。

Anthropic 曾宣称 Mythos 能自动发现“数千个高危安全漏洞”，并以此为由启动了名为 Project Glasswing 的封闭测试计划，仅向谷歌、微软等极少数企业开放。但《Tom’s Hardware》团队的一份实测报告揭开了这层滤镜。

所谓的“数千个”，源于对仅198份人工审计报告的90%准确率进行外推——也就是说，模型在不到200个案例中表现尚可，就被放大成足以覆盖全球软件生态的能力。这就像根据你家楼道的3个门锁没坏，就断言整座城市所有门锁都万无一失。

更关键的是，在对7000个主流开源项目进行实际扫描后，Mythos 标记出约600个“漏洞”，但经过安全专家逐条复核，真正具备可利用性、能被攻击者利用的严重漏洞，只有不到10个。其余大多是过时依赖、废弃配置或早已被修复的旧问题。

一位在某大型银行负责安全运营的工程师透露：“我们试了两周，每天收到上百条警报，95%都是误报。最后还得靠人工一条条筛，反而比以前更累了。”

Anthropic 一直强调，Mythos “过于强大”，为避免被滥用才限制访问。但事实是，这个模型早已悄悄上线亚马逊AWS和微软Azure平台，只是定价高得离谱——单次调用成本超过20美元，是普通AI模型的50倍以上。

这意味着，只有像谷歌、摩根士丹利这种每年花数千万美元在云服务上的巨头，才负担得起“试用”。普通企业连登录页面都进不去，更别说“失控风险”了。

业内普遍认为，这根本不是技术管控，而是一场精心设计的营销：先用“AI将毁灭世界”的叙事制造恐慌，再以“我们是唯一能控制它的人”为卖点，抬高品牌溢价。这手法，和OpenAI过去几年反复渲染“AGI末日论”如出一辙。

Anthropic 曾因Claude 3在代码理解和对话逻辑上的出色表现，被开发者誉为“最聪明的AI助手”。但最近几个月，社区里关于“Claude降智”的吐槽明显增多。

有程序员反馈：“上周它还能写出优雅的Python装饰器，这周连基础的循环逻辑都写错。”

也有产品经理表示：“问它市场趋势，它开始讲哲学；问它API怎么调，它答非所问。”

与此同时，Anthropic 官方账号频繁发布“AI可能产生意识”“模型在梦中自我优化”这类模糊煽情的内容，被不少用户调侃：“是不是因为销量跟不上GPT-4，只能靠讲鬼故事刷存在感？”

当一个能发现“27年未修复漏洞”的传奇AI，被拆解成“基于200条数据的外推+10个真漏洞”，我们该问的不是“它有多强”，而是“谁在制造这种幻觉？”

在AI快速渗透金融、医疗、政府系统的今天，公众最需要的不是“末日预警”，而是透明、可验证、可审计的工程数据。一个模型是否可靠，不该靠“它能毁灭世界”来证明，而该靠它能否在真实环境中稳定、准确、低成本地完成工作。

与其害怕AI“觉醒”，不如警惕那些用恐惧包装商业野心的营销话术。真正的安全，来自开源、来自验证、来自透明，而不是来自一家公司说：“别用，它太危险了。”

——如果它真那么强，为什么不敢公开？