最新消息:关注人工智能 AI赋能新媒体运营

Claude Mythos 被曝漏洞注水:数千漏洞中仅约10个为严重问题

科技资讯 admin 浏览

“最强AI”神话破灭:Claude Mythos 的真实表现远没那么可怕

最近,Anthropic 推出的所谓“Claude Mythos Preview”被渲染成能“一键摧毁全球软件安全”的核武级AI,引发金融机构和安全团队集体焦虑。多家银行甚至紧急召开内部会议,评估“AI漏洞猎手”可能带来的系统性风险。但当独立技术团队真刀真枪地测试后,现实却远比宣传冷淡得多。

“数千个漏洞”?不过是数学上的幻觉

Anthropic 曾宣称 Mythos 能自动发现“数千个高危安全漏洞”,并以此为由启动了名为 Project Glasswing 的封闭测试计划,仅向谷歌、微软等极少数企业开放。但《Tom’s Hardware》团队的一份实测报告揭开了这层滤镜。

所谓的“数千个”,源于对仅198份人工审计报告的90%准确率进行外推——也就是说,模型在不到200个案例中表现尚可,就被放大成足以覆盖全球软件生态的能力。这就像根据你家楼道的3个门锁没坏,就断言整座城市所有门锁都万无一失。

更关键的是,在对7000个主流开源项目进行实际扫描后,Mythos 标记出约600个“漏洞”,但经过安全专家逐条复核,真正具备可利用性、能被攻击者利用的严重漏洞,只有不到10个。其余大多是过时依赖、废弃配置或早已被修复的旧问题。

一位在某大型银行负责安全运营的工程师透露:“我们试了两周,每天收到上百条警报,95%都是误报。最后还得靠人工一条条筛,反而比以前更累了。”

“不开放”不是怕它太强,而是它太贵

Anthropic 一直强调,Mythos “过于强大”,为避免被滥用才限制访问。但事实是,这个模型早已悄悄上线亚马逊AWS和微软Azure平台,只是定价高得离谱——单次调用成本超过20美元,是普通AI模型的50倍以上。

这意味着,只有像谷歌、摩根士丹利这种每年花数千万美元在云服务上的巨头,才负担得起“试用”。普通企业连登录页面都进不去,更别说“失控风险”了。

业内普遍认为,这根本不是技术管控,而是一场精心设计的营销:先用“AI将毁灭世界”的叙事制造恐慌,再以“我们是唯一能控制它的人”为卖点,抬高品牌溢价。这手法,和OpenAI过去几年反复渲染“AGI末日论”如出一辙。

口碑下滑:用户开始怀疑“Claude是不是变笨了?”

Anthropic 曾因Claude 3在代码理解和对话逻辑上的出色表现,被开发者誉为“最聪明的AI助手”。但最近几个月,社区里关于“Claude降智”的吐槽明显增多。

有程序员反馈:“上周它还能写出优雅的Python装饰器,这周连基础的循环逻辑都写错。”

也有产品经理表示:“问它市场趋势,它开始讲哲学;问它API怎么调,它答非所问。”

与此同时,Anthropic 官方账号频繁发布“AI可能产生意识”“模型在梦中自我优化”这类模糊煽情的内容,被不少用户调侃:“是不是因为销量跟不上GPT-4,只能靠讲鬼故事刷存在感?”

真正的威胁,是被包装出来的恐惧

当一个能发现“27年未修复漏洞”的传奇AI,被拆解成“基于200条数据的外推+10个真漏洞”,我们该问的不是“它有多强”,而是“谁在制造这种幻觉?”

在AI快速渗透金融、医疗、政府系统的今天,公众最需要的不是“末日预警”,而是透明、可验证、可审计的工程数据。一个模型是否可靠,不该靠“它能毁灭世界”来证明,而该靠它能否在真实环境中稳定、准确、低成本地完成工作。

与其害怕AI“觉醒”,不如警惕那些用恐惧包装商业野心的营销话术。真正的安全,来自开源、来自验证、来自透明,而不是来自一家公司说:“别用,它太危险了。”

——如果它真那么强,为什么不敢公开?