AI扫描17.6万行代码仅发现1个低危漏洞

Mythos“翻车”实录：AI安全工具在curl代码库中的真实表现

近日，Anthropic公司推出的AI安全分析模型Mythos，被寄予厚望能颠覆传统代码审计方式。官方曾宣称其具备“发现隐藏漏洞的超凡能力”，甚至为确保“效果惊艳”而推迟发布。然而，当它面对全球最广泛使用的网络工具——curl的代码库时，结果却出人意料。

这场测试由curl项目创始人Daniel Stenberg亲自推动。作为拥有超过200亿次安装量的开源基石，curl的代码库早已是安全工程的标杆：历经数十年迭代，由数百名开发者共同维护，长期接受静态分析、模糊测试、人工审计和政府机构的安全审查。它的代码规范、边界处理和错误防御机制，被业内视为“教科书级别”。

Mythos的初始报告声称发现了“5个已确认安全漏洞”。但当curl团队用人工逐条复核后，真相迅速浮现：

3个所谓“漏洞”实为符合文档规范的正常行为，属于AI对协议理解偏差导致的误报；
1个是普通逻辑错误，不影响系统安全，仅需修复功能异常；
最终仅剩1个被定为“低危”的问题——一个在特定配置下可能引发内存读取越界的边缘情况，且早已在社区讨论中被提及，非全新发现。

Stenberg在公开评论中毫不留情：“这根本不是什么‘危险级能力’，更像是营销话术包装下的普通静态分析器升级版。”他指出，早在Mythos出现前，curl团队已用十余种AI和自动化工具修复了数百个潜在问题，“早期AI工具确实能抓到一些明显错误，比如未检查的缓冲区或空指针——那些是‘低垂的果实’。现在，代码库已经干净得连这些都难找了。”

AI不是万能钥匙，但它是称手的帮手

尽管结果令人失望，Stenberg并未全盘否定AI的价值。他坦言，Mythos在几个方面确实优于传统工具：

能识别注释与代码逻辑不一致的地方——比如文档说“输入长度不超过100”，但代码只检查了50；
对复杂协议（如HTTP/2、TLS握手）的上下文理解更自然，能发现配置组合中的隐性风险；
在阅读大量历史修复记录后，能推荐类似问题的修复模式，节省工程师查阅过往PR的时间。

“它不像一个专家，更像一个读过上万份安全报告、记忆力超强的实习生。”他说，“你得盯着它，纠正它，但它能帮你省下大量重复劳动。”

事实上，业内早有共识：当前AI在代码审计中，本质上是在“模式匹配”而非“推理创造”。它能识别已知漏洞的变体，却无法像人类安全研究员那样，从协议设计缺陷中推演出全新的攻击路径——比如Heartbleed或Log4Shell这类颠覆性漏洞。

真正的安全，来自工程，而非算法

此次测试暴露了一个被过度宣传的误区：把AI当作“自动安全盾牌”。现实是，curl之所以安全，不是因为用了什么AI模型，而是因为：

所有输入都强制做边界检查，哪怕多写一行代码也要确保安全；
关键函数使用静态分析工具（如Coverity、Clang Static Analyzer）做每日扫描；
所有变更必须经过至少两名资深维护者代码审查；
团队坚持“防御性编程”传统——假设一切输入都是恶意的。

据OpenSSF（开源安全基金会）2024年报告，全球Top 100开源项目中，92%的核心安全加固来自人工流程和工程规范，AI辅助仅占效率提升的15%-20%。AI能加速发现已知问题，但无法替代对安全文化的坚持。

对于企业或开源项目而言，Mythos这类工具或许值得尝试，但请别指望它能“一键修复安全”。真正可靠的防护，依然是：

持续的代码审查制度；
严格的输入验证和内存管理；
定期的渗透测试与第三方审计；
以及——一个愿意为安全多花一小时、多写一行代码的团队。

AI是工具，不是救世主。真正的安全，永远由人来守护。
漏洞检测 curl Mythos AI代码审计

CB科技站

AI扫描17.6万行代码仅发现1个低危漏洞

Mythos“翻车”实录：AI安全工具在curl代码库中的真实表现

AI不是万能钥匙，但它是称手的帮手

真正的安全，来自工程，而非算法

与本文相关的文章