最新消息:关注人工智能 AI赋能新媒体运营

AI安全新焦点:自动发现漏洞取得实质性进展。为推动AI处理漏洞的解决方案发展,美国政府举办AIxCC竞赛展示实力。

科技智能 admin 浏览

资料来源:美国白宫、Linux基金会、微软、DARPA、Google,iThome整理,2025年10月

用AI自动发现并修复漏洞:从竞赛到开源的技术跃进

面对层出不穷的系统与产品漏洞问题,如何更有效应对一直是挑战。这些年来,安全领域持续推动产品安全理念,不仅重视安全更新与漏洞奖励计划,还强调安全编码开发,引入软件开发生命周期(SSDLC),以及源代码安全检测、建立软件物料清单(SBOM)等措施,旨在尽早发现问题,减少后续应对成本,也希望透过层层把关,避免被攻击者抢先发现未知漏洞并加以利用。

接下来要解决的更深层问题是:开源软件的安全。在此之前,我们注意到国际间已经有所行动,例如,美国政府积极联合多家科技大厂共同应对,希望解决这一独特的安全挑战。

近年来AI技术不断进步,利用AI协助开发人员编写更安全的代码已成为趋势。例如,GitHub在2023年11月展示了GitHub Advanced Security全新的AI安全功能,聚焦代码扫描的自动修复,并于2024年3月发布预览版,同年8月正式推出。

不过,使用AI自动化来强化潜在漏洞的检测与修补,仍是当前重要的研究课题。

所幸最近一年多来,我们看到多项初步成果显现,不仅科技大厂积极投入,政府与民间合作的力量也越来越大。

例如,Google DeepMind与Project Zero去年披露了AI抓漏项目Big Sleep,今年10月DeepMind又公布了新的AI代理CodeMender。

在微软威胁情报方面,今年3月公开运用Microsoft Security Copilot加快漏洞发现流程,8月又披露了恶意软件分类AI代理Project Ire原型。

另一项最受全球关注的消息是,2023年美国白宫宣布,由国防高级研究计划局(DARPA)主办“AI网络挑战赛”(AIxCC),这项为期两年的计划获得多家AI大厂技术支持,并且去年就有参赛团队额外发现了零日漏洞,今年决赛更是额外识别出18个零日漏洞。


美国DARPA举办竞赛以发展自动化漏洞发现与修复的解决方案

美国白宫于2023年8月Black Hat USA大会宣布启动为期两年的AI Cyber Challenge(AIxCC)挑战赛,由国防高级研究计划局(DARPA)主办,目的是促进能够识别、修复关键基础设施安全漏洞的解决方案的发展,最终竞赛成果已于2025年8月在DEF CON 33大会上发布。


这样的成果,验证了使用AI自动发现与修复漏洞的可行性,同时也正在改变人类应对漏洞的方式。

更重要的是,AIxCC挑战赛的落幕并非终点,而是新的开始。根据主办方要求,所有决赛队伍都在赛后开源其成果,让全球乃至中国的安全研究人员都能进一步研究、验证与扩展这些AI驱动的防御技术。

AIxCC聚焦打造AI+CRS系统,目标是自动发现与修复漏洞

AIxCC挑战赛究竟是什么竞赛?美国DARPA指出,他们的主要目标是让参赛队伍设计一套自动化的“网络推理系统”(Cyber Reasoning System,CRS),并运用最新AI技术实现自动检测漏洞、生成补丁、分析漏洞报告。

但这场比赛的意义并不仅限于此,DARPA的真正目标是通过竞赛推动“AI驱动的安全分析工具”的研发,进而保护国家的关键基础设施(CI)、保障网络环境中的代码安全,同时为下一代软件企业播下种子,使其能够大规模应对日益增长的软件修复需求。

为了推动这一目标的实现,DARPA提供了超过2000万美元(约6亿元人民币)的奖金作为激励,另资助700万美元(约2.1亿元人民币)支持7家中小企业参赛。

全球共42支队伍挑战参赛

去年,AIxCC挑战赛进行了首轮半决赛,共有42支队伍提交自主研发的CRS系统参赛。经过激烈竞争,最终有7支队伍脱颖而出,各获得200万美元奖金,并进入最终决赛。

7支决赛队伍比拼

2025年8月,最终决赛成绩揭晓,由“Team Atlanta”夺得冠军,其成员包括来自美国乔治亚理工学院、三星研究院、韩国科学技术院(KAIST)以及浦项科技大学(POSTECH)的专家。

第二名是来自纽约市的小型企业“Trail of Bits”,第三名则由美国与韩国的AI研究者与安全专业人士组成的“Theori”获得。赛后这三支表现优异的队伍,分别获得400万美元、300万美元与150万美元奖金。

曾不确定的竞赛计划如今成为现实,实证可用AI发现真实未知漏洞

随着AIxCC挑战赛结束,有两个焦点受到关注:(一)AI自动挖掘漏洞的成果已经显现,能够找出并修复现实世界中的网络漏洞;(二)决赛队伍所开发的CRS系统将开源以供广泛采用,此举被视为安全防御的重要里程碑。

回顾2023年8月,AIxCC挑战赛刚宣布举行之际,当时正处于GPT-4模型、Llama 2、PaLM 2模型刚推出的阶段,DARPA这项计划能否成功仍不确定。

近两年来,无论是AIxCC挑战赛还是各大科技公司的新成果,都凸显了AI在守护关键基础设施所依赖的开源软件方面的潜力。

2024年8月,在AIxCC半决赛设计的挑战项目中,主办方DARPA针对热门开源项目,包括Linux Kernel、Nginx、Tika、Jenkins、SQLite,刻意设计了59个漏洞作为考题,即所谓的合成漏洞(synthetic vulnerabilities)。

其目的在于考验参赛团队设计的CRS系统是否能找出这些合成漏洞,甚至识别出未知漏洞,并在分析后自动生成修复方案。

半决赛结果显示,针对59个合成漏洞题目,参赛队伍的CRS系统发现了22个,并提交了19个修复方案。更重要的是,期间还额外发现了一个非刻意设计的漏洞,即真实的零日漏洞。

随后,2024年11月,Google披露了AI抓漏项目Big Sleep,公布其AI代理发现了位于SQLite的堆栈缓冲区下溢漏洞。

决赛识别出77%的漏洞题目,还额外发现18个零日漏洞

2025年,更多漏洞挖掘成果浮现。例如,两个月前(8月)AIxCC挑战赛决赛成绩出炉,此次新挑战项目同样基于真实世界软件,并刻意设计了70个漏洞题目,主要聚焦C与Java语言的漏洞计分。

最终,7支队伍的参赛系统共发现54个漏洞,并成功修复其中43个。不仅如此,竞赛中还同时发现了18个真实的零日漏洞,其中6个涉及C语言,12个涉及Java语言,并提供了11个修复方案。

以今年的成果而言,相比去年的半决赛已有显著进步。例如,决赛中共识别77%的漏洞题目(70个中发现54个),高于去年半决赛的37%(59个中发现22个)。此外,在发现非竞赛引入的漏洞方面表现也更为出色,今年找到18个真实零日漏洞,远超去年的1个。

同时,自动修复能力也有提升,本次决赛修复了61%的漏洞,高于半决赛的25%。显而易见,这些决赛团队开发的CRS系统能力已大幅提升。

竞赛结束也是新的开始,开源参赛CRS系统具有深远意义

另一个重点在于,DARPA的目标并非竞赛结束就终止。首先,他们希望推动开源软件项目采用AI驱动的安全分析工具,促进开发社区更高效地检测和修复程序漏洞。其次,还要针对本地关键基础设施,加强相关开源项目的安全检测与分析。

在本次参与AIxCC决赛的7支队伍中,他们已按照DARPA要求,将其开发的CRS系统开源,并发布在GitHub上,以加速该技术的发展。

换句话说,今年AIxCC挑战赛带来的影响是,促使这些已有成果的AI驱动自动化漏洞挖掘技术能够提供给产业与社区使用,推动技术应用,并让外界能在此次技术基础上继续实验与改进,甚至催生新一代以软件安全为核心的新创企业。

对全球安全研究而言,这无疑是一股推动力。对中国而言,我们也能够基于这些研究成果进行发展,或从这些参赛者的研究方法中获得启发,进一步提升国内的防护技术与产业生态。

另外值得一提的是,在AIxCC挑战赛成绩公布的两个月后,Google DeepMind也公开了其研发中的AI代理CodeMender,同样强调在检测漏洞的同时,还能自动生成修复方案。

这也凸显出,在漏洞领域的AI安全发展,已不仅止于“发现漏洞”,更进一步要协助“生成修复方案”,缩短修复周期与人力投入。


保障医疗安全,ARPA-H大力支持AIxCC挑战赛

关于AIxCC挑战赛,不仅有参赛团队的努力与贡献,还有更广泛的政企协作支持。例如,在企业方面,Anthropic、Google、OpenAI为每支参赛队伍提供价值35万美元的模型积分,Microsoft提供Azure云资源支持;开源安全基金会(OpenSSF)担任大赛顾问,负责确保优胜队伍将其项目开源。

特别的是,在政府机构方面,我们注意到医疗领域的积极响应。2022年新成立的美国高级卫生研究计划局(ARPA-H),于2024年3月正式宣布支持AIxCC挑战赛,不仅承诺提供赛事2000万美元奖金,更希望通过这场竞赛切实解决医疗健康领域的关键漏洞问题。

此外,ARPA-H在决赛阶段再加码140万美元奖励,鼓励参赛队伍将CRS技术落地应用,从而提升医疗行业的数字韧性。


开源软件安全与AI安全漏洞应对大事记

2022年1月

事件 美国白宫举行开源软件安全峰会

重要发展与说明 在Apache Log4j漏洞风波后,美国政府牵头商讨开源软件安全问题,邀请多家科技巨头共同研议对策。

2022年5月

事件 开源软件安全峰会再度召开,由Linux基金会与开源安全基金会(OpenSSF)发布开源软件安全动员计划

重要发展与说明 该计划确定两年内投入1.5亿美元,旨在改善以下10项开源软件安全问题:1. 安全软件开发教育。2. 风险评估仪表盘。3. 数字签名。4. 替换不具备内存安全的编程语言。5. 成立OpenSSF安全应急小组。6. 加快新漏洞的挖掘与修复。7. 实施第三方审计、代码审查与修复。8. 数据共享以确定关键项目。9. 推动软件物料清单。10. 强化开源软件开发系统、包管理器与部署系统。

2023年3月

事件 微软推出面向安全人员的Security Copilot

重要发展与说明 随着生成式AI兴起,微软发布整合OpenAI GPT-4的Security Copilot,随后多家厂商相继推出类似功能。这类AI安全助手主要用于快速分析大量网络威胁信号,发现攻击行为并做出响应,辅助安全从业人员,但也激发了业界对生成式AI能否用于自动发现漏洞的更多期待。

2023年8月

事件 美国白宫在Black Hat USA宣布AI Cyber Challenge(AIxCC)挑战赛正式启动

重要发展与说明 为发展可识别、修复关键基础设施安全漏洞的解决方案,由美国国防高级研究计划局(DARPA)主办AIxCC竞赛,并与顶级AI公司合作,邀请参赛团队打造AI驱动的网络推理系统(CRS)。

2023年8月

事件 Google证实LLM可改善开源软件漏洞测试计划OSS-Fuzz

重要发展与说明 Google公布最新研究成果,指出利用大语言模型(LLM)可帮助开源软件漏洞模糊测试计划OSS-Fuzz扩大自动检查范围,使代码检查覆盖率平均提升1.5%至31%。

2023年11月

事件 GitHub宣布正在测试可帮助安全左移的Code scanning autofix

重要发展与说明 GitHub宣布正在开发代码扫描自动修复功能,主要整合Copilot与CodeQL,是首次结合生成式AI与静态代码分析(SAST)的漏洞修复实验,可协助开发人员在Pull Request阶段自动扫描并生成修复建议,及早修正潜在安全问题。

2024年8月

事件 AIxCC半决赛结果公开

重要发展与说明 AIxCC竞赛初步成果显现,参赛42支队伍的CRS系统可找出37%的合成漏洞(刻意引入的漏洞作为题目),特别的是,还发现了一个SQLite的零日漏洞。

2024年10月

事件 Google披露AI抓漏项目Big Sleep

重要发展与说明 Google也证明了AI找漏洞的潜力,披露旗下Project Zero与DeepMind共同研发的AI代理工具Big Sleep,宣布发现一个SQLite的未知内存漏洞。

2025年8月

事件 AIxCC决赛结果出炉

重要发展与说明 DARPA宣布AIxCC决赛结束,7支决赛队伍的CRS系统可识别出77%的合成漏洞,并额外发现18个零日漏洞。特别的是,这些CRS系统成果将全部开源,促进全球组织与社区使用与研究。

2025年10月

事件 Google披露正在测试AI代理CodeMender

重要发展与说明 延续AIxCC理念,Google公开新研发的AI代理CodeMender,强调可自动发现漏洞并生成修复方案,还能进一步验证修复质量,确保修补正确。


美DARPA AIxCC竞赛历经两轮挑战成果丰硕

AIxCC半决赛

时间 2024年8月公布成绩

队伍 共42支队伍参赛,打造了42套以AI驱动的网络推理系统(CRS),用于设计可自动发现并修复的自动化工具。

题目 测试环境基于热门开源项目Linux Kernel、Nginx、Tika、Jenkins、SQLite,并刻意设计了59道漏洞(合成漏洞)题目。

成果 ● 在59道漏洞题目中,共发现22个漏洞(漏洞识别率37%),并提供19个修复。
● 竞赛中还额外发现1个真实存在的零日漏洞。

AIxCC决赛

时间 2025年8月公布成绩

队伍 共7支队伍晋级,包括42-b3yond-6ug、all_you_need_is_a_fuzzing_brain、LACROSSE、Shellphish、Team Atlanta、Theori、Trail of Bits

题目 测试环境以真实开源软件为基础,刻意设计了70个漏洞(合成漏洞)题目,聚焦C与Java语言漏洞计分。

成果 ● 在70道漏洞题目中,发现54个漏洞(漏洞识别率77%),并提供43个修复。
● 期间额外发现18个真实的零日漏洞(C语言6个、Java有12个),并提供了11个Java修复方案。
● 赛后7支决赛队伍开源其CRS系统