AI安全新焦点：自动发现漏洞取得实质性进展。为推动AI处理漏洞的解决方案发展，美国政府举办AIxCC竞赛展示实力。

资料来源：美国白宫、Linux基金会、微软、DARPA、Google，iThome整理，2025年10月

用AI自动发现并修复漏洞：从竞赛到开源的技术跃进

面对层出不穷的系统与产品漏洞问题，如何更有效应对一直是挑战。这些年来，安全领域持续推动产品安全理念，不仅重视安全更新与漏洞奖励计划，还强调安全编码开发，引入软件开发生命周期（SSDLC），以及源代码安全检测、建立软件物料清单（SBOM）等措施，旨在尽早发现问题，减少后续应对成本，也希望透过层层把关，避免被攻击者抢先发现未知漏洞并加以利用。

接下来要解决的更深层问题是：开源软件的安全。在此之前，我们注意到国际间已经有所行动，例如，美国政府积极联合多家科技大厂共同应对，希望解决这一独特的安全挑战。

近年来AI技术不断进步，利用AI协助开发人员编写更安全的代码已成为趋势。例如，GitHub在2023年11月展示了GitHub Advanced Security全新的AI安全功能，聚焦代码扫描的自动修复，并于2024年3月发布预览版，同年8月正式推出。

不过，使用AI自动化来强化潜在漏洞的检测与修补，仍是当前重要的研究课题。

所幸最近一年多来，我们看到多项初步成果显现，不仅科技大厂积极投入，政府与民间合作的力量也越来越大。

例如，Google DeepMind与Project Zero去年披露了AI抓漏项目Big Sleep，今年10月DeepMind又公布了新的AI代理CodeMender。

在微软威胁情报方面，今年3月公开运用Microsoft Security Copilot加快漏洞发现流程，8月又披露了恶意软件分类AI代理Project Ire原型。

另一项最受全球关注的消息是，2023年美国白宫宣布，由国防高级研究计划局（DARPA）主办“AI网络挑战赛”（AIxCC），这项为期两年的计划获得多家AI大厂技术支持，并且去年就有参赛团队额外发现了零日漏洞，今年决赛更是额外识别出18个零日漏洞。

美国DARPA举办竞赛以发展自动化漏洞发现与修复的解决方案

美国白宫于2023年8月Black Hat USA大会宣布启动为期两年的AI Cyber Challenge（AIxCC）挑战赛，由国防高级研究计划局（DARPA）主办，目的是促进能够识别、修复关键基础设施安全漏洞的解决方案的发展，最终竞赛成果已于2025年8月在DEF CON 33大会上发布。

这样的成果，验证了使用AI自动发现与修复漏洞的可行性，同时也正在改变人类应对漏洞的方式。

更重要的是，AIxCC挑战赛的落幕并非终点，而是新的开始。根据主办方要求，所有决赛队伍都在赛后开源其成果，让全球乃至中国的安全研究人员都能进一步研究、验证与扩展这些AI驱动的防御技术。

AIxCC聚焦打造AI+CRS系统，目标是自动发现与修复漏洞

AIxCC挑战赛究竟是什么竞赛？美国DARPA指出，他们的主要目标是让参赛队伍设计一套自动化的“网络推理系统”（Cyber Reasoning System，CRS），并运用最新AI技术实现自动检测漏洞、生成补丁、分析漏洞报告。

但这场比赛的意义并不仅限于此，DARPA的真正目标是通过竞赛推动“AI驱动的安全分析工具”的研发，进而保护国家的关键基础设施（CI）、保障网络环境中的代码安全，同时为下一代软件企业播下种子，使其能够大规模应对日益增长的软件修复需求。

为了推动这一目标的实现，DARPA提供了超过2000万美元（约6亿元人民币）的奖金作为激励，另资助700万美元（约2.1亿元人民币）支持7家中小企业参赛。

全球共42支队伍挑战参赛

去年，AIxCC挑战赛进行了首轮半决赛，共有42支队伍提交自主研发的CRS系统参赛。经过激烈竞争，最终有7支队伍脱颖而出，各获得200万美元奖金，并进入最终决赛。

7支决赛队伍比拼

2025年8月，最终决赛成绩揭晓，由“Team Atlanta”夺得冠军，其成员包括来自美国乔治亚理工学院、三星研究院、韩国科学技术院（KAIST）以及浦项科技大学（POSTECH）的专家。

第二名是来自纽约市的小型企业“Trail of Bits”，第三名则由美国与韩国的AI研究者与安全专业人士组成的“Theori”获得。赛后这三支表现优异的队伍，分别获得400万美元、300万美元与150万美元奖金。

曾不确定的竞赛计划如今成为现实，实证可用AI发现真实未知漏洞

随着AIxCC挑战赛结束，有两个焦点受到关注：（一）AI自动挖掘漏洞的成果已经显现，能够找出并修复现实世界中的网络漏洞；（二）决赛队伍所开发的CRS系统将开源以供广泛采用，此举被视为安全防御的重要里程碑。

回顾2023年8月，AIxCC挑战赛刚宣布举行之际，当时正处于GPT-4模型、Llama 2、PaLM 2模型刚推出的阶段，DARPA这项计划能否成功仍不确定。

近两年来，无论是AIxCC挑战赛还是各大科技公司的新成果，都凸显了AI在守护关键基础设施所依赖的开源软件方面的潜力。

2024年8月，在AIxCC半决赛设计的挑战项目中，主办方DARPA针对热门开源项目，包括Linux Kernel、Nginx、Tika、Jenkins、SQLite，刻意设计了59个漏洞作为考题，即所谓的合成漏洞（synthetic vulnerabilities）。

其目的在于考验参赛团队设计的CRS系统是否能找出这些合成漏洞，甚至识别出未知漏洞，并在分析后自动生成修复方案。

半决赛结果显示，针对59个合成漏洞题目，参赛队伍的CRS系统发现了22个，并提交了19个修复方案。更重要的是，期间还额外发现了一个非刻意设计的漏洞，即真实的零日漏洞。

随后，2024年11月，Google披露了AI抓漏项目Big Sleep，公布其AI代理发现了位于SQLite的堆栈缓冲区下溢漏洞。

决赛识别出77%的漏洞题目，还额外发现18个零日漏洞

2025年，更多漏洞挖掘成果浮现。例如，两个月前（8月）AIxCC挑战赛决赛成绩出炉，此次新挑战项目同样基于真实世界软件，并刻意设计了70个漏洞题目，主要聚焦C与Java语言的漏洞计分。

最终，7支队伍的参赛系统共发现54个漏洞，并成功修复其中43个。不仅如此，竞赛中还同时发现了18个真实的零日漏洞，其中6个涉及C语言，12个涉及Java语言，并提供了11个修复方案。

以今年的成果而言，相比去年的半决赛已有显著进步。例如，决赛中共识别77%的漏洞题目（70个中发现54个），高于去年半决赛的37%（59个中发现22个）。此外，在发现非竞赛引入的漏洞方面表现也更为出色，今年找到18个真实零日漏洞，远超去年的1个。

同时，自动修复能力也有提升，本次决赛修复了61%的漏洞，高于半决赛的25%。显而易见，这些决赛团队开发的CRS系统能力已大幅提升。

竞赛结束也是新的开始，开源参赛CRS系统具有深远意义

另一个重点在于，DARPA的目标并非竞赛结束就终止。首先，他们希望推动开源软件项目采用AI驱动的安全分析工具，促进开发社区更高效地检测和修复程序漏洞。其次，还要针对本地关键基础设施，加强相关开源项目的安全检测与分析。

在本次参与AIxCC决赛的7支队伍中，他们已按照DARPA要求，将其开发的CRS系统开源，并发布在GitHub上，以加速该技术的发展。

换句话说，今年AIxCC挑战赛带来的影响是，促使这些已有成果的AI驱动自动化漏洞挖掘技术能够提供给产业与社区使用，推动技术应用，并让外界能在此次技术基础上继续实验与改进，甚至催生新一代以软件安全为核心的新创企业。

对全球安全研究而言，这无疑是一股推动力。对中国而言，我们也能够基于这些研究成果进行发展，或从这些参赛者的研究方法中获得启发，进一步提升国内的防护技术与产业生态。

另外值得一提的是，在AIxCC挑战赛成绩公布的两个月后，Google DeepMind也公开了其研发中的AI代理CodeMender，同样强调在检测漏洞的同时，还能自动生成修复方案。

这也凸显出，在漏洞领域的AI安全发展，已不仅止于“发现漏洞”，更进一步要协助“生成修复方案”，缩短修复周期与人力投入。

保障医疗安全，ARPA-H大力支持AIxCC挑战赛

关于AIxCC挑战赛，不仅有参赛团队的努力与贡献，还有更广泛的政企协作支持。例如，在企业方面，Anthropic、Google、OpenAI为每支参赛队伍提供价值35万美元的模型积分，Microsoft提供Azure云资源支持；开源安全基金会（OpenSSF）担任大赛顾问，负责确保优胜队伍将其项目开源。

特别的是，在政府机构方面，我们注意到医疗领域的积极响应。2022年新成立的美国高级卫生研究计划局（ARPA-H），于2024年3月正式宣布支持AIxCC挑战赛，不仅承诺提供赛事2000万美元奖金，更希望通过这场竞赛切实解决医疗健康领域的关键漏洞问题。

此外，ARPA-H在决赛阶段再加码140万美元奖励，鼓励参赛队伍将CRS技术落地应用，从而提升医疗行业的数字韧性。

开源软件安全与AI安全漏洞应对大事记

2022年1月

事件美国白宫举行开源软件安全峰会

重要发展与说明在Apache Log4j漏洞风波后，美国政府牵头商讨开源软件安全问题，邀请多家科技巨头共同研议对策。

2022年5月

事件开源软件安全峰会再度召开，由Linux基金会与开源安全基金会（OpenSSF）发布开源软件安全动员计划

重要发展与说明该计划确定两年内投入1.5亿美元，旨在改善以下10项开源软件安全问题：1. 安全软件开发教育。2. 风险评估仪表盘。3. 数字签名。4. 替换不具备内存安全的编程语言。5. 成立OpenSSF安全应急小组。6. 加快新漏洞的挖掘与修复。7. 实施第三方审计、代码审查与修复。8. 数据共享以确定关键项目。9. 推动软件物料清单。10. 强化开源软件开发系统、包管理器与部署系统。

2023年3月

事件微软推出面向安全人员的Security Copilot

重要发展与说明随着生成式AI兴起，微软发布整合OpenAI GPT-4的Security Copilot，随后多家厂商相继推出类似功能。这类AI安全助手主要用于快速分析大量网络威胁信号，发现攻击行为并做出响应，辅助安全从业人员，但也激发了业界对生成式AI能否用于自动发现漏洞的更多期待。

2023年8月

事件美国白宫在Black Hat USA宣布AI Cyber Challenge（AIxCC）挑战赛正式启动

重要发展与说明为发展可识别、修复关键基础设施安全漏洞的解决方案，由美国国防高级研究计划局（DARPA）主办AIxCC竞赛，并与顶级AI公司合作，邀请参赛团队打造AI驱动的网络推理系统（CRS）。

2023年8月

事件 Google证实LLM可改善开源软件漏洞测试计划OSS-Fuzz

重要发展与说明 Google公布最新研究成果，指出利用大语言模型（LLM）可帮助开源软件漏洞模糊测试计划OSS-Fuzz扩大自动检查范围，使代码检查覆盖率平均提升1.5%至31%。

2023年11月

事件 GitHub宣布正在测试可帮助安全左移的Code scanning autofix

重要发展与说明 GitHub宣布正在开发代码扫描自动修复功能，主要整合Copilot与CodeQL，是首次结合生成式AI与静态代码分析（SAST）的漏洞修复实验，可协助开发人员在Pull Request阶段自动扫描并生成修复建议，及早修正潜在安全问题。

2024年8月

事件 AIxCC半决赛结果公开

重要发展与说明 AIxCC竞赛初步成果显现，参赛42支队伍的CRS系统可找出37%的合成漏洞（刻意引入的漏洞作为题目），特别的是，还发现了一个SQLite的零日漏洞。

2024年10月

事件 Google披露AI抓漏项目Big Sleep

重要发展与说明 Google也证明了AI找漏洞的潜力，披露旗下Project Zero与DeepMind共同研发的AI代理工具Big Sleep，宣布发现一个SQLite的未知内存漏洞。

2025年8月

事件 AIxCC决赛结果出炉

重要发展与说明 DARPA宣布AIxCC决赛结束，7支决赛队伍的CRS系统可识别出77%的合成漏洞，并额外发现18个零日漏洞。特别的是，这些CRS系统成果将全部开源，促进全球组织与社区使用与研究。

2025年10月

事件 Google披露正在测试AI代理CodeMender

重要发展与说明延续AIxCC理念，Google公开新研发的AI代理CodeMender，强调可自动发现漏洞并生成修复方案，还能进一步验证修复质量，确保修补正确。

美DARPA AIxCC竞赛历经两轮挑战成果丰硕

AIxCC半决赛

时间 2024年8月公布成绩

队伍共42支队伍参赛，打造了42套以AI驱动的网络推理系统（CRS），用于设计可自动发现并修复的自动化工具。

题目测试环境基于热门开源项目Linux Kernel、Nginx、Tika、Jenkins、SQLite，并刻意设计了59道漏洞（合成漏洞）题目。

成果 ● 在59道漏洞题目中，共发现22个漏洞（漏洞识别率37%），并提供19个修复。
● 竞赛中还额外发现1个真实存在的零日漏洞。

AIxCC决赛

时间 2025年8月公布成绩

队伍共7支队伍晋级，包括42-b3yond-6ug、all_you_need_is_a_fuzzing_brain、LACROSSE、Shellphish、Team Atlanta、Theori、Trail of Bits

题目测试环境以真实开源软件为基础，刻意设计了70个漏洞（合成漏洞）题目，聚焦C与Java语言漏洞计分。

成果 ● 在70道漏洞题目中，发现54个漏洞（漏洞识别率77%），并提供43个修复。
● 期间额外发现18个真实的零日漏洞（C语言6个、Java有12个），并提供了11个Java修复方案。
● 赛后7支决赛队伍开源其CRS系统

AI安全 AIxCC竞赛漏洞发现自动化漏洞检测美国政府

CB科技站