
Google推出AI产品专属漏洞奖励计划 最高奖金达3万美元
Google周一(10月6日)发布了专属于AI产品的漏洞奖励计划,根据产品等级与漏洞严重程度发放奖励,最高奖金可达3万美元。不过,Google也提醒,无论是越狱、提示注入还是对齐问题均未被列入奖励范围。
Google于2023年10月正式将AI产品纳入滥用漏洞奖励计划(Abuse Vulnerability Reward Program,Abuse VRP),至今已发放超过43万美元的相关漏洞奖励。此次更新主要是为了明确奖励范围,并整合滥用与安全问题,同时鼓励安全研究人员专注于影响力最大且奖励最高的目标。
在新的AI VRP中,Google首先对产品进行分级,等级越高,奖金越多。例如,Google搜索、Gemini应用以及Google Workspace各类核心应用均属于旗舰产品;而AI Studio、Jules以及Google Workspace的非核心应用则被列为标准产品,集成在Google产品中的其他AI功能则归类为其他类别。
漏洞悬赏范围包括:能够修改受害者账户或数据状态并造成安全影响的攻击;敏感数据泄露;可用于实施钓鱼攻击的Google网站漏洞;可窃取完整、详细且机密模型参数的漏洞;可持续修改AI系统上下文的安全漏洞;访问控制绕过漏洞;未经授权使用产品;以及持续性服务拒绝攻击漏洞。
若在旗舰级AI产品中发现能修改受害者账号或数据的安全漏洞(Rogue Actions),其基本奖金为2万美元;若报告质量高且漏洞具有新颖性,最高可获得3万美元奖励。
值得注意的是,Google此次特别澄清,无论是越狱(Jailbreak)、提示注入(Prompt Injection)还是对齐问题(Alignment Issues)均未被列入AI VRP奖励范围。其中,越狱指通过特定提示诱导AI解除原有的安全限制,例如让其说出原本禁止的内容;提示注入则是在输入时嵌入恶意指令,诱导AI忽略原始任务而执行黑客行为;对齐问题是指AI模型未能符合预期或道德标准。
Google解释称,VRP的主要目的是鼓励安全研究人员向公司报告安全漏洞与滥用问题,但上述问题属于内容范畴,需要长期且跨学科的努力,必须通过分析大量报告的趋势、更新模型以及评估用户上下文来改善,与VRP的目标不一致,因此未纳入奖励范围。但研究人员仍可通过产品内的反馈机制向Google举报此类问题。