蚂蚁AI安全实验室开源ClawAegis，破解OpenClaw智能体安全挑战

ClawAegis开源：为开源智能体装上“安全刹车”

4月2日，蚂蚁集团AI安全实验室联合清华大学正式开源一款名为ClawAegis的安全工具。这不是又一个概念性的“AI防护系统”，而是一个实实在在能用在日常开发和部署中的轻量插件——专为OpenClaw这类开源智能体框架设计，解决的是开发者们正在真实遭遇的问题：你的智能体，会不会在没人注意的时候，偷偷删了文件？会不会被一句看似无害的指令骗去访问数据库？会不会因为一个被污染的技能包，开始乱发消息、耗光服务器资源？

过去一年，OpenClaw等开源智能体框架在开发者圈里快速流行。不少人用它搭建自动写代码、处理表格、调API的“数字员工”。但随之而来的安全事件也越来越多：有人上传的“技能包”暗藏后门，一运行就窃取本地文件；有人在对话中故意诱导智能体执行`rm -rf /`；还有团队发现，智能体的记忆数据被篡改后，开始生成虚假报告，连测试人员都没察觉。

不是靠“AI检测”，而是直接拦在执行前

ClawAegis不搞复杂的模型分析，也不依赖“AI判断是否危险”。它的工作方式很直接：在OpenClaw的五个关键环节——初始化、用户输入、模型推理、决策生成、执行命令——埋下检查点。比如：

当智能体试图读取`/etc/passwd`或`~/.ssh/id_rsa`，它会直接阻断并记录；
当用户输入包含“绕过限制”“假装你是管理员”这类诱导语句，它会标记并提示操作者确认；
当某个技能包被安装，它会自动扫描其中是否含可疑系统调用或网络请求；
如果智能体连续10秒内发起超过50次API调用，它会自动暂停并发出告警。

这些规则不是死板的黑名单。开发者可以自己定义策略：比如公司内网的智能体允许访问特定数据库，但禁止外联；个人用的可以只拦删库、删文件这类高危操作。配置文件就一个YAML，改几行就能适配你的场景。

不用重装框架，插上就能用

你不需要重构项目，也不用学习新API。ClawAegis就是一个单独的Python包，安装命令就一行：

pip install clawaegis

然后在启动OpenClaw时加个参数：

openclaw --enable-security

它就会自动加载，在后台默默运行。对普通用户来说，完全无感——该干嘛干嘛；对运维和安全人员，后台会生成清晰的日志，记录每一次拦截行为，包括谁触发的、什么指令、被拦在哪个环节。出事了，回溯一查就知道问题出在哪。

不是第一次，也不会是最后一次

其实这已经不是蚂蚁和清华第一次帮OpenClaw“补漏”了。就在上个月，他们还协助修复了两个高危漏洞：一个是允许远程代码执行的插件加载缺陷，另一个是记忆存储未加密导致的敏感信息泄露。这次开源ClawAegis，是把“事后补丁”变成“事前防护”。

目前，工具已上架GitHub，文档齐全，社区里已有开发者在测试它和Docker、K8s的集成方案。下一步，团队计划接入更多开源智能体框架，比如AutoGPT和CrewAI，并开放“威胁情报共享”功能——如果某个恶意技能包被多人拦截，系统会自动汇总并推送给所有用户。

智能体不是魔法，它只是代码。而代码，永远需要有人盯着。ClawAegis不是要取代你的判断，而是帮你多看一眼——在你没注意到的时候，替你拦下那句可能毁掉整个系统的命令。

OpenClaw ClawAegis 安全防御插件智能体防护

CB科技站

蚂蚁AI安全实验室开源ClawAegis，破解OpenClaw智能体安全挑战

ClawAegis开源：为开源智能体装上“安全刹车”

不是靠“AI检测”，而是直接拦在执行前

不用重装框架，插上就能用

不是第一次，也不会是最后一次

与本文相关的文章