腾讯云开源CubeSandbox：高性能AI Agent安全沙箱

CubeSandbox 开源：让 AI Agent 执行更稳、更快、更省钱

在 AI Agent 应用快速落地的今天，开发者最头疼的不是写逻辑，而是怎么让代码安全、稳定、低成本地跑起来。一个 Agent 要不断调用工具、执行代码、循环思考，每次启动都要等几秒？内存吃掉几十兆？一旦出错还可能拖垮整个服务？这些问题，腾讯云今天用一个叫 CubeSandbox 的开源项目给出了答案。

这不是又一个“听起来很牛”的概念，而是一个已经在腾讯内部“元宝”AI 编程系统中跑了一年多、每天支撑数百万次代码执行的真实工具。今天，它正式开源，面向所有开发者免费使用。

不用改代码，直接换环境

很多团队现在用的是国外的闭源沙箱服务，比如 E2B。但费用高、网络慢、数据出不去，想换又怕改代码改到崩溃。CubeSandbox 的第一个好处就是：你不用动一行业务代码。

它原生兼容 E2B 的 API 接口。你原来怎么调用，现在还怎么调。只需要改两个环境变量，把请求地址从国外换到本地，剩下的——启动、执行、返回结果——全由 CubeSandbox 接管。迁移过程，团队里一个后端工程师半天就能搞定。

不只是单次执行，它能完整支撑 Agent 的“思考→执行→观察→再思考”闭环。不管是写个自动写代码的小助手，还是训练一个能自己调 API、分析数据、调整策略的强化学习 Agent，它都能稳稳扛住。

冷启动只要 60 毫秒，不是“差不多快”

传统方案启动一个隔离环境，动辄 2~5 秒。对用户来说，就是“等一下”；对 Agent 来说，就是“反应迟钝”。CubeSandbox 把这个时间压到了 60 毫秒以内——比你点一次鼠标还快。

怎么做到的？他们没用虚拟机，也没用普通容器。而是用了一套自己打磨的“预热+快照+克隆”机制：

后台提前准备好一堆“干净”的运行环境模板（资源池化）
每次需要新沙箱，直接克隆一个快照，不是从零启动
内核级锁优化，避免多个沙箱抢资源卡顿

实测数据：50 个沙箱同时启动，平均响应时间 67 毫秒。不是“理论上能”，是压测跑出来的数字。你写个 Agent，每秒处理 10 个请求？完全不是问题。

一个沙箱只占 5MB 内存，服务器能跑两千个

以前一个隔离环境，至少要 20MB 内存起步。现在呢？CubeSandbox 单实例内存占用压到 5MB 以下。

这背后是真刀真枪的优化：

用 Rust 重写了核心模块，去掉冗余依赖
内存用写时复制（CoW），多个沙箱共享相同代码和库
磁盘用 reflink，副本不占额外空间

结果就是：一台 96 核的物理机，能同时跑 2000+ 个沙箱。这在以前根本不敢想——要么你买云主机，一个实例几百块一个月；要么你自己搭，一堆虚拟机扛不住。

在腾讯内部，“元宝”系统用这套方案后，计算资源消耗直接降了 95.8%。换算成钱，一年省下数百万服务器费用。

安全不是口号，是硬件隔离

有人担心：沙箱不安全，代码一跑就黑了服务器？CubeSandbox 的设计原则是：别信任何代码。

每个沙箱运行在独立的 Linux 内核上，不是容器共享内核。就算你跑的代码是恶意的、死循环的、疯狂读写磁盘的，最多崩掉你这一个沙箱，不会影响宿主机，也不会影响其他用户的任务。

网络权限也能细粒度控制：你可以让某个 Agent 只能访问内网 API，不能连外网；或者只允许访问特定域名。不需要开防火墙规则，直接在沙箱配置里定义。

为什么现在开源？

腾讯不是第一次开源基础设施。但这次不一样——他们没等“完美”，而是选在“够用、稳定、能救急”的时候推出来。

过去一年，CubeSandbox 在“元宝”系统里扛住了每天百万级的代码执行请求，修复了 37 个关键稳定性问题，优化了 12 项性能瓶颈。现在，他们觉得：是时候让外面的开发者也用上了。

你不一定要用腾讯云。你可以把它部署在自己的服务器、私有云、甚至边缘节点。开源协议是 Apache 2.0，商用无限制，文档齐全，GitHub 仓库已上线，有完整的安装脚本和示例项目。

如果你正在为 Agent 的执行效率发愁，为成本焦虑，或者被国外服务的网络延迟和数据合规问题卡住——CubeSandbox 不是“下一个选择”，它是现在就能用的、真实跑通的解决方案。

项目地址：https://github.com/Tencent/CubeSandbox

AI Agent CubeSandbox 沙箱执行环境硬件级隔离

CB科技站