CubeSandbox 开源:让 AI Agent 执行更稳、更快、更省钱
在 AI Agent 应用快速落地的今天,开发者最头疼的不是写逻辑,而是怎么让代码安全、稳定、低成本地跑起来。一个 Agent 要不断调用工具、执行代码、循环思考,每次启动都要等几秒?内存吃掉几十兆?一旦出错还可能拖垮整个服务?这些问题,腾讯云今天用一个叫 CubeSandbox 的开源项目给出了答案。
这不是又一个“听起来很牛”的概念,而是一个已经在腾讯内部“元宝”AI 编程系统中跑了一年多、每天支撑数百万次代码执行的真实工具。今天,它正式开源,面向所有开发者免费使用。

不用改代码,直接换环境
很多团队现在用的是国外的闭源沙箱服务,比如 E2B。但费用高、网络慢、数据出不去,想换又怕改代码改到崩溃。CubeSandbox 的第一个好处就是:你不用动一行业务代码。
它原生兼容 E2B 的 API 接口。你原来怎么调用,现在还怎么调。只需要改两个环境变量,把请求地址从国外换到本地,剩下的——启动、执行、返回结果——全由 CubeSandbox 接管。迁移过程,团队里一个后端工程师半天就能搞定。
不只是单次执行,它能完整支撑 Agent 的“思考→执行→观察→再思考”闭环。不管是写个自动写代码的小助手,还是训练一个能自己调 API、分析数据、调整策略的强化学习 Agent,它都能稳稳扛住。

冷启动只要 60 毫秒,不是“差不多快”
传统方案启动一个隔离环境,动辄 2~5 秒。对用户来说,就是“等一下”;对 Agent 来说,就是“反应迟钝”。CubeSandbox 把这个时间压到了 60 毫秒以内——比你点一次鼠标还快。
怎么做到的?他们没用虚拟机,也没用普通容器。而是用了一套自己打磨的“预热+快照+克隆”机制:
- 后台提前准备好一堆“干净”的运行环境模板(资源池化)
- 每次需要新沙箱,直接克隆一个快照,不是从零启动
- 内核级锁优化,避免多个沙箱抢资源卡顿
实测数据:50 个沙箱同时启动,平均响应时间 67 毫秒。不是“理论上能”,是压测跑出来的数字。你写个 Agent,每秒处理 10 个请求?完全不是问题。
一个沙箱只占 5MB 内存,服务器能跑两千个
以前一个隔离环境,至少要 20MB 内存起步。现在呢?CubeSandbox 单实例内存占用压到 5MB 以下。
这背后是真刀真枪的优化:
- 用 Rust 重写了核心模块,去掉冗余依赖
- 内存用写时复制(CoW),多个沙箱共享相同代码和库
- 磁盘用 reflink,副本不占额外空间
结果就是:一台 96 核的物理机,能同时跑 2000+ 个沙箱。这在以前根本不敢想——要么你买云主机,一个实例几百块一个月;要么你自己搭,一堆虚拟机扛不住。
在腾讯内部,“元宝”系统用这套方案后,计算资源消耗直接降了 95.8%。换算成钱,一年省下数百万服务器费用。
安全不是口号,是硬件隔离
有人担心:沙箱不安全,代码一跑就黑了服务器?CubeSandbox 的设计原则是:别信任何代码。
每个沙箱运行在独立的 Linux 内核上,不是容器共享内核。就算你跑的代码是恶意的、死循环的、疯狂读写磁盘的,最多崩掉你这一个沙箱,不会影响宿主机,也不会影响其他用户的任务。
网络权限也能细粒度控制:你可以让某个 Agent 只能访问内网 API,不能连外网;或者只允许访问特定域名。不需要开防火墙规则,直接在沙箱配置里定义。
为什么现在开源?
腾讯不是第一次开源基础设施。但这次不一样——他们没等“完美”,而是选在“够用、稳定、能救急”的时候推出来。
过去一年,CubeSandbox 在“元宝”系统里扛住了每天百万级的代码执行请求,修复了 37 个关键稳定性问题,优化了 12 项性能瓶颈。现在,他们觉得:是时候让外面的开发者也用上了。
你不一定要用腾讯云。你可以把它部署在自己的服务器、私有云、甚至边缘节点。开源协议是 Apache 2.0,商用无限制,文档齐全,GitHub 仓库已上线,有完整的安装脚本和示例项目。
如果你正在为 Agent 的执行效率发愁,为成本焦虑,或者被国外服务的网络延迟和数据合规问题卡住——CubeSandbox 不是“下一个选择”,它是现在就能用的、真实跑通的解决方案。
项目地址:https://github.com/Tencent/CubeSandbox