Anthropic发布Claude安全隔离架构，三款产品展现多层防护

Anthropic 公布三款 AI 产品安全隔离架构实践

Anthropic 工程团队近日分享了 claude.ai、Claude Code 和 Claude Cowork 的安全隔离系统构建经验。这三款产品分别面向普通用户、开发者与企业用户，底层隔离策略与风险模型各不相同，但均围绕“环境层隔离优先”这一核心展开。

claude.ai 采用基于 gVisor 的临时容器方案。用户每次新建会话，系统就会生成一个独立容器。会话结束，容器随即销毁。该设计限制了 AI 对系统资源的访问权限。即便出现异常，风险也被锁定在单次会话内，不会影响其他用户。

Claude Code 针对开发者工作流，改用操作系统级沙箱。工具默认切断网络访问，避免开发者频繁处理系统弹窗。实际运行数据显示，该设计让权限提示的出现频率降低了 84%。确需联网时，开发者可以手动授予临时权限。

Claude Cowork 面向企业场景，直接部署虚拟机级别隔离。虚拟环境与宿主主机完全断开。隔离强度提升的同时，系统间的集成度随之降低，给后续的安全监控工作带来了新难题。

实际测试中的安全漏洞推动了底层架构调整。在 24 次针对提示词注入的钓鱼攻击测试中，攻击成功率达到 96%。攻击者还能利用受控的 API 密钥实施数据窃取。这些问题促使团队重新评估并加固安全策略。

团队最终明确三项安全准则。隔离措施必须优先在环境层落地，模型层的规则仅起引导作用。系统的隔离强度需要与用户自身的监督能力相匹配。产品设计还需警惕定义组件带来的潜在漏洞。这些经验为后续 AI 应用的安全边界划定提供了参考。