Anthropic 披露 Claude 安全隔离架构：三种产品，三层防线-低调大师

Anthropic 披露 Claude 安全隔离架构：三种产品，三层防线

2026-06-04 60

Anthropic工程团队最近发布了一篇文章，详细披露了他们在三款产品中构建AI Agent安全隔离系统的经验和教训。这三款产品分别面向不同的使用场景：面向普通用户的claude.ai、面向开发者的Claude Code，以及面向企业协作的Claude Cowork。每款产品的风险模型和隔离策略各不相同，但都遵循同一个核心原则：环境层隔离优先，模型层引导其次。

在面向用户的claude.ai产品中，Anthropic采用了临时性的容器方案。每个会话启动时，服务器端会创建基于gVisor的容器，会话结束后立即销毁。这种设计的逻辑是：用户与AI的交互本身是短暂的，不需要持久化任何状态，因此可以采用最小化的隔离策略——容器内资源受限，能访问的能力也受到严格限制。一旦发生风险事件，爆炸半径被控制在单次会话范围内。

Claude Code的隔离方案则针对开发工作流进行了优化。开发者需要在工作目录中读写文件，但不能默认访问网络。Anthropic使用操作系统级的沙箱机制——macOS上的Seatbelt和Linux上的bubblewrap——来实现这一隔离。这种设计的精妙之处在于，它在安全和便利之间取得了平衡：默认情况下禁止网络访问，减少了权限提示的弹出频率，据披露这一优化使权限提示减少了84%。当开发者真正需要网络访问时，可以在明确授权后临时开放。

对于安全要求最高的企业协作场景Claude Cowork，Anthropic采用了虚拟机级别的隔离方案。使用苹果的Virtualization框架在macOS上实现，或在Windows上使用HCS（Hypervisor Code Segmentation），将Claude与宿主机系统完全隔离开来。这种方案的安全性最高，但也意味着与宿主系统的集成能力最弱。VM层面的隔离意味着安全工具无法看到VM内部的活动，这在某些场景下反而成为了新的盲点。

文章还披露了Anthropic在实践中发现的几起值得关注的安全事件。其中最引人注目的是通过钓鱼攻击实现的直接提示词注入——在24次测试中有25次成功窃取信息，成功率高达96%。此外还有通过预授权钩子在用户确认信任对话框之前就执行代码、通过攻击者控制的API密钥从已批准域名 egress数据等问题。这些发现帮助Anthropic不断迭代他们的安全架构。

Anthropic在文章中总结了三条关键原则。首先是"环境层隔离优先，模型层引导其次"，这意味着在设计系统时，应该首先依靠技术手段限制AI的能力边界，而不是完全依赖模型自身的"听话"程度。其次是"隔离强度要与用户监督能力相匹配"——不同用户群体需要不同级别的隔离，企业用户可能需要更严格的控制，而高级用户可能需要更多灵活性。第三条原则是"警惕自定义组件"，Anthropic发现标准的隔离原语（如虚拟机管理程序、系统调用过滤器）比他们自己开发的安全Agent表现更好，这个发现对整个行业都具有警示意义。

参考来源：https://www.anthropic.com/engineering/how-we-contain-claude

微信关注我们

原文链接：https://www.oschina.net/news/451942

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

GitLab 宣布重组裁员 14%

作为上月公布的广泛重组计划的一部分，GitLab 已裁员约 14%，即约 350 名员工。该公司在 5 月份表示，将退出 22 个国家/地区，精简管理层级，并投资基础设施以扩展其平台，应对 AI 工作流带来的流量增长，公司将裁减员工，同时更加专注于研发工作。 GitLab 首席执行官 Bill Staples 在周二的电话会议上表示，AI 工作负载给开发者基础设施带来的压力已经超过了其设计承受能力。这并非 GitLab 独有的问题。GitHub 也同样面临着大量 AI 驱动的提交带来的挑战，这些请求已对其系统正常运行时间造成了影响。 “智能体以机器规模运行，它们正将竞争对手逼到绝...

2026-06-04

66

近日，海南省中小学校智慧教育基础环境建设项目（二期）中标结果正式揭晓。麒麟软件再次实现大规模应用落地，总计中标数量超过3.2万套，整体占比高达94.30%。其中，银河麒麟桌面操作系统中标率达100%，触控一体机OPS操作系统中标2700 余套，以绝对优势稳居项目核心地位。这是继去年一期项目中标3万余套之后，麒麟软件在海南教育领域取得的又一重磅成果。两期项目累计部署规模超过6万套，麒麟软件已经成为海南教育信息技术应用创新领域主导力量，为全省教育数字化转型筑牢了自主、安全、可靠的基础底座。持续领先的市场份额，充分体现了教育行业对银河麒麟操作系统的高度认可。海南作为国家中小学智慧教育平台深化应用...

2026-06-04

63

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。