Meta 开源 LlamaFirewall,面向 AI 智能体的安全框架
Meta 开源了名为 LlamaFirewall 的安全框架,用于应对 AI 智能体不断演变的威胁格局,为生产环境中的 AI 智能体提供系统级安全保护。
随着大型语言模型(LLMs)嵌入 AI 智能体并被广泛应用于高权限场景,安全隐患随之增加。这些智能体可以读取邮件、生成代码、调用 API,一旦被恶意利用,后果不堪设想。
传统的安全机制,如聊天机器人内容审核或硬编码模型限制,已无法满足具备广泛能力的 AI 智能体需求。Meta AI 针对提示注入攻击、智能体行为与用户目标不一致、以及不安全的代码生成三大核心挑战,开发了 LlamaFirewall。
LlamaFirewall 采用分层框架,包含三个专门的防护模块:
-
PromptGuard 2 是一个基于 BERT 架构的分类器,能实时检测越狱行为和提示注入,支持多语言输入,其 86M 参数模型性能强劲,22M 轻量版本则适合低延迟部署。
-
AlignmentCheck 是一种实验性审计工具,通过分析智能体内部推理轨迹,确保行为与用户目标一致,特别擅长检测间接提示注入。
-
CodeShield 则是一个静态分析引擎,检查 LLM 生成代码中的不安全模式,支持多种编程语言,能在代码提交或执行前捕获 SQL 注入等常见漏洞。
Meta 在 AgentDojo 基准测试中评估了 LlamaFirewall,模拟了 97 个任务领域的提示注入攻击。
结果显示,PromptGuard 2(86M)将攻击成功率(ASR)从 17.6% 降至 7.5%,任务实用性损失极小;AlignmentCheck 进一步将 ASR 降至 2.9%;整体系统将 ASR 降低 90% 至 1.75%,实用性略降至 42.7%。CodeShield 在不安全代码数据集上也表现出色,精准度达 96%,召回率(recall) 79%,响应时间适合生产环境实时使用。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
IBM 用 AI 取代数百名员工,员工总数却增加了
根据《华尔街日报》的报道,IBM 首席执行官 Arvind Krishna 表示,公司已利用 AI 取代数百名人力资源员工,但同时增加了程序员和销售人员的招聘。 Krishna 表示:“虽然我们在 IBM 内部针对某些企业工作流程大量运用了 AI 和自动化技术,但我们的总员工人数实际上是增加了,因为这些技术使得我们能够将更多投资投入到其他领域。” Krishna 所指的 “其他领域” 包括软件工程、销售和市场营销等职位,也就是他所说的 “注重批判性思维” 的领域。在这些岗位上,人们需要执行的是 “与他人互动或面对面解决问题的任务,而不是机械重复的流程性工作”。 虽然 IBM 表示用 AI 取得了人力资源员工,但并未说明其裁员是在什么时间段内发生的。 IBM 在波士顿的年度 Think 大会上宣布推出新服务,帮助企业构建和管理 AI 智能体,该服务兼容亚马逊、OpenAI、英伟达和微软等巨头的 AI 技术。IBM 鼓励客户选择最合适的工具和技术。 阅读更多:IBM CEO:AI 短期内不会取代程序员
- 下一篇
Cadence 发布基于英伟达 Blackwell 芯片的全新 AI 超算
电子设计自动化技术提供商 Cadence 公司推出了一款新型超级计算机,可支持一整套由英伟达 Blackwell 系统和英伟达 CUDA-X 软件库加速的工程设计和生命科学应用。 这款超级计算机名为 Millennium M2000 ,配备了英伟达 HGX B200 系统和英伟达 RTX PRO 6000 Blackwell 服务器版 GPU,每台设备成本估算为 200 万美元。 与优化的软件相结合,该超级计算机在电子设计自动化、系统设计和生命科学工作负载方面的性能比上一代基于 CPU 的系统提高了 80 倍。 Cadence CEO 安尼鲁德・德夫甘(Anirudh Devgan)表示:“Millennium M2000 专为最先进的 AI 模型打造,通过可扩展求解器与 Blackwell 加速计算,突破工程设计的物理极限。"NVIDIA 创始人黄仁勋补充称:" 这种科学 AI 工厂将推动跨学科突破。” 据称,该设备提供云端与本地部署两种模式,已获联发科、超微电脑等客户采用。其市场定位介于中小企业适用的 TinyBox AI 加速器(1.5 万美元起)与马斯克 xAI 的孟菲斯超级计...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS6,CentOS7官方镜像安装Oracle11G
- Hadoop3单机部署,实现最简伪集群
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- SpringBoot2整合Redis,开启缓存,提高访问速度
- Windows10,CentOS7,CentOS8安装Nodejs环境
- MySQL8.0.19开启GTID主从同步CentOS8
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长