阿里通义开源 Qwen3Guard,专为安全防护设计的护栏模型
阿里通义Qwen开源了专为全球实时AI安全设计的Qwen3Guard审核模型系列,该系列支持119种语言,并提供三种不同规模的模型以适应不同需求。
Qwen3Guard是Qwen 家族中首款专为安全防护设计的护栏模型。该模型基于强大的 Qwen3 基础架构打造,并针对安全分类任务进行了专项微调,旨在为人工智能交互提供精准、可靠的安全保障。无论是用户输入的提示,还是模型生成的回复,Qwen3Guard 均可高效识别潜在风险,输出细粒度的风险等级与分类标签,助力实现更负责任的 AI 应用。
在多项主流安全评测基准上,Qwen3Guard 表现卓越,稳居行业领先水平,全面覆盖英语、中文及多语言场景下的提示与回复安全检测任务。
Qwen3Guard 提供两大专业版本,满足不同应用场景需求:
-
Qwen3Guard-Gen(生成式版)支持对完整用户输入与模型输出进行安全分类,适用于离线数据集的安全标注、过滤,亦可作为强化学习中基于安全性的奖励信号源,是构建高质量训练数据的理想工具。
-
Qwen3Guard-Stream(流式检测版)突破了传统的护栏模型架构,首次实现模型生成过程中的实时、流式安全检测,显著提升在线服务的安全响应效率与部署灵活性。
为适配多样化的部署环境与算力资源,两大版本均提供 0.6B、4B、8B 三种参数规模,兼顾性能与效率,满足从边缘设备到云端服务的全场景需求。
开源模型现已上线Hugging Face与ModelScope平台。
