OpenAI 发布开源安全模型 gpt-oss-safeguard-低调大师

OpenAI 发布开源安全模型 gpt-oss-safeguard

2025-10-30 136

OpenAI发布了开源安全推理模型gpt-oss-safeguard，包含120B和20B两个版本，支持开发者自定义策略进行内容审核，模型基于Apache 2.0许可证开放使用。

两款不同尺寸模型支持 harmony 格式的输入输出，并提供低、中、高三级推理强度设置。它们主要面向输入输出过滤、在线内容标注、离线信任与安全审核等场景，不适用于通用生成任务。

据介绍，gpt-oss-safeguard 可直接读取开发者提供的策略文档，通过链式推理输出审核结论及依据，支持多策略并行处理，内部测试多策略准确率达52.2%，超越GPT-5-Thinking和原版GPT-OSS。该模型采用“策略直读+推理解释”机制，无需重新训练即可动态调整规则，适用于新兴风险、细分领域及样本稀缺场景。

模型下载地址：https://huggingface.co/collections/openai/gpt-oss-safeguard

微信关注我们

原文链接：https://www.oschina.net/news/380412/openai-gpt-oss-safeguard

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Vercel 通过 AI 技术裁减团队

Vercel 是一家成立于2015年的云平台公司，专为开发者提供构建和部署网站与应用程序的工具。最近，该公司决定通过训练人工智能（AI）代理来提升销售团队的工作效率，进而将原本的10人销售团队缩减至仅剩1人和一台机器人。Vercel 的新策略旨在将员工从基础性工作中解放出来，让他们能够专注于更具创造性和价值的任务。该公司的首席运营官珍妮・德威特・格罗瑟表示，训练 AI 代理的过程始于今年6月。她带领三位工程师，围绕公司表现最好的销售代表进行了一项内部项目，记录下他们的工作流程。经过六周的跟踪和观察，团队成功开发出一个 AI 代理，模仿该销售代表的工作模式。如今，这个 “主代理” 能够自动处理大量原本由多名销售代表完成的工作，包括审核入站消息、过滤垃圾邮件、资格审核潜在客户等。该代理还会通过内部数据库和 OpenAI 的 Deep Research 工具收集公司信息，起草个性化回复，并自动转发支持查询。人类管理者会在 Slack 上审核 AI 代理的工作，并给予反馈，以帮助系统不断学习和改进。从部署以来，该 AI 代理已经帮助 Vercel 成功将10人团队缩减至1人，其余的9位员工...

2025-10-30

83

10月，HDD·鸿蒙赋能交流会22站联动圆满落地济南、武汉、北京、福州、南阳、深圳、安阳、长沙、苏州、东莞、广州、南京、宁波、上海、西安、天津，2000+位开发者共庆1024程序员节，点燃HarmonyOS技术分享与交流热情。活动联合多位HDG组织者筹备举办，并邀请了HUAWEI DEVELOPER EXPERTS（HDE）、企业及高校专家，不仅带来了鸿蒙生态最新成果、创新服务能力的分享，更和参会者就开发技巧、实践案例进行了充分、热烈的互动交流，趣味开发环节也成为了一大亮点，开发者们沉浸在轻松有趣的氛围中，在动手体验中加深了对代码的理解和掌握。核心课程配合真实案例，开发者高效学习开发经验在22场活动中，华为专家通过对鸿蒙生态进展和特性、开发套件和语言等内容的介绍，快速帮助开发者搭建从认知到实践的知识框架。技术专家和开发者们也分享了详细的应用开发案例，结合具体项目拆解技术落地细节，让与会者对鸿蒙应用开发路径有更直观的理解。北京站活动现场，HDE周哲宇讲述了他与鸿蒙“从实践探索到商业落地”的成长故事：他在开发参赛作品《便单》时，曾遭遇多端适配功能滞后的难题，最终借助鸿蒙的跨设备协同特...

2025-10-30

118

资源下载

更多资源

优质分享App

近一个月的开发和优化，本站点的第一个app全新上线。该app采用极致压缩，本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。