OpenAI 发布安全指南，董事会有权推翻 CEO 决策-低调大师

OpenAI 发布安全指南，董事会有权推翻 CEO 决策

2023-12-19 450

OpenAI 正在扩展其内部安全流程，发布了一个名为 Preparedness Framework (测试版) 的指导方针，旨在帮助跟踪、评估、预测和防范未来将存在的高级人工智能模型或前沿模型相关的风险。

该框架提出：对模型进行评估并开发持续更新的“记分卡”。评估结果将有助于评估风险并衡量缓解策略的有效性。记分卡可以衡量和跟踪潜在危害的各种指标，例如模型的功能、漏洞和影响；并在达到某些风险阈值时触发审查和干预措施。“我们的目标是探究不安全因素的具体边缘，以有效降低所揭示的风险。”

他们将风险划分为四个类别和四个级别。类别包括网络安全、CBRN（化学、生物、辐射、核威胁）、说服和模型自主，风险级别分为低、中、高和严重。只有缓解后得分在"中"或以下的模型才能部署，得分在"高"或以下的模型才能进一步开发针对高风险或临界（缓解前）风险级别的模型，则将实施额外的安全措施。

此外，OpenAI 还将创建一个专门的团队来实施该框架，监督技术工作和安全决策的运作结构。Preparedness 团队将开展技术工作，检查前沿模型的局限性，进行评估并综合报告；而跨职能的安全咨询小组，则负责审查所有报告并将其提交给领导层和董事会。

其中值得关注的一条规则是，虽然领导层是决策者，但董事会有权推翻决策。具体来说，Preparedness 团队每月将向内部安全咨询小组发送报告，该小组对其进行分析后，向 OpenAI 首席执行官 Sam Altman 和董事会提交建议。Altman 和公司高层可以根据这些报告决定是否发布新的 AI 系统，但董事会有权撤销这一决定。

在 OpenAI 宣布这一消息之前，其主要竞争对手 Anthropic 也发布了几份关于 AI 安全的重要声明。譬如最近发布的 Responsible Scaling Policy，一个定义特定的框架 AI 安全级别以及用于开发和部署人工智能模型的相应协议。

OpenAI 和 Anthropic 两个框架在结构和方法上都存在显着差异。 Anthropic 的政策更为正式和规范，将安全措施与模型能力直接挂钩，如果无法证明安全性，则暂停开发。 OpenAI 的框架则更加灵活、更具适应性，设置了触发审查的一般风险阈值，而不是预定义的级别。

专家认为，这两种框架都有各有优缺点，但 Anthropic 的方法可能在激励和执行安全标准方面具有优势。

微信关注我们

原文链接：https://www.oschina.net/news/271695/openai-preparedness-framework-ai-risks

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

MongoDB 内部系统遭遇攻击，部分客户数据被泄露

MongoDB 公司近日发布了告警通知，称其在上周检测到的一次网络攻击中，发现公司内部系统被攻击者破坏，导致部分客户数据泄露。在与 MongoDB CISO Lena Smart 往来的电子邮件中， MongoDB 声称在周三（12 月 13 日）晚上检测了到其系统遭到攻击，事件发生后公司内部立刻成立了网络安全专家组，开始详细调查这一事件。MongoDB 在邮件中写道： MongoDB 目前正在调查一起涉及未经授权访问某些 MongoDB 公司内部系统的网络安全事件，该安全事件可能导致部分客户账户元数据和联系信息泄露，但尚未发现客户存储在 MongoDB Atlas 中的数据有任何泄露。经过调查分析，MongoDB 公司并不认为威胁攻击者访问了存储在 MongoDB Atlas 中的任何客户数据。不过 MongoDB 同样承认在安全人员发现数据泄漏事件之前，攻击者已经访问其内部系统一段时间了。数据泄露事件通知中还指出，MongoDB 公司目前正在积极进行安全调查分析。鉴于部分客户元数据被暴露，MongoDB 建议所有客户在其账户上启用多因素身份验证、轮换密码，并对潜在的定向网络钓...

2023-12-19

478

HTML语义：如何运用语义类标签来呈现Wiki网页在上一篇文章中，我花了大量的篇幅和你解释了正确使用语义类标签的好处和一些场景。那么，哪些场景适合用到语义类标签呢，又如何运用语义类标签呢？不知道你还记不记得在大学时代，你被导师逼着改毕业论文格式的情景，如果你回想一下，你在论文中使用的那些格式，你会发现其实它们都是可以用 HTML 里的语义标签来表示的。这正是因为 HTML 最初的设计场景就是“超文本”，早期 HTML 工作组的专家都是出版界书籍排版的专家。所以，在这一部分，我们找了个跟论文很像的案例：Wikipedia 文章，这种跟论文相似的网站比较适合用来学习语义类标签。通过分析一篇 Wiki 的文章用到的语义类标签，来进一步帮你理解语义的概念。你可以在电脑上，打开这个页面： https://en.wikipedia.org/wiki/World_Wide_Web 为了防止这个页面被修改，我们保存了一个副本： http://static001.geekbang.org/static/time/quote/World_Wide_Web-Wikipedia.html 这是一篇我...

2023-12-19

397

资源下载

更多资源

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。