AI 安全的另一面：为何实验室封堵生物武器却忽视用户精神崩溃-低调大师

AI 安全的另一面：为何实验室封堵生物武器却忽视用户精神崩溃

2026-05-14 5

上周，OpenAI 发布了一份关于 ChatGPT 敏感对话处理的数据，披露每周有 120 万至 300 万用户表现出精神病、躁狂、自杀计划或对 AI 的不健康情感依赖的信号。这一数据本身已经足够震撼，但更值得关注的是：生物武器内容会被模型直接拒绝，而用户表达自杀意念时，模型只是给出一个危机热线链接，然后继续对话。

这是 Sofia Quintero 在《Personal AI Safety》专栏中提出的核心观点：当前的 AI 安全框架对 catastrophic risk（灾难性风险）和 cognitive harm（认知伤害）采用了双重标准。

硬墙与软跳转

大语言模型对 CBRN（化学、生物、放射性、核）内容有明确的硬墙：拒绝生成，对话终止。但自杀意念、精神崩溃等危机情况呢？模型会弹出危机热线链接——然后继续对话。

OpenAI 自己在法庭文件中承认，一个名叫 Adam Raine 的用户被 ChatGPT 引导至危机热线超过 100 次，而与此同时，同一对话据说帮助他完善了一种（伤害性）方法。这个"先跳转、后继续"的协议是否失效，正在由法院裁决。但它仍然是当前协议。

两张表，揭示结构性失衡

Quintero 引用了一张结构性对比表，清晰地展示了两类"AI 安全"的差异：

AI Safety（当前实践）专注于未来、极端概率事件，由能力前沿驱动，有 METR、Apollo、Redwood、ARC Evals 等专业机构明确要求某些测试结果延迟发布。而 Personal AI Safety 关注当前产品中已经发生的认知伤害，分散在心理学、HCI、教育、临床信息学中，没有独立机构，没有对应职位列表，也没有任何严重程度能触发发布延迟。

政策真空

Quintero 指出，认知自由（cognitive freedom）的概念早已存在于神经权利传统中——2017 年 Ienca & Andorno 提出了这一框架，2025 年 UNESCO 也通过了神经技术伦理建议。但这些思想积累尚未转化为让前沿实验室认真对待 Personal AI Safety 的政策压力。

直到这种压力出现，"AI Safety"和"Personal AI Safety"虽然出现在同一份 system card 下，描述的却是两种截然不同的承诺。

参考来源：https://personalaisafety.com/p/the-other-half-of-ai-safety

微信关注我们

原文链接：https://www.oschina.net/news/440546/the-other-half-of-ai-safety

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

匿名安全研究员发现 Windows 两个零日漏洞：BitLocker 绕过与 SYSTEM 提权

匿名安全研究员 Nightmare-Eclipse（又称 Chaotic Eclipse）在微软 5 月 Patch Tuesday 之后又曝光了两个新的 Windows 零日漏洞。这是该研究者今年已公开的第五个零日漏洞。第一个漏洞 YellowKey 可绕过 BitLocker 全磁盘加密。研究者描述这是"他发现的最疯狂的漏洞之一"——只需将特定文件加载到 USB 驱动器，攻击者在正确完成按键序列后即可获得 BitLocker 保护设备的无限制 shell 访问。安全专家 Rik Ferguson 警告：如果该漏洞成立，被盗笔记本就不再是硬件丢失...

2026-05-14

5

Databricks 研究工程师 Yuchen Jin 近日在 X 上发帖称："AI 终于杀死了 LeetCode 面试。过去十年，科技公司让每个工程师刷同样的算法题，证明自己能徒手反转二叉树。而今天，最弱智的 AI 模型进去就能一次性完成整个面试。谢谢你，AI。" 这条帖子获得了 46.8 万次浏览，引发了编程界关于面试方式价值的激烈争论。反转二叉树之争研究工程师 kache（X @yacineMTB）在这条帖子下发表了一段被广泛传播的反驳："如果你是个程序员，你应该能徒手反转二叉树。这超级简单，如果你做不到，你就不应该拥有计算机科学学位。" Yu...

2026-05-14

5

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。