安全研究员抱怨 Claude Fable 模型防护机制过于严格,读取博客文章也被拦截
当一家 AI 公司在发布最强能力级别的模型时选择了"有节制地开放",安全研究员们发现这个"节制的度"可能已经超出了实用范围。Anthropic 于本周二发布了 Fable 模型——作为其旗舰网络安全模型 Mythos 的公开受限版本——但安全社区的反馈几乎是清一色的抱怨:限制太严了,连"读取一篇博客文章"都会被标记为潜在网络安全相关操作并遭到拒绝。 Anthropic 将 Fable 定位为面向网络安全专业人士的 AI 模型,但在实际使用中,许多安全研究员发现它的防护机制采用了简单粗暴的...