AI独立编程智能体究竟能走多远?知名技术博主Simon Willison近日发表文章,详述了他使用Claude Fable 5调试Datasette Agent中一个水平滚动条bug的完整过程——这个案例生动展示了当前顶级AI编程智能体令人震撼的主动性和执行力,同时也揭示了这类工具潜在的安全风险。
故事从一个看似简单的bug开始:Datasette Agent的跳转菜单聊天提示框中出现了不该存在的水平滚动条。Simon只向Fable发送了一张截图和一句话:"Look at dependencies to help figure out why there is a horizontal scrollbar here",然后就去忙别的事了。

当他回到电脑前时,看到了这样一幕:Fable已经自动在Firefox浏览器中打开了相关页面进行排查,随后又切换到了Safari。更令人惊讶的是,它还在使用Python脚本通过pyobjc-framework-Quartz遍历系统中所有窗口,根据窗口名称中是否包含"textarea"来定位目标窗口,然后用screencapture命令截取PNG图片。

Fable不仅在真实浏览器中创建测试HTML页面重现bug,还修改了Datasette的网站模板,在页面加载1.2秒后自动触发"/"快捷键来打开弹窗——这完全绕过了需要人工点击或按键的限制。
为了获取Web Component阴影DOM中的精确数据,Fable甚至编写了一个Python CORS服务器来收集页面JavaScript发送的测量数据,再写入到/tmp/diag.json文件中供自己后续分析。

整个过程中,Fable展示了十多项连续操作能力:启动Playwright Chrome并开启滚动条显示设置、在不同浏览器间切换、编写测试页面、构建自定义Python服务器、注入JavaScript采集数据、修改模板验证修复方案——直到最终找到那个两行CSS的修复方案。
整个调试过程最后以一个意外收场:Fable触发了某种隐藏的防护限制,模型降级到了Opus。幸运的是,Opus继承了Fable的所有操作记录,继续完成了调试并验证了修复方案。
Simon估算这次会话的成本约为12.11美元——这在他每月100美元的Claude Max订阅计划范围内,在6月22日Anthropic开始对Fable收取全额API费用之前。
但最值得关注的不是技术能力本身,而是Simon提出的安全反思:如果Fable收到的指令中包含恶意内容——比如代码或issue线程中隐藏的提示注入攻击,或者他不小心粘贴到终端的内容——它能走多远?
Fable展示了编程智能体可以达到的能力边界:它们可以执行你能通过在终端输入命令完成的任何操作——而且它们知道更多"技巧",包括一些从未被记录过的方法。这种"无限制主动出击"的特性既是它们最大的优势,也是最大的安全隐患。
Simon明确表示:编程智能体应该在沙箱中运行,远离真实系统环境。他将这类场景列为AI编码智能体安全的首要风险——正如Johann Rehberger在"The Normalization of Devulence in AI"中所描述的"挑战者灾难事件"。
从Fable的表现来看,当AI智能体足够强大、主动性足够高时,一旦被恶意指令利用,其破坏力将是惊人的。观看Fable为了获取信息而穷尽一切手段的过程固然令人着迷,但冷静下来思考:这也意味着任何安全漏洞都可能被以同样激进的方式利用。在AI编程智能体日益强大的当下,如何在能力与安全之间找到平衡,是一个无法回避的问题。
参考来源:https://simonwillison.net/2026/Jun/11/fable-is-relentlessly-proactive/