Anthropic 在其官方网站上发布了一篇关于"递归自我改进"的研究文章,描述了 AI 在编写和改进自身代码方面的进展。这篇文章的发布时间正值 AI 能力快速提升的关键节点,也是 Anthropic 首次系统性地向公众阐述这一趋势的规模和速度。

文章开篇明确了一个核心观点:AI 能力的提升速度正在加快。在公开基准测试中,任务完成可靠性的提升周期大约是每四个月翻一番。以 Claude 系列为例:2024年3月,Claude Opus 3 能完成约4分钟的任务;2025年3月,Claude Sonnet 3.7 能处理约1.5小时的任务;2026年3月,Claude Opus 4.6 已经能处理约12小时的任务。如果这一趋势延续,2026年可能实现整天任务,2027年可能实现整周任务。这是一个令人警觉的时间表——意味着在不到一年的时间内,AI 能处理的任务时长将从小时级跨越到天级别。

在代码编写领域,这一趋势体现得最为直观。截至2026年5月,Anthropic 内部超过80%的代码合并请求由 Claude 自动生成,这个比例在 Claude Code 于2025年2月推出之前还处于低个位数。更具体地说,2026年第二季度,工程师们每天合并的代码量是2024年的8倍。2026年4月,Claude 在一次提交中修复了超过800个导致 API 错误的 bug,将 API 错误率降低了一千倍。这些数字揭示的不是渐进的优化,而是一个持续加速的自动化开发飞轮。

代码质量的差距也在快速收窄。2025年末,Claude 编写的代码质量还略逊于人类编写的代码;到2026年5月,两者已大致持平;Anthropic 预计在一年内,AI 编写代码的质量将全面超越人类。对于一个曾经被认为"AI 擅长模式匹配但缺乏工程判断力"的领域,这是一个令人震惊的逆转。更值得注意的是,Claude 对每一次代码变更的自动审查,大约能捕获过去生产事故中约三分之一的 bug——这意味着如果这项技术早些时候部署,大量事故可能本可以避免。

在优化实验(optimization experiment)中,AI 的能力演进同样惊人。2025年5月,Claude Opus 4 平均加速倍数约为3倍;到2026年4月,Claude Mythos Preview 达到了约52倍的加速。一个熟练的人类研究员需要4到8小时才能达到4倍加速——而 AI 系统已经能在同等时间内实现52倍提升。这个差距不是线性的,而是指数级的。
AI 在研究层面的能力同样令人关注。2026年4月,Anthropic 发表了首个展示 Claude 独立完成开放式研究项目的演示:AI Agent 提出假设、验证假设、迭代改进——整个流程端到端自主运行。两名人类研究员用一周时间追上了 AI 在这个任务上约23%的差距,而 AI 用了800个累计小时完成了其余77%的研究工作。这个差距揭示了一个关键问题:当任务从"执行已知方法"升级到"探索未知假设"时,人类的优势正在快速被侵蚀。
在"下一步判断"(next-step judgment)这一关键能力上,差距同样在扩大。2025年11月,在人类选择有改进空间的任务中,Claude Opus 4.5 的表现优于人类选择51%的时间;到2026年4月,这一比例在 Claude Mythos Preview 上已增长到64%。这意味着对于"接下来应该做什么"这个最核心的问题,AI 的判断力正在逼近并超越人类的平均水平。
Anthropic 提出了三种可能的未来图景。第一种是趋势停滞,即 AI 能力冻结在当前水平但扩散到更广泛的应用场景——他们明确表示不相信这会发生。第二种是"复合收益",即 AI 开发实质上实现自动化,而人类负责设定方向——100人公司能做1万人甚至10万人的工作。第三种是"完全递归自我改进",即 AI 系统设计和改进自身,进度速度取决于算力供给。对于第三种可能,Anthropic 表示"没有良好的直觉来判断那个世界是什么样子"。
这篇研究文章最重要的结论或许不是某一项具体数据,而是整个叙事的逻辑:Anthropic 正在用内部数据向行业和社会传递一个信息——AI 的自动化能力可能比大多数机构准备的时程表来得更快。这不是一个危言耸听的警告,而是一份基于真实数据的内部评估报告。其中"可以考虑暂时放慢或暂停前沿 AI 开发"的表述,是这家公司迄今为止最明确的政策主张,也可能是整个 AI 安全讨论的一个转折点。
参考来源:https://www.anthropic.com/institute/recursive-self-improvement