Anthropic 认为 AI 自我改进已达临界点，称内部代码自动化率突破 80%-低调大师

Anthropic 认为 AI 自我改进已达临界点，称内部代码自动化率突破 80%

2026-06-05 73

Anthropic 在其官方网站上发布了一篇关于"递归自我改进"的研究文章，描述了 AI 在编写和改进自身代码方面的进展。这篇文章的发布时间正值 AI 能力快速提升的关键节点，也是 Anthropic 首次系统性地向公众阐述这一趋势的规模和速度。

文章开篇明确了一个核心观点：AI 能力的提升速度正在加快。在公开基准测试中，任务完成可靠性的提升周期大约是每四个月翻一番。以 Claude 系列为例：2024年3月，Claude Opus 3 能完成约4分钟的任务；2025年3月，Claude Sonnet 3.7 能处理约1.5小时的任务；2026年3月，Claude Opus 4.6 已经能处理约12小时的任务。如果这一趋势延续，2026年可能实现整天任务，2027年可能实现整周任务。这是一个令人警觉的时间表——意味着在不到一年的时间内，AI 能处理的任务时长将从小时级跨越到天级别。

在代码编写领域，这一趋势体现得最为直观。截至2026年5月，Anthropic 内部超过80%的代码合并请求由 Claude 自动生成，这个比例在 Claude Code 于2025年2月推出之前还处于低个位数。更具体地说，2026年第二季度，工程师们每天合并的代码量是2024年的8倍。2026年4月，Claude 在一次提交中修复了超过800个导致 API 错误的 bug，将 API 错误率降低了一千倍。这些数字揭示的不是渐进的优化，而是一个持续加速的自动化开发飞轮。

代码质量的差距也在快速收窄。2025年末，Claude 编写的代码质量还略逊于人类编写的代码；到2026年5月，两者已大致持平；Anthropic 预计在一年内，AI 编写代码的质量将全面超越人类。对于一个曾经被认为"AI 擅长模式匹配但缺乏工程判断力"的领域，这是一个令人震惊的逆转。更值得注意的是，Claude 对每一次代码变更的自动审查，大约能捕获过去生产事故中约三分之一的 bug——这意味着如果这项技术早些时候部署，大量事故可能本可以避免。

在优化实验（optimization experiment）中，AI 的能力演进同样惊人。2025年5月，Claude Opus 4 平均加速倍数约为3倍；到2026年4月，Claude Mythos Preview 达到了约52倍的加速。一个熟练的人类研究员需要4到8小时才能达到4倍加速——而 AI 系统已经能在同等时间内实现52倍提升。这个差距不是线性的，而是指数级的。

AI 在研究层面的能力同样令人关注。2026年4月，Anthropic 发表了首个展示 Claude 独立完成开放式研究项目的演示：AI Agent 提出假设、验证假设、迭代改进——整个流程端到端自主运行。两名人类研究员用一周时间追上了 AI 在这个任务上约23%的差距，而 AI 用了800个累计小时完成了其余77%的研究工作。这个差距揭示了一个关键问题：当任务从"执行已知方法"升级到"探索未知假设"时，人类的优势正在快速被侵蚀。

在"下一步判断"（next-step judgment）这一关键能力上，差距同样在扩大。2025年11月，在人类选择有改进空间的任务中，Claude Opus 4.5 的表现优于人类选择51%的时间；到2026年4月，这一比例在 Claude Mythos Preview 上已增长到64%。这意味着对于"接下来应该做什么"这个最核心的问题，AI 的判断力正在逼近并超越人类的平均水平。

Anthropic 提出了三种可能的未来图景。第一种是趋势停滞，即 AI 能力冻结在当前水平但扩散到更广泛的应用场景——他们明确表示不相信这会发生。第二种是"复合收益"，即 AI 开发实质上实现自动化，而人类负责设定方向——100人公司能做1万人甚至10万人的工作。第三种是"完全递归自我改进"，即 AI 系统设计和改进自身，进度速度取决于算力供给。对于第三种可能，Anthropic 表示"没有良好的直觉来判断那个世界是什么样子"。

这篇研究文章最重要的结论或许不是某一项具体数据，而是整个叙事的逻辑：Anthropic 正在用内部数据向行业和社会传递一个信息——AI 的自动化能力可能比大多数机构准备的时程表来得更快。这不是一个危言耸听的警告，而是一份基于真实数据的内部评估报告。其中"可以考虑暂时放慢或暂停前沿 AI 开发"的表述，是这家公司迄今为止最明确的政策主张，也可能是整个 AI 安全讨论的一个转折点。

参考来源：https://www.anthropic.com/institute/recursive-self-improvement

微信关注我们

原文链接：https://www.oschina.net/news/452519

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

CISA 警告：有攻击者正利用 Android 和 Linux 漏洞发起攻击

美国网络安全和基础设施安全局 (CISA) 近日发出警告称，有黑客正在利用 Linux 内核和 Android 操作系统中的漏洞发起攻击。该机构最近添加到其 Known Exploited Vulnerabilities (KEV) 目录中的漏洞 CVE-2025-48595 是 Android 框架中的一个高危整数溢出漏洞，可被利用来提升权限。根据谷歌最近发布的安全公告，该安全问题影响 Android 14 至 16，并且无需用户交互即可利用。谷歌表示，CVE-2025-48595 可能已在实际环境中遭到有限的定向利用，但没有提供有关该漏洞或事件的具体活动细节或技术信息。该问题已通过发...

2026-06-05

98

PHP 8.5.7 现已发布，这是一个漏洞修复版本。建议所有 PHP 8.5 用户升级到此版本。 CLI：修复了 bug GH-21901（getopt() 可选值过时）。 Date：修复了 bug GH-18422（php_date_llabs 中的整数溢出）。 DOM：修复了 bug GH-22077（自定义 XPath 函数中的 UAF）。 Opcache：修复了在观察到的用户函数调用期间处理 VM 中断时跟踪 JIT 崩溃的问题。修复了 bug GH-21746（跟踪 JIT 时出现 Segfault）。修复了 bug GH-22004（ext/opcache/jit/ze...

2026-06-05

70

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。