代码托管平台 GitHub 最近陷入前所未有的可靠性危机。据 The Pragmatic Engineer 报道,GitHub 的正常运行时间已跌至 86%,远低于业界标准的"五个九"(99.999%)。


更严峻的是,4 月 23 日发生了一起严重的数据完整性事故:由于 squash merge 的 bug,多达 2,092 个拉取请求(PR)的提交记录遭到损坏,迫使包括 Modal 在内的企业用户手动恢复丢失的代码。

GitHub 首席技术官 Vlad Fedorov 将服务降级归咎于 AI 智能体带来的流量激增。过去两年间,平台的每秒请求量(RPS)暴涨约 3.5 倍,主要来自 Copilot、各类 AI 编码助手和自动化工具的密集调用。然而,GitHub 直到 2025 年 10 月才开始按 10 倍容量规划基础设施,到 2026 年 2 月才调整为 30 倍——这一节奏明显落后于实际需求。
GitHub CTO 谈平台可用性:AI 驱动开发使流量暴增,基础设施从 10 倍扩容至 30 倍
危机之下,知名开发者 Mitchell Hashimoto(HashiCorp 创始人,GitHub 18 年重度使用者)公开宣布离开该平台。他在社交媒体上直言:"如果一家平台每天都让你数小时无法工作,它就不再适合严肃的开发工作。"他的个人日志显示,GitHub 的宕机几乎已成为日常。
因频繁出现服务中断,开源终端模拟器 Ghostty 将离开 GitHub
颇具讽刺意味的是,Vercel、Linear、GitLab 等同行同样面临 AI 驱动的流量增长,却未出现同等规模的故障。分析认为,GitHub 的困境与其 18 年累积的技术债务、4,000 名员工带来的组织臃肿,以及从自有数据中心向 Azure 迁移过程中的阵痛密切相关。
安全问题同样不容忽视。漏洞 CVE-2026-3854 允许攻击者通过普通的 git push 操作获取仓库访问权限,GitHub.com 端在六小时内修复,但企业版服务器却长期暴露于风险之中。
面对信任崩塌,开发者社区开始认真评估替代方案。GitLab、Bitbucket、自托管的 Forgejo 都被提及,甚至有声音呼吁出现专为 30 倍以上规模重新架构的新一代代码托管平台。对于这家统治了开源世界十余年的巨头而言,如何在高增长与稳定性之间找到平衡,将决定其能否守住开发者生态的核心地位。
参考来源:https://blog.pragmaticengineer.com/the-pulse-ai-load-breaks-github/