我们还需要 SRE 吗?
在 「一文讲透研发,SRE,运维,DevOps 的区别」里,我们讲了几大工种的区别,这篇我们重点讲一下 SRE (Site Reliability Engineering)。 SRE 的兴起 SRE 最早起源于 2003,由 Google 提出。SRE 既是一种理念,也是一套围绕这个理念的实践,由这个实践也诞生了一个新的工种,同样叫 SRE。SRE 的兴起有多方面的原因: 天时 - 互联网在线服务大规模普及。一边服务复杂度极具提升,一边稳定性的要求越来越高。 地利 - 由 Google 带头的一批头部科技公司背书,尤其是 2016 年 Google SRE 团队撰写的 Site Reliability Engineering: How Google Runs Production Systems 堪称行业里最经典的著作。 人和 - Ops 们需要找新的出路,因为云服务等基础设施的完善消灭了传统运维 (IT Ops) 的大量工作。 SRE 和 Dev 间的生产关系 关于 SRE 和 Dev 之间的关系,网上读到的一个精彩描述: 再具体一点,我们可以拿 DORA 的四大核心指标来看: De...