《架构师》反思:系统可靠性
最近系统学习了一个系统可靠性及其相关知识,今天在这总结一下。 首先,什么是系统的可靠性呢?系统的可靠性是指在规定的时间内及规定的环境下完成规定功能的能力,也就是系统的无故障运行概率。 我会从以下几个方面来归纳主要内容: 1. 故障模型 2. 可靠性模型 3. 可靠性指标 4. 可靠性设计 故障模型 系统故障是指硬件或者软件的错误状态,一般引进故障的原因是这些:部件的失效、环境的物理干扰、操作错误或不正确的设计。 按照时间的长短,故障可以分为:永久性、间歇性、瞬时性。 故障的级别有:逻辑级故障、数据结构级故障、软件故障和差错故障、系统级故障。 可靠性模型 与故障模型想对应的,就是系统的可靠性模型。常用的有以下三种:时间模型、故障植入模型和数据模型。 这三种模型暂时还没有看懂(晕)。 可靠性指标 可靠性指标,主要有以下几个: 平均无故障时间(MTTF-Mean Time To Failure) 它表示一个系统平均情况下,正常运行的时间。 与它相关的指标是“失效率”U,关系: U = 1 / MTTF。 平均故障修复时间(MTTR-Mean Time To Fix/Repire) 平均每...