搞安全的同学都知道,有一个非常著名的网络安全模型叫 PDR 模型,提出者是美国国际互联网安全系统公司(ISS),其核心论断是网络安全是一个时间问题,对应的公式为
Et = Dt + Rt - Pt
,其中:
- Et (Exposure) 暴露时间,系统暴露在攻击下的时间;
- Pt (Prevent) 防御时间,系统扛住外部攻击的时间,或者说攻击者成功渗透的整个时间;
- Dt (Detect) 检测时间,安全检测系统发现攻击所需要的时间;
- Rt (Response) 响应时间,发现攻击到攻击路径被切断,攻击被中止的整个时间。
PDR 模型直观、易懂,为安全防护工作提供了比较实用的指导框架。在系统可能出现的各类故障中,安全只是其中一种,既然 PDR 模型能指导解决安全问题,那么 PDR 模型是否也能指导解决其他故障呢?我认为是肯定的。
1 什么是 PDR 故障模型?
对照 PDR 模型,先来看一下故障的生命周期,
从上图可以非常直观的看出,为了缩短故障时间(Failure Time),我们要想办法尽可能的缩短检测时间(Detect Time)和响应时间(Response Time),同时延长防御时间(Prevent Time)。缩短检测时间对应提升监控、告警能力,缩短响应时间对应提升故障修复、CI/CD能力,延长防御时间对应提升系统的容错能力或者说