应用响应时延背后深藏的网络时延
应用异常时,基本可以分为服务访问不通和服务响应慢两个大类。其中服务响应慢的问题定位非常棘手,很多无头案。应用团队有日志和追踪,对于自认为的不可能不合理的事情都会甩给基础设施团队,又由于基础设施团队现有的监控数据缺乏应用的观测视角,通常成为一切「不是我的问题」超自然现象的终极背锅侠,其中以网络团队尤为严重。 欢迎预约8月2日由【云原生社区】主办,【云杉网络】发起的”可观测性技术实践“系列直播,一起探索应用性能瓶颈的秘密。通过来自物流、智能汽车行业的实战案例,深入了解 DeepFlow 的典型应用场景,你将学习到如何高效的进行快速排障和时延瓶颈定位,将棘手问题的排查时间从数天降低到几分钟,帮助你的效率提升10倍。 01|响应时延 服务为什么响应慢???首先,我们需要一种方式来度量何为响应慢,参考 Google 在 SRE Handbook 中提到过4 个黄金信号及 Weave Cloud 提出来的 RED 方法,都存在度量的指标(Latency/Duration),后文统称为响应时延。 Latency 表达的是服务处理某个请求所需要的时间,站在的是服务端视角 Duration 表达的是每个...