网站常见问题1分钟定位 - 如何使用阿里云ARMS诊断Java应用卡顿问题
为什么“慢”那么难查
-
应用链路太长,无从下手。
-
从前端页面到后台网关,从Web应用服务器到后台数据库,任何一个环节的问题都有可能导致请求整体卡顿,到底是前端资源加载过慢?还是数据库出了问题?还是新发布的服务端代码有性能问题?出现问题的原因五花八门。
-
采用“微服务”架构的应用,链路更加复杂。不同组件可能由不同的团队、人员分别维护,加剧了问题排查的难度。
-
-
日志不全或质量欠佳,现场缺失。
-
应用日志无疑是排查线上问题的神器,但出现问题的位置往往无法预期,发生了问题通常会发现日志信息不全 -- 我们不可能在每一个有可能出现问题的地方打印日志。
-
“慢”的定义偏主观,“慢”有时候往往也是偶发现象
-