EDAS 基础排查
EDAS
先说下 EDAS 包含什么,
所有的应用管控和集群管理,限流降级,扩容所容,基础监控,服务监控。
除此之外的 ARMS ,CSB ,DTS(scheduler X) 都不是 EDAS 范围内,只是放了一个入口在 EDAS,出现问题一定先分清楚是 EDAS 管控问题还是自己的应用代码问题,还是其他产品的组件文件,便于定位。
案例:
应用发布失败 jvm crash
排查:
- 1) 先看下发布失败应用对应的变更记录发现发布应用失败是因为卡在了健康检查失败。健康检查的 URL 必须是返回 200 的才可以,通过报错可以知道后端的 tomcat 返回了 502。
- 2) 登陆健康检查失败的 ECS 节点 ps -ef | grep tomcat 看下进程是否还在,如果进程不在了肯定检查不通过
- 3) 查看 tomcat 的 Catalina 日志发现


