网站常见问题1分钟定位(二)- 如何使用阿里云ARMS诊断Java服务端报错问题
我的网站为什么一错再错
网页报错,尤其是5XX错误是互联网应用最常见的问题之一。5XX错误通常发生于服务端。服务端是业务逻辑最复杂,也是整条网络请求链路中最容易出错、出了错最难排查的地方。
运维工程师与研发工程师排查此类问题,通常要通过登录机器查看日志来定位问题。对于一般的Java应用错误日志,通常是这幅模样:
一般来说,对于逻辑不算太复杂、历史不算“太悠久”的应用来说,登录机器看日志的方式能够很大程度上地解决网站报错的问题。但遇到下列情况时,使用传统的方式可能就有些困难:
- 在一个分布式Java应用集群中,我想知道这类错误每分钟发生了多少次,什么时候开始发生的;
- 系统太老,遗留异常我不想管了,我只想知道,今天和昨天相比,发布前和发布后相比,多了哪些异常;
- 我想知道这个错误对应的是哪个Web请求,Web请求的参数是什么;
- 客服给了我一个用户下单失

