记一次IO异常捕获的过程
背景信息:
遇到一个IO异常飙升的问题,IO起飞后系统响应异常缓慢,看不到现场一直无法定位问题,检查对应时间点应用日志也没有发现异常的访问,这种问题怎么办呢?
1,采集系统IO,确认IO异常发生在系统盘,还是数据盘,使用系统自带的iostat即可采集
# iostat -d 3 -k -x -t 30
06/12/2018 09:52:33 AM
Device: rrqm/s wrqm/s r/s w/s rkB/s wkB/s avgrq-sz avgqu-sz await svctm %util
xvda 0.00 0.39 0.08 0.70 1.97 5.41 18.81 0.03 44.1