记一次HBase内存泄漏导致RegionServer挂掉问题
问题描述
在测试Phoenix稳定性时,发现HBase集群其中一台RegionServer节点FullGC严重,隔一段时间就会挂掉。
HBase集群规格
| 选项 | Master | RegionServer |
|---|---|---|
| 节点数 | 2台,一主一备 | 3台 |
| CPU核数 | 2core | 4core |
| 存储 | SSD云盘,单节点440G |
初步分析
使用jstat监控RegionServer的Heap size和垃圾回收情况:
[root@iZbp18zqovyu9djsjb05dzZ ~]# jstat -gcutil 454 5000
S0 S1 E O M CCS YGC YGCT FGC FGCT GCT
100.00 0.00 55.68 90.19 98.75 97.30 2244 57.3