namenode ha切换优化
一、背景 目前namenode使用了ha的部署模式,但系统会经常出现ha的自动切换(namenode节点其实正常)。经过调研发现可能的原因如下: HealthMonitor check本地namenode的rpc端口时超时,导致HealthMonitor认为namenode挂掉。 zk上的session timeout,导致丢掉当前持有的active锁(temp节点),引起自动切换。 二、优化 下面的优化将针对1)和2)调整相应的超时参数,看是否起效。修改core-site.xml 1 2 3 4 5 6 7 8 9 10 <!--HealthMonitorchecknamenode的超时设置,默认50000ms,改为5mins--> <property> <name>ha.health-monitor.rpc-timeout.ms< /name > <value>300000< /value > < /property > <!--zkfailover的session超时设置,默认5...