YARN ResourceManager重启作业保留机制
1. 前置
YARN可以通过相关配置支持ResourceManager重启过程中,不影响正在运行的作业,即重启后,作业还能正常继续运行直到结束。
参见详细文档ResourceManagerRestart
涉及配置如下:
| key | value | 备注 |
|---|---|---|
| yarn.resourcemanager.recovery.enabled | true | |
| yarn.resourcemanager.store.class | org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore | 有三种StateStore,分别是基于zookeeper, HDFS, leveldb, HA高可用集群必须用ZKRMStateStore |
| yarn.resourcemanager.work-preserving-recove | ||