hadoop日常运维白皮书
hadoop日常运维与升级总结 ▲进程管理由于配置文件的更改,需要重启生效,或者是进程自己因某种致命原因终止,或者发现进程工作出现异常等情况下,需要进行手动进程的关闭或启动,或者是增删节点过程中的需要,进程的关闭与启动,使用hadoop-daemon.sh start| stop datanode/namenode/journalnode/zkfcyarn-daemon.sh start| stop nodemanager/resourcemanager检查进程是否完成关闭:jps 或者 ps –ef | grep datanode|namenode|journalnode|zkfc|nodemanager|resourcemanager注意:要清楚自己关闭的每一个进程对正在运行的集群会产生什么样的影响 ▲集群健康检查hdfs fsck / 进行文件系统健康检查,是否有块丢失,如何处理?hdfs fsck 也可以用来查看你关心的某些文件的块的分布情况。Hdfs fsck /path –files –blocks –locations 可以显示详细的文件,block位置等信息。Datan...