Hadoop安装备忘
参考刘鹏的《实战Hadoop》一书,按照hadoop 0.20.2几个注意的地方。 第一,首先理解Hadoop中的几个后台进程。 NameNode,Secondary NameNode,JobTracker,TaskTracker,DataNode这几个角色。 NameNode:负责如何切分数据块,和切完放哪个节点。它对内存和I/O集中管理。 这个进程部署在Master节点上,是一个单点,它挂了整个系统都挂了。 Secondary NameNode:和NameNode一样,辅助程序。每个集群都有一个,它与NameNode进行通讯,定期保存HDFS元数据快照,当NameNode故障可以作为备用NameNode使用。它也是部署在Master节点上。 JobTracker负责调度作业,它决定哪些文件由哪些节点运行,并且监听TaskTracker发送来的心跳。当收不到心跳,即认为某个task失败,就会决定重启task。每个集群只有一个JobTracker。它是部署在Master节点上的。 上述三个进程都是部署在Master节点上的,而TaskTracker和DataNode进程进程是集群中各个...

