完全分布模式hadoop集群安装配置之二添加新节点组成分布式集群-低调大师

完全分布模式hadoop集群安装配置之二添加新节点组成分布式集群

2012-03-10 685

前文说到如何搭建集群中第一个节点，这篇将说到如何向集群添加节点。这篇是基于前文的，没有看过前文的可以参考此链接：http://www.cnblogs.com/mikelij/archive/2012/03/06/2380937.html

2 向集群添加节点

前文已经建立了一个节点的hadoop集群。现在要做的添加节点。安装JDK, 创建hadoop用户等见前文。这里就不重复了。

2.1 检查主机名,修改/etc/hostname, /etc/hosts

新节点需要在这个集群里叫一个名字，给此节点命名，比如slavenode1, slavenode2, etc.集群里新加入的服务器都需要在/etc/hostname中改名，将规定的服务器名放在/etc/hostname文件中。然后将已有服务器上的/etc/hosts拷贝过来。再加上此新节点的主机名。然后再复制到群里每一个服务器中。即所有集群中服务器的/etc/hosts文件要一样。

2.2 配置SSH Key以便hadoop用户无密码登录集群

与前文不同的是，此处只需要将之前的节点产生的ssh key等拷贝过来就可以了。用hadoop用户登录，

sudo apt-get install ssh

安装完ssh就可以从已有的服务器上拷贝ssh key了。

mkdir /home/hadoop/.ssh

scp hadoop@namenode:/home/hadoop/.ssh/* /home/hadoop/.ssh/

这就拷贝过来了。之所以要从已有服务器上拷贝ssh key，是因为如果两个服务器的ssh key不一致，则第一次连服务器时，还是需要密码的。这里的需求是hadoop用户连任何一个集群中的服务器都不需要密码，因此需要拷贝已有服务器上的ssh key.

下面需要从此节点用ssh命令连到已有的所有节点上去。已有的节点只有一个时，假设本节点的主机名是slavenode1, 就ssh namenode, ssh localhost, ssh slavenode1。如果已经有namenode, slavenode1, slavenode2... 到slavenode6, 那么就尝试ssh namenode, ssh slavenode1, ssh slavenode2, ..., ssh slavenode6, ssh localhost. 保证这些连接都是不需要密码就可连接的就可以了。另外在换到其他机器上，都ssh 此节点的主机名，如ssh slavenode1s。这样的方法，就可以保证每台机器间都可以用ssh无密码就可以连接。用的用户都是hadoop。

2.3 安装hadoop包

可参考前文的1.5，这里就不重复了。

2.4 namenode上的hadoop配置

集群里要加入新的节点，可以在namenode服务器上的mapred-site.xml中加入dfs.hosts和mapred.hosts两个元素。即象这样：

<property>
<name>dfs.hosts</name>
<value>/usr/local/hadoop/hadoop-0.20.203.0/conf/slaves</value>
</property>
<property>
<name>mapred.hosts</name>
<value>/usr/local/hadoop/hadoop-0.20.203.0/conf/slaves</value>
</property>

然后再在/usr/local/hadoop/hadoop-0.20.203.0/conf/slaves文件中写上集群中所有的节点的主机名。一个主机名占一行。如：

namenode

slavenode1

slavenode2

...

如果dfs.hosts和mapred.hosts已经加好了，就只需要到slaves中加入一行。

2.5 新加入节点的hadoop配置

集群中所有节点的hadoop配置要全部保持一致。即那些core-site.xml, hdfs-site.xml, mapred-site.xml, masters, slaves可以从已有节点处拷贝过来。包括/etc/environment也可以从已有节点那里拷贝过来。用scp命令，上面已经用过了，再用scp拷贝这些文件过来。

2.6 新加入节点启动

start-dfs.sh

start-mapred.sh

2.7 通知namenode和jobtracker有新节点加入

在第一台服务器(namenode兼jobtracker)运行的情况下，到第一台服务器那里，

hadoop dfsadmin -refreshNodes

这是通知hdfs有新节点加入

hadoop mradmin -refreshNodes

这是通知jobtracker有新节点加入

2.8 验证集群是否正常工作

还是老办法，用一些常用命令将一些服务器上的本地文件方到服务器上，如：

hadoop fs -put testfolder uploadfolder

再拷贝，删除等做一做。

另外验证jobtracker和所有的tasktracker是否正常工作，还是用wordcount示例来运行：

hadoop jar hadoop-examples-0.20.203.0.jar wordcount input output

得到大概这样的结果就对了, 即map增长到100%, reduce也增长到100%。

访问http://namenode:50070/ 可以看到集群里所有的datanode

还有http://namenode:50030/ 可以看到集群里所有的tasktracker

2.7 启动集群

namenode上运行：

start-all.sh

slavenode上运行：

start-dfs.sh

start-mapred.sh

2.8 停止集群

slavenode上运行：

stop-mapred.sh

stop-dfs.sh

namenode上运行：

stop-all.sh

2.9 遇到的问题

Too many fetch-failures问题

这次还是遇到了这个问题，和单机时一样的错误信息Too many fetch-failures，略有不同的是reduce不是卡在0%，而是卡在17%那里就不动了。

这次又是到处检查，最后发现是第一台服务器的/etc/hosts文件里少写了一个服务器名字。将这个服务器名字补上以后，这个wordcount示例就可以正常运行了。

所以集群中所有服务器的/etc/hosts, core-site.xml, hdfs-site.xml, mapred-site.xml, masters, slaves，还有ssh key所在.ssh目录等文件和目录都需完全一样。

以上说的是往集群里添加节点，这里说的是添加第二个节点，此过程适用于以后所有新节点的添加。第三个一直到第n个都是按同样的方法来添加。只要重复以上过程就可以了。

本文就说到这里。后文再说一些hadoop集群管理的内容。

微信关注我们

原文链接：https://yq.aliyun.com/articles/318003

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

完全分布模式hadoop集群安装配置之一安装第一个节点

本系列文章讲述搭建完全分布模式hadoop的安装配置过程，还将讲述完全分布式模式的一些基本操作。准备采用先单机调通再加入节点的方式。本文只讲述单节点的安装和配置。 1.Namenode和JobTracker的安装这是完全分布模式集群的第一台，也是很关键的一台。采用VMWARE虚拟的Ubuntu Linux 11.10 server版。安装Linux非本文重点就不说了。默认建立了一个用户叫abc, 其有sudo权限。root的口令是随机的一个口令，只能用sudo命令暂时提升到root权限。为保险起见，安装完系统第一件事就是改root密码。用sudo passwd root，系统不会问你要原口令，直接输入新口令两遍即可。有root口令在手，后面万一操作错误不至于束手无策。 1.1 安装JDK1.6 有个命令可以很快地安装jdk, sudo apt-get install sun-java6-jdk, 这是ubuntu系统本身一个机制。当时试了一下，没有成功，记得说是找不到包。不知道啥原因，要不网络不行，要不包名不对了。就放弃了。只好找另外的办法。到Oracle网站上找到J...

2012-03-06

699

《ElasticSearch查询》目录导航： ElasticSearch查询第一篇：搜索API ElasticSearch查询第二篇：文档更新 ElasticSearch查询第三篇：词条查询 ElasticSearch查询第四篇：匹配查询（Match） ElasticSearch查询第五篇：布尔查询匹配（Match）查询属于全文（Fulltext）查询，不同于词条查询，ElasticSearch引擎在处理全文搜索时，首先分析（analyze）查询字符串，然后根据分词构建查询，最终返回查询结果。匹配查询共有三种类型，分别是布尔（boolean）、短语（phrase）和短语前缀（phrase_prefix），默认的匹配查询是布尔类型，这意味着，ElasticSearch引擎首先分析查询字符串，根据分析器对其进行分词，例如，对于以下match查询： "query":{ "match":{ "eventname":"Microsoft Azure Party" } 查询字符串是“Microsoft Azure Party”，被分析器分词之后，产生三个小写的单词：microsoft...

2012-03-15

693

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。