HA机制下的Hadoop配置

2016-06-14 692

[ 版权申明：本文系作者原创，转载请注明出处]
文章出处： http://www.cnblogs.com/sdksdk0/p/5585355.html
作者：朱培 ID：sdksdk0
--------------------------------------------------

在我之前的一篇博客中，已经分享了关于hadoop的基本配置，地址： http://blog.csdn.net/sdksdk0/article/details/51498775，但是那个是使用与初学者学习和测试的，今天用分享的这个比上次那个要复杂一些，主要是加了zookeeper和两台namenode的配置，同时使用这种方式，可以解决服务器的脑裂问题。

一、hdfs的HA机制

NameNode服务器一台是ACTIVE和一台是STANDBY。通过Qjournal(日志管理系统) 使用zkfc（基于zookeeper失败切换控制)

如何防止脑裂现象：当ACTIVE假死的时候，STANDBY的zkfc会发出指令 ssh kill-9 namenode 返回0（成功杀死，返回1则杀死失败）的时候再去通知第二台namenode去切换状态。若无返回码的时候（超时未响应),则启动proweroff.sh（用户自定义的脚本）给第一台namenode断电，返回0则执行正常，然后去切换。

当第一台机器断电的时候（指活跃状态的namenode和zkfc都断电了)，则第2台的zkfc会执行proweroff.sh。

关键词： 1、有两个namenode,分别是active和standby.

2、有两个zkfc来监控和管理两个namenode的状态

3、元数据日志edits由一个专门的日志系统负责管理--qjoournal

4、zkfc及qjournal的功能都要依赖于zookeeper的服务来实现

5、zkfc做状态切换时有两个防止脑裂的机制--ssh和shell脚本。

二、Hadoop集群的配置

打开hadoop的安装目录，如果还不会下载或者基础都不会使用的请看文章开头我提供的链接，请先学习基础配置。我这里主要使用了5台虚拟机来模拟搭建这整个集群环境。

主机名 IP地址主要功能

ubuntu1 192.168.44.128 namenode zkfc ResourceManager
ubuntu2 192.168.44.131 namenode zkfc ResourceManager
ubuntu3 192.168.44.132 DataNode、NodeManager、JournalNode、QuorumPeerMain
ubuntu4 192.168.44.133 DataNode、NodeManager、JournalNode、QuorumPeerMain

ubuntu5 192.168.44.134 DataNode、NodeManager、JournalNode、QuorumPeerMain

我们可以先来配置ubuntu1，然后剩下的就scp到其他机器上就可以了

core-site.xml

<configuration>

    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://ns1/</value>
    </property>
    <!-- 指定hadoop临时目录 -->
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/home/admin1/hadoop/HAhadoop/tmp/hadoop</value>
    </property>

    <!-- 指定zookeeper地址 -->
    <property>
        <name>ha.zookeeper.quorum</name>
        <value>ubuntu3:2181,ubuntu4:2181,ubuntu5:2181</value>
        </property>
</configuration>

hdfs-site.xml

<configuration>
					<!--指定hdfs的nameservice为ns1，需要和core-site.xml中的保持一致 -->
					<property>
						<name>dfs.nameservices</name>
						<value>ns1</value>
					</property>
					<!-- ns1下面有两个NameNode，分别是nn1，nn2 -->
					<property>
						<name>dfs.ha.namenodes.ns1</name>
						<value>nn1,nn2</value>
					</property>
					<!-- nn1的RPC通信地址 -->
					<property>
						<name>dfs.namenode.rpc-address.ns1.nn1</name>
						<value>ubuntu1:9000</value>
					</property>
					<!-- nn1的http通信地址 -->
					<property>
						<name>dfs.namenode.http-address.ns1.nn1</name>
						<value>ubuntu1:50070</value>
					</property>
					<!-- nn2的RPC通信地址 -->
					<property>
						<name>dfs.namenode.rpc-address.ns1.nn2</name>
						<value>ubuntu2:9000</value>
					</property>
					<!-- nn2的http通信地址 -->
					<property>
						<name>dfs.namenode.http-address.ns1.nn2</name>
						<value>ubuntu2:50070</value>
					</property>
					<!-- 指定NameNode的元数据在JournalNode上的存放位置 -->
					<property>
						<name>dfs.namenode.shared.edits.dir</name>
						<value>qjournal://ubuntu3:8485;ubuntu4:8485;ubuntu5:8485/ns1</value>
					</property>
					<!-- 指定JournalNode在本地磁盘存放数据的位置 -->
					<property>
						<name>dfs.journalnode.edits.dir</name>
						<value>/home/admin1/hadoop/HAhadoop/journaldata</value>
					</property>
					<!-- 开启NameNode失败自动切换 -->
					<property>
						<name>dfs.ha.automatic-failover.enabled</name>
						<value>true</value>
					</property>
					<!-- 配置失败自动切换实现方式 -->
					<property>
						<name>dfs.client.failover.proxy.provider.ns1</name>
						<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
					</property>
					<!-- 配置隔离机制方法，多个机制用换行分割，即每个机制暂用一行-->
					<property>
						<name>dfs.ha.fencing.methods</name>
						<value>
							sshfence
							shell(/bin/true)
						</value>
					</property>
					<!-- 使用sshfence隔离机制时需要ssh免登陆 -->
					<property>
						<name>dfs.ha.fencing.ssh.private-key-files</name>
						<value>/home/admin1/.ssh/id_rsa</value>
					</property>
					<!-- 配置sshfence隔离机制超时时间 -->
					<property>
						<name>dfs.ha.fencing.ssh.connect-timeout</name>
						<value>30000</value>
					</property>
				</configuration>

mapred-site.xml

  <configuration>
                <!-- 指定mr框架为yarn方式 -->
               <property>
                   <name>mapreduce.framework.name</name>
                   <value>yarn</value>
               </property>
            </configuration>

yarn-site.xml

<configuration>

<!-- 开启RM高可用 -->
						<property>
						   <name>yarn.resourcemanager.ha.enabled</name>
						   <value>true</value>
						</property>
						<!-- 指定RM的cluster id -->
						<property>
						   <name>yarn.resourcemanager.cluster-id</name>
						   <value>yrc</value>
						</property>
						<!-- 指定RM的名字 -->
						<property>
						   <name>yarn.resourcemanager.ha.rm-ids</name>
						   <value>rm1,rm2</value>
						</property>
						<!-- 分别指定RM的地址 -->
						<property>
						   <name>yarn.resourcemanager.hostname.rm1</name>
						   <value>ubuntu1</value>
						</property>
						<property>
						   <name>yarn.resourcemanager.hostname.rm2</name>
						   <value>ubuntu2</value>
						</property>
						<!-- 指定zk集群地址 -->
						<property>
						   <name>yarn.resourcemanager.zk-address</name>
						   <value>ubuntu3:2181,ubuntu4:2181,ubuntu5:2181</value>
						</property>
						<property>
						   <name>yarn.nodemanager.aux-services</name>
						   <value>mapreduce_shuffle</value>
						</property>
				</configuration>

slaves

1 ubuntu3
2 ubuntu4
3 ubuntu5

还有就是修改一下主机名。 sudo vi /etc/hostname ubuntu1 以及hosts的内容：

192.168.44.128 ubuntu1
192.168.44.131 ubuntu2
192.168.44.132 ubuntu3
192.168.44.133 ubuntu4
192.168.44.134 ubuntu5

注意：一定要把原来的那两天127.0.1.1 这一条给删除掉，一个hosts文件中，不能出现主机名相同和ip地址不同的情况，我开始就是因为这个因为，折腾了很久，datanode就是搭建不起来。

三、启动HA的Hadoop过程

1、启动zookeeper集群分别在ubuntu3,4,5中输入开启服务： bin/zkServer.sh start 查看状态： bin/zkServer.sh status

2、启动journalnode 分别在ubuntu3,4,5中输入 sbin/hadoop-daemon.sh start journalnode 运行jps命令检验，多了JournalNode进程

3、格式化HDFS

　　在ubuntu1上执行命令:
bin/hdfs namenode -format
#格式化后会在根据core-site.xml中的hadoop.tmp.dir配置生成个文件，这里我配置的是/HAhadoop/tmp，然后将/HAhadoop/tmp拷贝到ubuntu2的/HAhadoop/下。
　　

scp -r tmp/ ubuntu2:/home/admin1/hadoop/HAhadoop/

4、格式化ZKFC(在ubuntu1上执行即可) bin/hdfs zkfc -formatZK

5、启动HDFS(在ubuntu1上执行) sbin/start-dfs.sh

6、启动YARN（在ubuntu1上执行） sbin/start-yarn.sh

如果是在ubuntu1中启动的话，那么默认的浏览窗口会是这样： ubuntu2是Active的，ubuntu1是一个Standby状态，

这个时候如果你去ubuntu2里面把这个namenode进程杀死的话，ubuntu1会自动切换为Active，ubuntu2会变成无法连接。

这样就实现了服务器的动态切换，这样万一有一个namenode宕机了，剩下了一台会自动切换。这种使用了zookeeper切换的就是前面说到的HA机制了。

当整个集群搭建完毕的效果就会是这样，如果用jps去查看一下：

在两个namenode节点上面会这样显示：

在剩下的3个datanode上面会这样：

可以通过访问ubuntu2:8088/Cluster来查看：活跃节点是3个

到这里整个集群环境就搭建完毕了，当然如果你电脑配置不是很高的话，可以选择把datanode直接放在namenode一起配置也可以。

微信关注我们

原文链接：https://yq.aliyun.com/articles/227674

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

分布式数据库HBase表设计

比较常用的数据库是关系型数据库，但很多场景下nosql数据库会更加擅长，从sql到nosql实施的第一步就是设计表结构，这是两种不同的思维方式，这里说下HBase表设计。需求：需要一张stock表用于保存市场所有股票的分钟走向，即每个股票每分钟记录一次价格。方案一：瘦表。用stockId+datetime作为RowKey，这样方便通过stockId或datetime快速扫描获取到相关记录。 RowKey ColumnFamily “stock_cf” stockId+datetime stock_cf:price “00000120160615100000” 10.02 “00000120160615100001” 10.10 “00000120160615100002” 10.08 “00000220160615100000” 8.00 “00000220160615100001” 8.10 “00000220160615100002” 8.20 craete 'stock' , 'stock_cf' 优点：不受记录数限制，通过id查询时能很快跳过行，拥有很好的扩展性，高表也是...

2016-06-14

837

数据库操作无非就是增、删、改、查。这篇主要介绍增、删、改。 1.增 Mongodb插入操作很简单，使用关键字“insert”。实例： 1 > db.test.blog.insert({"haha":"xiaohaha","abc":"123"}) 2 > db.test.blog.find(); 3 { "_id" : ObjectId("5334dd149b7a445ea2166559"), "title" : "love", "content" : "I 4 love you" } 5 { "_id" : ObjectId("5334dd669b7a445ea216655a"), "job" : "java", "city" : "wuhan" 6 } 7 { "_id" : ObjectId("5334ec3f9b7a445ea216655b"), "a" : "b" } 8 { "_id" : ObjectId("5338bc89125a366c3f32dd00"), "haha" : "xiaohaha" } 9 { "_id" : ObjectId("5338b...

2016-06-14

777

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。