Hadoop Backup Node-低调大师

Hadoop Backup Node

2017-11-13 569

要了解Hadoop Backup Node，要从Namenode的元数据说起。

我们都知道Namenode的元数据非常重要，如果元数据损坏，所有存储在datanode中的数据都读不出来了。另外，如果Namenode的元数据比较大，那么集群的启动速度非常慢。为了解决这两个问题，Hadoop弄了一个Secondary Namenode。

Namenode的元数据：
Hadoop Namenode元数据主要是两个文件：edits和fsimage。fsimage是HDFS的最新状态（截止到fsimage文件创建时间的最新状态）文件，而edits是自fsimage创建后的namespace操作日志。Namenode每次启动的时候，都要合并两个文件，按照edits的记录，把fsimage文件更新到最新。

如果是一个大的、比较繁忙的集群，它的edits文件增长会非常快，这样下次Namenode重启的过程会非常慢，因为它要进行大量的操作。为了加速启动过程，同时为了元数据的安全考虑，Hadoop搞了一个Secondary Namenode，它一般是一台独立的机器，内存大小与Namenode服务器相同。

Scondary Namenode：
Secondary Namenode定期地从Namenode上获取元数据。当它准备获取元数据的时候，就通知Namenode暂停写入edits文件。Namenode收到请求后停止写入edits文件，之后的log记录写入一个名为edits.new的文件。Scondary Namenode获取到元数据以后，把edits文件和fsimage文件在本机进行合并，创建出一个新的fsimage文件，然后把新的fsimage文件发送回Namenode。Namenode收到Secondary Namenode发回的fsimage后，就拿它覆盖掉原来的fsimage文件，并删除edits文件，把edits.new重命名为edits。
通过这样一番操作，就避免了Namenode的edits日志的无限增长，加速Namenode的启动过程。
但是Scondary Namenode有其自身的弱点，如checkpoint数据较旧，数据不一致等，新版本的hadoop已经把它放弃了，转而使用更加高效的Backup Node。

来看一下Backup Node：
Backup Node在内存中维护了一份从Namenode同步过来的fsimage，同时它还从namenode接收edits文件的日志流，并把它们持久化硬盘，Backup Node把收到的这些edits文件和内存中的fsimage文件进行合并，创建一份元数据备份。Backup Node高效的秘密就在这儿，它不需要从Namenode下载fsimage和edit，把内存中的元数据持久化到磁盘然后进行合并即可。
目前，hadoop集群只支持一个Backup Node，如果Backup Node出了问题，Hadoop元数据的备份机制也就失效了，所以hadoop计划在未来能支持多个Backup Node。

Backup Node的配置与启动：
和它有关的配置项，需要注意的是，Namenode和Backup Node都要配置这些选项：
hdfs-site.xml：dfs.backup.address、dfs.backup.http.address
core-site.xml：fs.checkpoint.period、fs.checkpoint.size、fs.checkpoint.dir、fs.checkpoint.edits.dir
启动：
在dfs.backup.address配置的节点上，运行bin/hdfs namenode -checkpoint

但是非常扯淡的是，虽然hadoop-1.0.3的官方hdfs用户文档中说放弃了Secondary Namenode，建议使用Backup Node，但在default配置文件中找不到关于backupnode的相关配置，反而secondary namenode的配置还保留着。到网上搜了一下，好像hadoop 1.0.3中并没有启用Backup Node，实际的原因是，hadoop 1.0.x完全是Apache的恶搞，Apache把hadoop 0.20.205直接命名成了hadoop 1.0！这么坑爹的事情都有！而Backup Node是Hadoop 0.21、0.22（0.23，它是0.22的超集）版本里的东西，这么多hadoop版本，功能都还不一样！

混乱的Apache Hadoop版本。

Namenode元数据恢复流程：
1、启动Backup Node
2、在Namenode上清空dfs.name.dir下的文件
3、在Namenode上执行命令：bin/hadoop namenode -importCheckpoint

hadoop还有哪些手段来保证namenode元数据的安全？
1) 对dfs.name.dir配置多个路径，保存一份元数据到远程主机。这样，加上Backup Node上的元数据，我们就有了三份元数据。我们的配置：

<property>
<name>dfs.name.dir</name>
<value>/usr/local/hadoop/name,/home/hd_nn_remote_backup</value>
</property>

需要注意的是，如果配置了多个路径，在恢复Namenode元数据时，要同时清空这些目录下的文件。
/home/hd_nn_remote_backup是一个远程主机目录，通过NFS挂载到本地；

2) Namenode热备。目前的热备方案有Facebook的Avatar、DRBD等。

一次Namenode恢复实践：

我们的环境是RHEL 5.6，Apache Hadoop 1.0.3。由于未采用Backup Node，我们仍然使用的是Secondary Namenode的配置，所以跟Backup Node的数据恢复有点不太一样。

上周五，由于服务器在重启时忘记停掉Hadoop集群，导致了Namenode元数据损坏，所以进行了一次恢复操作。遗憾的是，由于Secondary Namenode获取Namenode元数据时出了问题，而我们没有及时注意到这个情况，导致恢复出来的数据丢失了几天的量。这里提醒大家一下，到Namenode机器的dfs.name.dir目录下看一看，如果Hadoop把大量的日志记录在edits.new，而不是edits文件，那你就要小心了，可能Secondary Namenode那边出了状况，要及时查看日志，解决问题。一般地，如果未配置dfs.secondary.address和dfs.secondary.http.address，会导致这个问题。

恢复过程比较简，大略如下：

1、删除Namenode上的dfs.name.dir目录下所有的文件，如果配置了多个目录，要全部清空

2、复制Secondary Namenode上的fs.checkpoint.dir目录下的所有文件到Namenode的fs.checkpoint.dir目录下

3、在Namenode上执行bin/hadoop namenode -importCheckpoint

4、ctrl + c终止会话，删除NN上的scondary目录下的文件

5、正式启动Namenode：bin/hadoop-daemon.sh start namenode

6、bin/hadoop dfsadmin -safemode leave

上面的方法分几个步骤，很啰嗦，最简单的方法是：把Secondary Namenode上的fs.checkpoint.dir目录下的current下的文件复制到Namenode的dfs.name.dir目录下的current目录中，然后启动namenode！

上面两个恢复的方法，我都是亲自试过，都是可以的。

本文转自 li_qinshan 51CTO博客，原文链接:http://blog.51cto.com/share/1033994

微信关注我们

原文链接：https://yq.aliyun.com/articles/428197

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Hive 统计信息简析

Hive统计信息是在0.7引入的（https://issues.apache.org/jira/browse/HIVE-33），对于Insert/Load/Merge等DDL操作时在Task后加入一个StatsTask进行统计信息收集，并订阅前置Operator（FileSink/TableScan）的feed.不过现在这个stats并没有使用起来. 线上虽然开启了hive.stats.autogather=true想搜集一些信息，但是ETL Job经常报：[Warning] could notupdate stats，查看日志发现： ERRORjdbc.JDBCStatsPublisher (JDBCStatsPublisher.java:init(281)) - Error during JDBCinitialization. java.sql.SQLException:The connection property 'createDatabaseIfNotExist' only accepts values of theform: 'true', 'false', 'yes' o...

2017-11-13

766

HDFS分布式文件系统 HDFS系统借助于一款hadoop工具进行部署，文件系统的主要优势是主要是提高客户端的读取效率，假如一块1TB的磁盘数据需要读取，读取速度为100MB/S，如果将1块磁盘中的数据分别存储到100块磁盘上，那么当用户读取时，它们并行运行，那么用户读取操作就可以瞬间完成。一个HDFS群集由一个运行于master上的Namenode和多个运行于slave上的Datanode组成。 Namenode负责管理文件系统的命名空间和客户端对文件系统的访问操作。 Datanode负责管理存储的数据。文件以块形式进行在datanode中存储，假设一个块20MB，块的副本数为3，设置块的副本数来达到冗余效果，防止单个datanode磁盘故障后数据丢失。将相同的副本块存储到不同的datanode中实现冗余，大文件将被切成小块存储。 DHFS文件系统搭建步骤： Master和Slave服务器的先决环境： v关闭防火墙等基本操作 # iptables -F # setenforce 0 # ifconfig v配置hosts解析 # vim /etc/hosts 修改内容： 192....

2017-11-13

612

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。