《Hadoop技术详解》一2.6 NameNode的高可用性
本节书摘来异步社区《Hadoop技术详解》一书中的第2章,第2.6节,作者: 【美】Eric Sammer 译者: 刘敏 , 麦耀锋 , 李冀蕾 , 等,更多章节内容可以访问云栖社区“异步社区”公众号查看。 2.6 NameNode的高可用性 因为管理员的主要职责是确保大规模系统的服务质量和可用性,单点故障(single point of failure)可能会给我们带来麻烦,甚至带来非常糟糕的后果。不幸的是,长期以来,HDFS的NameNode就是困扰我们的单点故障问题。近来,Hadoop社区投入大量的人力来提升NameNode的高可用性,使Hadoop可以在更多重要应用场景下部署。 NameNode 高可用性(或称HA)是通过部署一对主/备NameNode的方式来实现的。主/备NameNode都需要能访问到edits的WAL,因此edits通常保存在一个共享的存储设备上。目前,是用NFS文件系统实现这种共享存储的,当然消除对NFS的依赖也已经在计划当中[2]。当主NameNode写入edits日志时,备用NameNode会即时重放事务以确保数据的完全同步,并在主NameNode发生...