好程序员大数据学习路线分享Hadoop阶段的高可用配置-低调大师

好程序员大数据学习路线分享Hadoop阶段的高可用配置

2019-08-27 617

　　好程序员大数据学习路线分享Hadoop阶段的高可用配置，什么是Hadoop的HA机制
　　Ha机制即Hadoop的高可用（7*24小时不中断服务）
　　正式引入HA机制是从hadoop2.0开始，之前的版本中没有HA机制
　　hadoop-ha严格来说应该分成各个组件的HA机制——HDFS的HA、YARN的HA
HDFS的HA机制详解
HDFS 的HA主要是通过双namenode协调工作实现
双namenode协调工作的要点：
    A、元数据管理方式需要改变：
    内存中各自保存一份元数据
    Edits日志只能有一份，只有Active状态的namenode节点可以做写操作
    两个namenode都可以读取edits
    共享的edits放在一个共享存储中管理（qjournal和NFS两个主流实现）
    B、需要一个状态管理功能模块
    实现了一个zkfailover，常驻在每一个namenode所在的节点
    每一个zkfailover负责监控自己所在namenode节点，利用zk进行状态标识
    当需要进行状态切换时，由zkfailover来负责切换
    切换时需要防止brain split脑裂现象的发生

Namenode的运行原理
两台服务器上都存在一个namenode ，其中一台Namenode 处于active状态，一台处于standby状态，两台服务器数据共享，两台服务器各自存有一份元数据，但是edit数据只有一份，两台服务器只有处于active状态的namenode服务器可以对edit进行写操作，另一台服务器只能对edit进行读操作，而共享的edit放到一个共享存储中进行管理。共享存储由文件管理系统qjournal和NFS来实现。
而两台服务器的active standby状态如何管理，则需要一个管理模块：ZKFC (zookeeper failover controller) 来管理。每一个zkfc负责监控自己所在namenode节点，利用zk进行状态标识。当需要进行状态切换时，由zkfailover来负责切换
切换时需要防止brain split脑裂现象的发生。
什么是脑裂现象
脑裂现象就是两台namenode都处于active状态，产生冲突，这就是脑裂。Hadoop的高可用配置要注意解决脑裂状态。

脑裂状态如何产生
当一台active状态的namenode服务器处于假死状态，那么另一台namenode服务器的zkfc收到信息，把属于他的namenode状态改变为active状态，第一台处于假死状态的namdenode又醒过来，就会产生脑裂。

脑裂如何解决
第二台namenode的zkfc此时就会一不做二不休，把第一台处于假死状态的namenode杀掉运用ssh kill -9 namenode ,直接杀掉第一台服务器的namenode进行补刀，如果补刀不成功的话，zkfc进入第一台服务器，直接调用用户的自定义脚本程序 /home/Hadoop/kill/poweroff.sh 杀-掉假-死的namenode。

微信关注我们

原文链接：https://yq.aliyun.com/articles/716185

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

好程序员大数据学习路线之zookeeper干货

好程序员大数据学习路线之zookeeper干货，上周学习了zookeeper，一开始感觉不容易理解，后来随着学习的深入，渐渐地明白了很多知识，下面慢慢来介绍zookeeper。zookeeper是什么？？？zookeeper是一个分布式协调服务，就是为用户的分布式应用程序提供协调服务的。zookeeper是为其他的分布式程序提供服务的zookeeper本身就是一个分布式程序（只要半数以上节点存活，就能提供服务）zookeeper的特性：zookeeper：一个leader，多个follower全局数据一致性：每个server都保存一份相同的数据，client无论连接那台服务器，都可以得到相同的数据分布式读写，更新请求转发，由leader实施数据更新的写操作更新请求按顺序执行，来自同一个client的更新请求会按照其发送的顺序来执行数据更新的原子性，一次数据要么更新成功，要么失败。实时性，在一定时间范围内，client能读到最新的数据。应用场景：统一命名服务；配置管理；集群管理；共享锁；队列管理；Zookeeper 作为 Hadoop 项目中的一个子项目，是 Hadoop 集群管理的一个...

2019-08-27

698

作者：辛庸，阿里巴巴计算平台事业部 EMR 技术专家。Apache Hadoop，Apache Spark contributor。对 Hadoop、Spark、Hive、Druid 等大数据组件有深入研究。目前从事大数据云化相关工作，专注于计算引擎、存储结构、数据库事务等内容。本文是列式存储系列的第二篇。在上一篇，我们介绍了C-Store，一个列式存储数据库。在本篇，我们讲述 C-Store 的继任者——Vertica。C-Store 是一个概念原型，在这个概念原型提出并发表后，Stonebraker 着手建立了一家公司研发商用的列式分析型数据库，公司名字就叫 Vertica。2011 年 Vertica 被惠普公司收购。2012 年，Vertica 公布了它的论文：《The Vertica Analytic Database:

2019-08-27

752

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。