深度解析大快DKadoop大数据运维管理平台功能
之前几周的时间一直是在围绕DKhadoop的运行环境搭建写分享,有一些朋友留言索要了dkhadoop安装包,不知道有没有去下载安装一探究竟。关于DKHadoop下载安装基本已经讲清楚了,这几天有点空闲把大快DKM大数据运维管理平台的内容整理了一些,作为DKHadoop相配套的管理平台,是有必要对DKM有所了解的。
DKM 是DKHadoop管理平台。作为大数据平台端到端Apache Hadoop 的管理应用,DKM 对 DKH 的每个部件都提供了细粒度的可视化和控制。通过DKM ,运维人员是可以提高集群的性能,提升服务质量,提高合规性并降低管理成本。
DKM 设计的目的是为了使得对于企业数据中心的管理变得简单和直观。通过DKM ,可以方便地部署,并且集中式的操作完整的大数据软件栈。该应用软件会自动化安装过程,从而减少了部署集群的时间。通过DKM 可以提供一个集群范围内的节点实时运行状态视图。同时,还提供了一个中央控制台,可以用于配置集群。总结DKM 能够提供的功能主要有以下几点:
1. 自动化Hadoop 安装过程,大幅缩短部署时间;
2. 提供实时的集群概况,例如节点,服务的运行状况;
3. 提供了集中的中央控制台对集群的配置进行更改;
4. 包含全面的报告和诊断工具,帮助优化性能和利用率;
基本功能:DKM的基本功能主要可以分为四大模块:管理功能,监控功能,诊断功能和集成功能。本篇我们就先来看以下管理功能:
1、批量部署
我们都知道Hadoop 本身是一个分布式的系统,因此在安装时,需要对每一个节点进行组件的安装,并且由于是开源软件,其安装过程相对比较复杂,Hadoop 每个组件都需要做很多的配置工作,这一点相信各位深有体会。DKH 提供了DKM 来自动化安装部署Hadoop 。 大大缩短了Hadoop 的安装时间,同时也简化了安装Hadoop 的过程。(DKHADOOP安装步骤请参考此前分享的文章)
自动化安装的过程如下:
1. 安装环境准备,下载DKM 以及DKH 的安装文件,安装JDK,yum 等基本软件。
2. 挑选一台节点,安装DKM ,用户只需要启动安装脚本即可,通常情况下几分钟就能够完成。
3. DKM 是一个web 应用,提供了基于浏览器的界面,用户可以通过浏览器可视化的进行DKH的安装部署。
4. 通过DKM 界面,添加其他需要的安装的节点,选择要安装的Hadoop 组件,以及每个节点承担的角色,选择安装,DKM 会自动地将需要安装的软件分发到对应的节点,并完成安装。
5. 当所有节点的软件都安装完成之后,DKM 会启动所有的服务。从上述的安装过程可以看出DKH 的安装主要体现两个特点,批量化以及自动化。只需要在其中一个节点完成,其他节点都可以进行批量化的自动安装。
2、集群配置
(1)可视化参数配置界面
Hadoop 包含许多的组件,不同的组件都包含各种各样的配置, 并且分布于不同的主机之上。 DKM 针对这种情况提供了界面化的参数配置功能,并且能够自动的部署到每个节点。
(2)高可靠配置
DKM 对关键的组件使用HA部署方案,避免单点失效的发生,同时DKH 对于组件的异常错误提供了自动恢复处理,最大限度的保证服务的可靠性。
(3)HDFS 高可靠
在标准配置中,NameNode 是HDFS群集中的单点故障(SPOF)。每个群集都具有一个NameNode ,如果机器或进程变为不可用,群集整体将变为不可用,直到NameNode 在新主机上重新启动或上线。Secondary NameNode 不提供故障转移功能。 为了让“备用” NameNode 的状态与“活动”NameNode 在此实施中保持同步,两个节点均与一组名为JournalNode 的独立后台程序进行通信。由“活动”NameNode 执行任何Namespace 修改时,它会持续记录其中大部分JournalNode 的修改记录。 “备用”NameNode 能够从JournalNode 读取编辑操作,并不断监视它们以了解编辑日志发生的更改。当备用节点发现编辑操作时,它会将这些编辑应用于自己的Namespace 。在发生故障转移时,备用节点将确保首先从JournalNode 读取所有的编辑操作,然后才会将自己升级为“活动状态”。这确保了再发生故障转移之前完全同步Namespace 状态。
为了提供快速故障转移,备用NameNode 还需要拥有有关群集中的块位置的最新信息。为实现这一目的,DataNode 配置了这两个NameNode的位置,它们会将这块位置信息和检测信号发送给这两个NameNode。
一次只能有其中一个NameNode 处于活动状态,这一点对于HA群集的正常运行来说至关重要。否则,Namespace 状态会在两者之间快速出现分歧,从而导致数据丢失风险或其他不正确的结果。为了确保此属性并防止所谓的“大脑分裂状况”,JournalNode 一次只允许一个NameNode 成为写入程序。在故障转移过程中,要进入“活动”状态的NameNode 将接管JournalNode的写入角色,这会有效地阻止其它NameNode继续保持“活动”状态,使得新的“活动”NameNode可以安全地继续执行故障转移。
DKH 默认开启了HA . 用户不用担心此问题。
(4)YARN 高可靠
YARN ResourceManager(RM) 负责跟踪群集中的资源并安排应用程序(例如,MapReduce作业)。RM 高可用性(HA)功能以活动/待机 RM 对形式添加冗余,以删除此单点故障。此外,在从待机RM 到活动RM 进行故障转移时,应用程序可以从其上次检查点状态恢复; 例如,在MapReduce 作业中完成的map 任务不在后续的尝试中重新运行。这样可以在不对运行中的应用程序产生任何重要性能影响的情况下,处理以下事件:
计划外事件,如计算机崩溃。
计划内维护事件,如在运行ResourceManager的计算机上进行的软件或硬件升级。
RM HA 要求Zookeeper 和HDFS 服务处于运行状态。RM HA 通过活动-待机RM 对的方式实施。启动时,每个RM 处于待机状态;启动过程,但未加载状态。转换到活动状态时,RM会从指定的状态存储加载内部状态,并启动所有内部服务。 管理员(通过CLI)或通过集成的故障转移控制器(启用自动故障转移时)可促进转换为活动状态。
DKH 默认开启了Resource Manager HA 。用户不需要担心。
3、权限管理
对系统管理员,数据库管理员及其他管理员必须授予不同级别的管理权限。
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
[Phoenix] 十一、查询计划详解
一、概要 在数据库中,执行计划就是表示一条SQL将要执行的步骤,这些步骤按照不同的数据库运算符号(算子)组成,具体的组成和执行方式由数据库中的查询优化器来决定。换而言之,执行计划决定了SQL的执行效率。在数据库的使用中了解其查询计划的构成,是进行查询性能调优的必要条件。本文将详细介绍Phoenix的查询计划语法、组成结构,以及一些注意事项。 二、查询计划 1. 基本说明 在phoenix中,查询计划能告诉我们如下的信息: 将要扫描的CHUNK数量 客户端并发线程数量 执行模式(并行或串行) 查询过滤字段或者扫描范围 将会查询的表名 估算扫描数据bytes大小(依赖stats信息) 估算扫描数据量大小(依赖stats信息) 估算数量bytes大小和数据量时间 操作符被执行在客户端或者服务端 涉及的查询operations(sort、filter, scan,
- 下一篇
kinmall:哪些国家适合证券型通证发行(STO)?
证券型通证发行(STO)目前在加密货币市场中很常见。这种独特的筹款策略使公司能够利用区块链技术轻松监督、分配和规范其活动。STO将1CO的最佳特性与特定市场中的严格监管相结合。 除了使用STO策略的公司所获得的利益之外,投资者寻求此类投资的原因也很多。首先,STO比1CO透明得多。参与STO的公司必须披露敏感的公司信息,包括其地址、高层管理人员和财务信息。 这些信息进一步保护投资者免受ICO市场中出现的猖獗欺诈行为的影响。Statis集团发布的一份报告显示,2017年进行的ICO中有80%是骗局。正是这种欺诈活动促使了证券型通证的发展。 现在证券型通证更受欢迎,许多国家希望主办与STO相关的业务。为了吸引这些STO相关的业务,政府官员可以做出一些重大让步。以下是发行证券型通证的最佳国家。 01 马耳他 马耳他岛国是发行证券型通证的首选地点之一。该国从一开始就拥抱了区块链技术。马耳他总理约瑟夫·马斯喀特今年发表公开声明称,他承认监管机构的担忧以及区块链技术正在迅速改变全球各行各业的事实。 马耳他官员非常重视他们希望成为世界领先的区块链国家这一愿景。在同一份声明中,马耳他总理强调了实现经济...
相关文章
文章评论
共有0条评论来说两句吧...