高可用Hadoop平台－Ganglia安装部署

2016-04-19 709

1.概述

　　最近，有朋友私密我，Hadoop有什么好的监控工具，其实，Hadoop的监控工具还是蛮多的。今天给大家分享一个老牌监控工具Ganglia，这个在企业用的也算是比较多的，Hadoop对它的兼容也很好，不过就是监控界面就不是很美观。下次给大家介绍另一款工具——Hue，这个界面官方称为Hadoop UI，界面美观，功能也比较丰富。今天，在这里主要给大家介绍Ganglia这款监控工具，介绍的内容主要包含如下：

Ganglia背景
Ganglia安装部署、配置
Hadoop集群配置Ganglia
启动、预览Ganglia

　　下面开始今天的内容分享。

2.Ganglia背景

　　Ganglia是UC Berkeley发起的一个开源集群监视项目，设计用于测量数以千计的节点。Ganglia的核心包含gmond、gmetad以及一个Web前端。主要是用来监控系统性能，如：cpu 、mem、硬盘利用率， I/O负载、网络流量情况等，通过曲线很容易见到每个节点的工作状态，对合理调整、分配系统资源，提高系统整体性能起到重要作用。

　　Ganglia其核心由3部分组成：

gmond：运行在每个节点上监视并收集节点信息，可以同时收发统计信息，它可以运行在广播模式和单播模式中。
gmetad：从gmond以poll的方式收集和存储原数据。
ganglia-web：部署在gmetad机器上，访问gmetad存储的元数据并由Apache Web提高用户访问接口。

　　下面，我们来看看Ganglia的架构图，如下图所示：

　　从架构图中，我们可以知道Ganglia支持故障转移，统计可以配置多个收集节点。所以我们在配置的时候，可以按需选择去配置Ganglia，既可以配置广播，也可以配置单播。根据实际需求和手上资源来决定。

3.Ganglia安装部署、配置

3.1安装

　　本次安装的Ganglia工具是基于Apache的Hadoop-2.6.0。另外系统环境是CentOS 6.6。首先，我们下载Ganglia软件包，步骤如下所示：

第一步：安装yum epel源

[hadoop@nna ~]$ rpm -Uvh http://dl.fedoraproject.org/pub/epel/6/i386/epel-release-6-8.noarch.rpm

第二步：安装依赖包

[hadoop@nna ~]$ yum -y install httpd-devel automake autoconf libtool ncurses-devel libxslt groff pcre-devel pkgconfig

第三步：查看Ganglia安装包

[hadoop@nna ~]$ yum search ganglia

　然后，我为了简便，把Ganglia安装全部安装，安装命令如下所示：

第四步：安装Ganglia

[hadoop@nna ~]$ yum -y install ganglia*

　最后等待安装完成，由于这里资源有限，我将Ganglia Web也安装在NNA节点上，另外，其他节点也需要安装Ganglia的Gmond服务，该服务用来发送数据到Gmetad，安装方式参考上面的步骤。

3.2部署

　　在安装Ganglia时，我这里将Ganglia Web部署在NNA节点，其他节点部署Gmond服务，下表为各个节点的部署角色：

节点	Host	角色
NNA	10.211.55.26	Gmetad、Gmond、Ganglia-Web
NNS	10.211.55.27	Gmond
DN1	10.211.55.16	Gmond
DN2	10.211.55.17	Gmond
DN3	10.211.55.18	Gmond

　　Ganglia部署在Hadoop集群的分布图，如下所示：

3.3配置

　　在安装好Ganglia后，我们需要对Ganglia工具进行配置，在由Ganglia-Web服务的节点上，我们需要配置Web服务。

ganglia.conf

[hadoop@nna ~]$ vi /etc/httpd/conf.d/ganglia.conf

修改内容如下所示：

#
# Ganglia monitoring system php web frontend
#

Alias /ganglia /usr/share/ganglia

<Location /ganglia>
  Order deny,allow
  # Deny from all
  Allow from all
  # Allow from 127.0.0.1
  # Allow from ::1
  # Allow from .example.com
</Location>

　注：红色为添加的内容，绿色为注销的内容。

gmetad.conf

[hadoop@nna ~]$ vi /etc/ganglia/gmetad.conf

修改内容如下所示：

data_source "hadoop" nna nns dn1 dn2 dn3

　　这里“hadoop”表示集群名，nna nns dn1 dn2 dn3表示节点域名或IP。

gmond.conf

[hadoop@nna ~]$ vi /etc/ganglia/gmond.conf

修改内容如下所示：

/*
 * The cluster attributes specified will be used as part of the <CLUSTER>
 * tag that will wrap all hosts collected by this instance.
 */
cluster {
  name = "hadoop"
  owner = "unspecified"
  latlong = "unspecified"
  url = "unspecified"
}

/* Feel free to specify as many udp_send_channels as you like.  Gmond
   used to only support having a single channel */
udp_send_channel {
  #bind_hostname = yes # Highly recommended, soon to be default.
                       # This option tells gmond to use a source address
                       # that resolves to the machine's hostname.  Without
                       # this, the metrics may appear to come from any
                       # interface and the DNS names associated with
                       # those IPs will be used to create the RRDs.
  # mcast_join = 239.2.11.71
  host = 10.211.55.26
  port = 8649
  ttl = 1
}

/* You can specify as many udp_recv_channels as you like as well. */
udp_recv_channel {
  # mcast_join = 239.2.11.71
  port = 8649
  bind = 10.211.55.26
  retry_bind = true
  # Size of the UDP buffer. If you are handling lots of metrics you really
  # should bump it up to e.g. 10MB or even higher.
  # buffer = 10485760
}

这里我采用的是单播，cluster下的name要与gmetad中的data_source配置的名称一致，发送节点地址配置为NNA的IP，接受节点配置在NNA上，所以绑定的IP是NNA节点的IP。以上配置是在有Gmetad服务和Ganglia-Web服务的节点上需要配置，在其他节点只需要配置gmond.conf文件即可，内容配置如下所示：

/* Feel free to specify as many udp_send_channels as you like.  Gmond
   used to only support having a single channel */
udp_send_channel {
  #bind_hostname = yes # Highly recommended, soon to be default.
                       # This option tells gmond to use a source address
                       # that resolves to the machine's hostname.  Without
                       # this, the metrics may appear to come from any
                       # interface and the DNS names associated with
                       # those IPs will be used to create the RRDs.
  # mcast_join = 239.2.11.71
  host = 10.211.55.26
  port = 8649
  ttl = 1
}

/* You can specify as many udp_recv_channels as you like as well. */
udp_recv_channel {
  # mcast_join = 239.2.11.71
  port = 8649
  # bind = 10.211.55.26
  retry_bind = true
  # Size of the UDP buffer. If you are handling lots of metrics you really
  # should bump it up to e.g. 10MB or even higher.
  # buffer = 10485760
}

4.Hadoop集群配置Ganglia

　　在Hadoop中，对Ganglia的兼容是很好的，在Hadoop的目录下/hadoop-2.6.0/etc/hadoop，我们可以找到hadoop-metrics2.properties文件，这里我们修改文件内容如下所示，命令如下所示：

[hadoop@nna hadoop]$ vi hadoop-metrics2.properties

修改内容如下所示：

namenode.sink.ganglia.servers=nna:8649

#datanode.sink.ganglia.servers=yourgangliahost_1:8649,yourgangliahost_2:8649

resourcemanager.sink.ganglia.servers=nna:8649

#nodemanager.sink.ganglia.servers=yourgangliahost_1:8649,yourgangliahost_2:8649

mrappmaster.sink.ganglia.servers=nna:8649

jobhistoryserver.sink.ganglia.servers=nna:8649

这里修改的是NameNode节点的内容，若是修改DataNode节点信息，内容如下所示：

#namenode.sink.ganglia.servers=nna:8649

datanode.sink.ganglia.servers=dn1:8649

#resourcemanager.sink.ganglia.servers=nna:8649

nodemanager.sink.ganglia.servers=dn1:8649

#mrappmaster.sink.ganglia.servers=nna:8649

#jobhistoryserver.sink.ganglia.servers=nna:8649

　其他DN节点可以以此作为参考来进行修改。

　　另外，在配置完成后，若之前Hadoop集群是运行的，这里需要重启集群服务。

5.启动、预览Ganglia

　　Ganglia的启动命令有start、restart以及stop，这里我们分别在各个节点启动相应的服务，各个节点需要启动的服务如下：

NNA节点：

[hadoop@nna ~]$ service gmetad start

[hadoop@nna ~]$ service gmond start

[hadoop@nna ~]$ service httpd start

NNS节点：

[hadoop@nns ~]$ service gmond start

DN1节点：

[hadoop@dn1 ~]$ service gmond start

DN2节点：

[hadoop@dn2 ~]$ service gmond start

DN3节点：

[hadoop@dn3 ~]$ service gmond start

　然后，到这里Ganglia的相关服务就启动完毕了，下面给大家附上Ganglia监控的运行截图，如下所示：

6.总结

　　在安装Hadoop监控工具Ganglia时，需要在安装的时候注意一些问题，比如：系统环境的依赖，由于Ganglia需要依赖一些安装包，在安装之前把依赖环境准备好，另外在配置Ganglia的时候需要格外注意，理解Ganglia的架构很重要，这有助于我们在Hadoop集群上去部署相关的Ganglia服务，同时，在配置Hadoop安装包的配置文件下（/etc/hadoop）目录下，配置Ganglia配置文件。将hadoop-metrics2.properties配置文件集成到Hadoop集群中去。

7.结束语

　　这篇博客就和大家分享到这里，如果大家在研究学习的过程当中有什么问题，可以加群进行讨论或发送邮件给我，我会尽我所能为您解答，与君共勉！

微信关注我们

原文链接：https://yq.aliyun.com/articles/31578

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

高可用Hadoop平台－Hue In Hadoop

1.概述今天为大家介绍另一款工具——Hue，该工具功能比较丰富，下面是今天为大家分享的内容目录： Hue简述 Hue In Hadoop 截图预览本文所使用的环境是Apache Hadoop-2.6版本，下面开始今天的内容分享。 2.Hue简述 Hue是一个开源的Apache Hadoop UI系统，由Cloudera Desktop演化而来，最后Cloudera公司将其贡献给Apache基金会的Hadoop社区，它是基于Python Web框架Django实现的。通过使用Hue我们可以在浏览器端的Web控制台上与Hadoop集群进行交互来分析处理数据，例如操作HDFS上的数据，运行MapReduce Job，执行Hive的SQL语句，浏览HBase数据库等等。 Hue在数据库方面，默认使用的是SQLite数据库来管理自身的数据，包括用户认证和授权，另外，可以自定义为MySQL数据库、Postgresql数据库、以及Oracle数据库。其自身的功能包含有：对HDFS的访问，通过浏览器来查阅HDFS的数据。 Hive编辑器：可以编写HQL和运行HQL脚本，以及查看运行结果等相关Hi...

2016-04-19

789

1.概述今天补充一篇HBase集群的搭建，这个是高可用系列遗漏的一篇博客，今天抽时间补上，今天给大家介绍的主要内容目录如下所示：基础软件的准备 HBase介绍 HBase集群搭建单点问题验证截图预览那么，接下来我们开始今天的HBase集群搭建学习。 2.基础软件的准备由于HBase的数据是存放在HDFS上的，所以我们在使用HBase时，确保Hadoop集群已搭建完成，并运行良好。若是为搭建Hadoop集群，请参考我写的《配置高可用的Hadoop平台》来完成Hadoop平台的搭建。另外，我们还需要准备好HBase的安装包，这里我所使用的HBase-1.0.1，Hadoop版本使用的是2.6.0，基础软件下载地址如下所示： HBase安装包《下载地址》在准备好基础软件后，我们来介绍一下HBase的相关背景。 3.HBase介绍在使用HBase的时候，我们需要清楚HBase是用来干什么的。HBase是一个分布式的、面向列的开源数据库，就像Bigtable利用了Google文件系统（File System）所提供的分布式数据存储一样，HBase在Hadoop之上提供了类似于Bi...

2016-04-19

728

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。

高可用Hadoop平台－Ganglia安装部署

1.概述

2.Ganglia背景

3.Ganglia安装部署、配置

3.1安装

3.2部署

3.3配置

4.Hadoop集群配置Ganglia

5.启动、预览Ganglia

6.总结

7.结束语

高可用Hadoop平台－Hue In Hadoop

高可用Hadoop平台－HBase集群搭建

相关文章

发表评论

资源下载

Mario

Nacos

Sublime Text

WebStorm

欢迎您来访！