批量部署Hadoop集群环境（1）-低调大师

批量部署Hadoop集群环境（1）

2016-02-15 738

批量部署Hadoop集群环境（1）

1. 项目简介：

前言：云火的一塌糊涂，加上自大二就跟随一位教授做大数据项目，所以很早就产生了兴趣，随着知识的积累，虚拟机已经不能满足了，这次在服务器上以生产环境来部署Hadoop。已经搭建完毕，分享出来供大家参考。
问题：看到Hadoop部署在一些资料上很是繁琐，一些简单的部署方法只是玩具，无法满足企业的部署条件，如果一台台服务器去部署，显然是不可行。
解决：在学习及其他资料后，准备以《Apache Hadoop Yarn: Moving Beyond Mapreduce and Batch Processing with Apache Hadoop 2》为依据，其他资料辅助。
注意：《Apache Hadoop Yarn: Moving Beyond Mapreduce and Batch Processing with Apache Hadoop 2》这本书有一处错误。
- P53 原版“nm_host” 应改正为“nn_host”
- 这么小的错误，影响是巨大的，我也是在实践本书内容时候，发现的错误，它会导致namenode不存在，而影响服务器节点无法启动。

2. 项目环境

阿里云服务器ESC (4台)
Centos 7
Hadoop-YARN(2.7.1)
java version “1.8.0_72”
pdsh version “2.31”（批处理主要工具）
Xmanager Enterprise 5（使用xshell来连接服务器）

3. 服务器分配情况

集群节点名字	对应字段	主机编号	主机内网IP	hostname
HDFS NameNode	nn_host	00	10.251.20.244	iZ28z9sbsgjZ
YARN ResourceManager	rm_host	00	10.251.20.244	iZ28z9sbsgjZ
HDFS SecondaryNameNode	snn_host	01	10.45.202.245	iZ28fm2wvrwZ
MapReduce	mr_history_host	02	10.144.27.164	iZ28n1kabs3Z
YARN网页代理服务器	yarn_proxy_host	03	10.163.97.250	iZ28bwz7umxZ
YARN NodeManager	nm_hosts	01、02、03	10.45.202.245 10.144.27.164 10.163.97.250	iZ28fm2wvrwZ iZ28n1kabs3Z iZ28bwz7umxZ
HDFS DataNode	dn_hosts	01、02、03	10.45.202.245 10.144.27.164 10.163.97.250	iZ28fm2wvrwZ iZ28n1kabs3Z iZ28bwz7umxZ

4. 项目目标

实现批量部署Hadoop集群环境

5. 项目目录

6. 一键批量部署Hadoop环境，ESC服务器提前要准备的工作

7. 实现多台ESC内网连接

送上官方教程，图文声茂
阿里云机房内网情况简介
 通过安全组实现不同账号下相同地域ECS内网互通

8. 实现无密匙登录

有点小繁琐，但是原理很简单：
8.1每台机器需要生成密匙
生成密匙对

    ssh-keygen -t rsa

8.2复制密匙到远程机器（固定机器/本机）

ssh-copy-id -i ~/.ssh/id_rsa.pub 10.x.x.x

解析：
ssh-keygen -t rsa 中，-t是type，模式是rsa
ssh-copy-id -i ~/.ssh/id_rsa.pub 10.x.x.x 中，将本机id_rsa.pub复制到远程机器（如内网IP为10.x.x.x，替换为自己的一台固定服务器，这样，依次弄完后，这台“固定机器上边就有了所有机器的密匙”）

9. 修改host

目的是为了使用hostname可以ping通。
写入内网IP和hostname

vim /etc/hosts
10.251.20.244 iZ28z9sbsgjZ
10.45.202.245 iZ28fm2wvrwZ 
10.144.27.164 iZ28n1kabs3Z
10.163.97.250 iZ28bwz7umxZ

10. 实现pdsh访问

这次是以“固定机器”依次访问其他服务器（包括自己），如
访问自己

ssh iZ28z9sbsgjZ

访问完毕后，此时在~/.ssh生成known_hosts就包含了所有服务器

[root@iZ28z9sbsgjZ ~]# cd ~/.ssh
[root@iZ28z9sbsgjZ .ssh]# ls
authorized_keys  id_rsa  id_rsa.pub  known_hosts

11. 开始批处理作业，以后的所有步骤很依赖pdsh，只要是批处理！

在opt文件下做如下操作（opt文件夹或者别的，建议默认，整篇教程都是这个路径）
11.1 创建all_hosts

cd /opt

vim all_hosts

#写入自己服务器hostname如：
iZ28bwz7umxZ
iZ28fm2wvrwZ
iZ28n1kabs3Z
iZ28z9sbsgjZ

11.2 批量复制固定机器（本机）的authorized_keys 和 known_hosts，到全部集群

pdcp -w ^all_hosts ~/.ssh/authorized_keys ~/.ssh/
pdcp -w ^all_hosts ~/.ssh/known_hosts ~/.ssh/

12. 准备完毕，进入下一步批量部署Hadoop集群环境（2）

微信关注我们

原文链接：https://yq.aliyun.com/articles/70643

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

云上游戏数据分析实践

作者：上海驻云高级架构师李俊涛从游戏发展的角度来看，不管是端游、页游，还是现在发展迅猛的手游，其生命周期与盈利情况都与数据分析能力息息相关。同时数据分析对游戏的运维也起到了至关重要的作用。精确的数据分析有助于在做游戏运营时推出合理的新手引导，在及时的渠道推广和丰富的消费场景设计，这些将极大地影响游戏玩家对游戏的关注度，从而延长游戏的生命周期，并从中更好盈利。游戏数据分析特点分析是建立在数据上的，数据的特点决定了分析的方向和方法。游戏数据的特点主要表现在以下四个方面。第一，数据量大。以手机游戏为例，一款中型规模手游的日均数据量增长在几十GB。在这种情景下，做常见的月活、季活等游戏指标分析所面对的就是TB级别的海量数据。第二，数据类型丰富。从游戏数据的种类来看，分为结构化数据和非结构化

2016-02-16

697

Hive 1.2.1&Spark&Sqoop安装指南.pdf 目录目录 1 1.前言 1 2.约定 2 3.服务端口 2 4.安装MySQL 2 4.1.安装MySQL 2 4.2.创建Hive元数据库 4 5.安装步骤 5 5.1.下载Hive1.2.1二进制安装包 5 5.2.安装Hive 5 5.3.安装MySQL-Connector 5 5.4.修改配置 5 5.4.1.修改/etc/profile或~/.profile 5 5.4.2.修改其它配置文件 5 5.4.2.1.修改hive-env.sh 6 5.4.2.2.修改hive-site.xml 6 5.4.2.3.修改hive-log4j.properties 7 5.4.2.4.修改hive-exec-log4j.properties 7 6.启动运行 7 7.远程执行HSQL 8 8.基本命令 8 9.单点方案 9 10.和Spark集成 9 11.和Sqoop集成 9 11.1.修改sqoop-env.sh 9 11.2.修改sqoop-site.xml 10 11.3.复制hadoop的jar...

2016-02-16

666

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。