搜索[分布式调度]结果-低调大师优秀个人博客

分布式日志平台--ELKStack实践

filtered">gateway.type:local<br data-filtered="filtered">gateway的类型，默认为local即为本地文件系统，可以设置为本地文件系统，分布式文件系统

2017-11-16

一、准备： 1、修改主机名： vi /etc/sysconfig/network内容如下： NETWORKING=yes HOSTNAME=myHadoop 2、修改主机名和IP的映射关系，即hosts文件： vi /etc/hosts 192.168.127.150myHadoop 3、关闭防火墙： 3.1、查看防火墙状态 service iptables status 3.2、关闭防火墙 service iptables stop 3.3、查看防火墙开机启动状态 chkconfig iptables --list 3.4、关闭防火墙开机启动 chkconfig iptables off 4、重启Linux： reboot/shutdown -r now 二、安装JDK： 1、解压： tar -zxvf jdk-7u55-linux-i586.tar.gz -C /opt/tool 2、将java添加到环境变量中： sudo vi /etc/profile #在文件最后添加 export JAVA_HOME=/opt/tool/jdk-7u_65-i585 export PATH=$PATH:$JAVA_HOME/bin #刷新配置 source /etc/profile #验证：java -version java version "1.7.0_65" Java(TM) SE Runtime Environment (build 1.7.0_65-b17) Java HotSpot(TM) Client VM (build 24.65-b04, mixed mode) 三、安装hadoop2.4.1： 1、解压： tar -zxvf hadoop-2.4.1.tar.gz -C /opt/tool 2、将hadoop添加到环境变量中 sudovi /etc/profile #在文件最后添加 export HADOOP_HOME=/opt/tool/hadoop-2.4.1 export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin #刷新配置 source /etc/profile #验证：hadoop version Hadoop 2.4.1 Subversion http://svn.apache.org/repos/asf/hadoop/common -r 1604318 Compiled by jenkins on 2014-06-21T05:43Z Compiled with protoc 2.5.0 From source with checksum bb7ac0a3c73dc131f4844b873c74b630 This command was run using /opt/tool/hadoop-2.4.1/share/hadoop/common/hadoop-common-2.4.1.jar 3、配置hadoop： 3.1：hadoop-env.sh vim hadoop-env.sh #第27行 export JAVA_HOME=/opt/tool/jdk-7u_65-i585 3.2：core-site.xml  <property> <name>fs.defaultFS</name> <value>hdfs://hadoopnode0:9000</value> </property>  <property> <name>hadoop.tmp.dir</name> <value>/opt/tool/hadoop-2.4.1/tmp</value> </property> 3.3：hdfs-site.xml hdfs-default.xml (3)  <property> <name>dfs.replication</name> <value>1</value> </property> 3.4：mapred-site.xml (mv mapred-site.xml.template mapred-site.xml) mv mapred-site.xml.template mapred-site.xml vim mapred-site.xml  <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property> 3.5：yarn-site.xml  <property> <name>yarn.resourcemanager.hostname</name> <value>hadoopnode0</value> </property>  <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property> 3.6：格式化namenode （是对namenode进行初始化,只有在第一次安装时执行格式化，切记切记，否则数据丢失。） hdfs namenode -format (或者hadoop namenode -format) 3.7：启动hadoop： #先启动HDFS：start-dfs.sh，启动了一下进程： NameNode SecondaryNameNode DataNode #再启动YARN：start-yarn.sh，启动了一下进程： NodeManager ResourceManager 3.8：验证是否启动成功使用jps命令验证 22303 NameNode 22216 Jps 27643 SecondaryNameNode 25566 NodeManager 25603 ResourceManager 27812 DataNode http://192.168.1.201:50070 （HDFS管理界面） http://192.168.1.201:8088 （MR管理界面） 4、NameNode：是整个文件系统的管理节点。它维护着整个文件系统的文件目录树，文件/目录的元数据信息和每个文件对应的数据库列表。接收用户的操作请求。元数据信息保存在fsimage和edit中，fsimage保存的是合并后的元数据信息，而edit保存的是实时的元数据信息。 5、DataNode：提供真实文件数据的存储服务。文件存储时，是以block为单位进行存储的。文件块（block）：最基本的存储单位。对于文件内容而言，一个文件的长度大小是size，那么从文件的0偏移开始，按照固定的大小，顺序对文件进行划分并编号，划分好的每一个块称为一个block。HDFS默认block大小为128MB，以一个256MB文件为例，可以分割为2个Block。 6、SecondaryNameNode ：用来合并fsimage和edit。本文转自lzf0530377451CTO博客，原文链接：http://blog.51cto.com/8757576/1827475，如需转载请自行联系原作者

2017-11-14

云计算与分布式计算

换一句话：将一个大规模分布式计算网络配备上一个前端计费服务器(见下图)，那样一来分布式计算就变成云计算了吗？当然不是！要不然我就会在如下表示分布式计算的图中画上一朵云彩了.

2017-11-14

Hadoop完全分布式安装Hive

应用场景当我们按照hadoop完全分布式集群搭建博客搭建了hadoop以后，发现这是一个空的hadoop，只有YARN，MapReduce，HDFS，而这些实际上我们一般不会直接使用，而是需要另外部署

2017-11-13

Hadoop伪分布式安装Spark

应用场景搭建部署了hadoop环境后，使用MapReduce来进行计算，速度非常慢，因为MapReduce只是分布式批量计算，用于跑批的场景，并不追求速率，因为它需要频繁读写HDFS，并不能实时反馈结果

2017-11-13

Hadoop、Hbase完全分布式搭建

一、Hadoop1.0到2.0的架构变化 1、Hadoop 2.0由HDFS、MapReduce和YARN三个分支构成 2、HDFSNN Federation、HA 3、MapReduce运行在YARN上的MR 4、YARN资源管理系统二、HDFS 2.0 1、解决HDFS 1.0中单点故障和内存受限问题。 2、解决单点故障 HDFS HA通过主备NameNode解决如果主NameNode发生故障则切换到备NameNode上 3、解决内存受限问题 HDFS Federation(联邦) 水平扩展支持多个NameNode 每个NameNode分管一部分目录所有NameNode共享所有DataNode存储资 4、仅是架构上发生了变化使用方式不变对HDFS使用者透明 HDFS 1.0中的命令和API仍可以使用$ hadoop fs -ls /user/hadoop/$ hadoop fs -mkdir /user/hadoop/data 三、HDFS 2.0 HA 1、主备NameNode 2、解决单点故障主NameNode对外提供服务备NameNode同步主NameNode元数据以待切换所有DataNode同时向两个NameNode汇报数据块信息 3、两种切换选择手动切换通过命令实现主备之间的切换可以用HDFS升级等场合自动切换基于Zookeeper实现 4、基于Zookeeper自动切换方案 Zookeeper Failover Controller监控NameNode健康状态并向Zookeeper注册NameNode NameNode挂掉后ZKFC为NameNode竞争锁获得ZKFC 锁的NameNode变为active 四、环境搭建 192.168.1.2 master 192.168.1.3 slave1 192.168.1.4 slave2 Hadoop versionhadoop-2.2.0.tar.gz Hbase versionhbase-0.98.11-hadoop2-bin.tar.gz Zookeeper versionzookeeper-3.4.5.tar.gz JDK versionjdk-7u25-linux-x64.gz 1、主机HOSTS文件配置 1 2 3 4 5 6 7 8 9 10 11 12 [root@master~] #cat/etc/hosts 192.168.1.2master 192.168.1.3slave1 192.168.1.4slave2 [root@slave1~] #cat/etc/hosts 192.168.1.2master 192.168.1.3slave1 192.168.1.4slave2 [root@slave2~] #cat/etc/hosts 192.168.1.2master 192.168.1.3slave1 192.168.1.4slave2 2、配置节点之间互信 1 2 3 4 5 6 7 8 9 10 [root@master~] #useraddhadoop [root@slave1~] #useraddhadoop [root@slave2~] #useraddhadoop [root@master~] #passwdhadoop [root@slave1~] #passwdhadoop [root@slave2~] #passwdhadoop [root@master~] #su-hadoop [hadoop@master~]$ ssh -copy- id -i~/. ssh /id_rsa .pubslave1 [hadoop@master~]$ ssh -copy- id -i~/. ssh /id_rsa .pubslave2 [hadoop@master~]$ ssh -copy- id -i~/. ssh /id_rsa .pubmaster 3、JDK环境配置 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 [root@master~] #tarjdk-7u25-linux-x64.gz [root@master~] #mkdir/usr/java [root@master~] #mvjdk-7u25-linux-x64.gz/usr/java [root@master~] #cd/usr/java/ [root@masterjava] #ln-sjdk1.7.0_25jdk #修改/etc/profile,添加 export JAVA_HOME= /usr/java/jdk export CLASSPATH=$CLASSPATH:$JAVA_HOME /lib :$JAVA_HOME /jre/lib export PATH= /usr/java/jdk/bin :$PATH [root@master~] #source/etc/profile [root@master~] #java-version javaversion "1.7.0_25" Java(TM)SERuntimeEnvironment(build1.7.0_25-b15) JavaHotSpot(TM)64-BitServerVM(build23.25-b01,mixedmode) #slave1,slave2同样操作 4.Hadoop安装 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 [root@master~] #tarzxvfhadoop-2.2.0.tar.gz [root@master~] #mvhadoop-2.2.0/home/hadoop/ [root@master~] #cd/home/hadoop/ [root@masterhadoop] #ln-shadoop-2.2.0hadoop [root@masterhadoop] #chown-Rhadoop.hadoop/home/hadoop/ [root@master~] #cd/home/hadoop/hadoop/etc/hadoop #修改hadoop-env.sh文件 export JAVA_HOME= /usr/java/jdk export HADOOP_HEAPSIZE=200 #修改mapred-env.sh文件 export JAVA_HOME= /usr/java/jdk export HADOOP_JOB_HISTORYSERVER_HEAPSIZE=1000 #修改yarn-env.sh文件 export JAVA_HOME= /usr/java/jdk JAVA_HEAP_MAX=-Xmx300m YARN_HEAPSIZE=100 #修改core-site.xml文件 <configuration> <property> <name>fs.defaultFS< /name > <value>hdfs: //master :9000< /value > < /property > <property> <name>hadoop.tmp. dir < /name > <value> /home/hadoop/tmp < /value > < /property > <property> <name>hadoop.proxyuser.hadoop.hosts< /name > <value>*< /value > < /property > <property> <name>hadoop.proxyuser.hadoop. groups < /name > <value>*< /value > < /property > < /configuration > #修改hdfs-site.xml文件 <configuration> <property> <name>dfs.namenode.secondary.http-address< /name > <value>master:9001< /value > < /property > <property> <name>dfs.namenode.name. dir < /name > <value> /home/hadoop/dfs/name < /value > < /property > <property> <name>dfs.datanode.data. dir < /name > <value> /home/hadoop/dfs/data < /value > < /property > <property> <name>dfs.replication< /name > <value>2< /value > < /property > <property> <name>dfs.webhdfs.enabled< /name > <value> true < /value > < /property > < /configuration > #修改mapred-site.xml文件 <configuration> <property> <name>mapreduce.framework.name< /name > <value>yarn< /value > < /property > <property> <name>mapreduce.jobhistory.address< /name > <value>master:10020< /value > < /property > <property> <name>mapreduce.jobhistory.webapp.address< /name > <value>master:19888< /value > < /property > <property> <name>mapreduce.map.memory.mb< /name > <value>512< /value > < /property > <property> <name>mapreduce.map.cpu.vcores< /name > <value>1< /value > < /property > <property> <name>mapreduce.reduce.memory.mb< /name > <value>512< /value > < /property > < /configuration > #修改yarn-site.xml文件 <configuration> <property> <name>yarn.nodemanager.aux-services< /name > <value>mapreduce_shuffle< /value > < /property > <property> <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class< /name > <value>org.apache.hadoop.mapred.ShuffleHandler< /value > < /property > <property> <name>yarn.resourcemanager.address< /name > <value>master:8032< /value > < /property > <property> <name>yarn.resourcemanager.scheduler.address< /name > <value>master:8030< /value > < /property > <property> <name>yarn.resourcemanager.resource-tracker.address< /name > <value>master:8031< /value > < /property > <property> <name>yarn.resourcemanager.admin.address< /name > <value>master:8033< /value > < /property > <property> <name>yarn.resourcemanager.webapp.address< /name > <value>master:8088< /value > < /property > <property> <name>yarn.scheduler.minimum-allocation-mb< /name > <value>100< /value > < /property > <property> <name>yarn.scheduler.maximum-allocation-mb< /name > <value>200< /value > < /property > <property> <name>yarn.scheduler.minimum-allocation-vcores< /name > <value>1< /value > < /property > <property> <name>yarn.scheduler.maximum-allocation-vcores< /name > <value>2< /value > < /property > < /configuration > #修改slaves文件 slave1 slave2 #修改/home/hadoop/.bashrc export HADOOP_DEV_HOME= /home/hadoop/hadoop export PATH=$PATH:$HADOOP_DEV_HOME /bin export PATH=$PATH:$HADOOP_DEV_HOME /sbin export HADOOP_MAPARED_HOME=${HADOOP_DEV_HOME} export HADOOP_COMMON_HOME=${HADOOP_DEV_HOME} export HADOOP_HDFS_HOME=${HADOOP_DEV_HOME} export YARN_HOME=${HADOOP_DEV_HOME} export HADOOP_CONF_DIR=${HADOOP_DEV_HOME} /etc/hadoop export HDFS_CONF_DIR=${HADOOP_DEV_HOME} /etc/hadoop export YARN_CONF_DIR=${HADOOP_DEV_HOME} /etc/hadoop #将上面修改的文件全部传送到slave1,slave2节点 5、在master节点上启动hdfs 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 [hadoop@master~]$ cd /home/hadoop/hadoop/sbin/ [hadoop@mastersbin]$. /start-dfs .sh 15 /03/21 00:49:35WARNutil.NativeCodeLoader:Unabletoloadnative-hadooplibrary for yourplatform...using builtin -javaclasseswhereapplicable Startingnamenodeson[master] master:startingnamenode,loggingto /home/hadoop/hadoop-2 .2.0 /logs/hadoop-hadoop-namenode-master .out slave2:startingdatanode,loggingto /home/hadoop/hadoop-2 .2.0 /logs/hadoop-hadoop-datanode-slave2 .out slave1:startingdatanode,loggingto /home/hadoop/hadoop-2 .2.0 /logs/hadoop-hadoop-datanode-slave1 .out Startingsecondarynamenodes[master] master:startingsecondarynamenode,loggingto /home/hadoop/hadoop-2 .2.0 /logs/hadoop-hadoop-secondarynamenode-master .out #查看进程 [hadoop@master~]$jps 39093Jps 38917SecondaryNameNode 38767NameNode [root@slave1~] #jps 2463Jps 2379DataNode [root@slave2~] #jps 2463Jps 2379DataNode #启动jobhistory [hadoop@mastersbin]$mr-jobhistory-daemon.shstarthistoryserver startinghistoryserver,loggingto /home/hadoop/hadoop-2 .2.0 /logs/mapred-hadoop-historyserver-master .out 6、启动yarn 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 [hadoop@master~]$ cd /home/hadoop/hadoop/sbin/ [hadoop@mastersbin]$. /start-yarn .sh startingyarndaemons startingresourcemanager,loggingto /home/hadoop/hadoop-2 .2.0 /logs/yarn-hadoop-resourcemanager-master .out slave2:startingnodemanager,loggingto /home/hadoop/hadoop-2 .2.0 /logs/yarn-hadoop-nodemanager-slave2 .out slave1:startingnodemanager,loggingto /home/hadoop/hadoop-2 .2.0 /logs/yarn-hadoop-nodemanager-slave1 .out #查看进程 [hadoop@mastersbin]$jps 39390Jps 38917SecondaryNameNode 39147ResourceManager 38767NameNode [hadoop@slave1~]$jps 2646Jps 2535NodeManager 2379DataNode [hadoop@slave2~]$jps 8261Jps 8150NodeManager 8004DataNode 7、查看hdfs文件系统 1 2 3 4 5 [hadoop@mastersbin]$hadoopfs- ls / 15 /03/21 15:56:05WARNutil.NativeCodeLoader:Unabletoloadnative-hadooplibrary for yourplatform...using builtin -javaclasseswhereapplicable Found2items drwxr-xr-x-hadoopsupergroup02015-03-2017:46 /hbase drwxrwx----hadoopsupergroup02015-03-2016:56 /tmp 8、安装Zookeeper 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 [root@master~] #tarzxvfzookeeper-3.4.5.tar.gz-C/home/hadoop/ [root@master~] #cd/home/hadoop/ [root@masterhadoop] #ln-szookeeper-3.4.5zookeeper [root@masterhadoop] #chown-Rhadoop.hadoop/home/hadoop/zookeeper [root@masterhadoop] #cdzookeeper/conf/ [root@masterconf] #cpzoo_sample.cfgzoo.cfg #修改zoo.cfg dataDir= /home/hadoop/zookeeper/data dataLogDir= /home/hadoop/zookeeper/logs server.1=192.168.1.2:7000:7001 server.2=192.168.1.3:7000:7001 server.3=192.168.1.4:7000:7001 #在slave1,slave2执行相同的操作 [hadoop@masterconf] #cd/home/hadoop/zookeeper/data/ [hadoop@masterdata] #echo1>myid [hadoop@slave1data] #echo2>myid [hadoop@slave2data] #echo3>myid #启动zookeeper [hadoop@master~]$ cd zookeeper /bin/ [hadoop@masterbin]$. /zkServer .shstart [hadoop@slave1~]$ cd zookeeper /bin/ [hadoop@slave1bin]$. /zkServer .shstart [hadoop@slave2~]$ cd zookeeper /bin/ [hadoop@slave2bin]$. /zkServer .shstart 9、Hbase安装 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 [root@master~] #tarzxvfhbase-0.98.11-hadoop2-bin.tar.gz-C/home/hadoop/ [root@master~] #cd/home/hadoop/ [root@masterhadoop] #ln-shbase-0.98.11-hadoop2hbase [root@masterhadoop] #chown-Rhadoop.hadoop/home/hadoop/hbase [root@masterhadoop] #cd/home/hadoop/hbase/conf/ #修改hbase-env.sh文件 export JAVA_HOME= /usr/java/jdk export HBASE_HEAPSIZE=50 #修改hbase-site.xml文件 <configuration> <property> <name>hbase.rootdir< /name > <value>hdfs: //master :9000 /hbase < /value > < /property > <property> <name>hbase.cluster.distributed< /name > <value> true < /value > < /property > <property> <name>hbase.zookeeper.property.clientPort< /name > <value>2181< /value > < /property > <property> <name>hbase.zookeeper.quorum< /name > <value>master,slave1,slave2< /value > < /property > < /configuration > #修改regionservers文件 slave1 slave2 #将上面修改的文件传送到slave1,slave2 10、在master上面启动Hbase 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 [hadoop@master~]$ cd hbase /bin/ [hadoop@masterbin]$. /start-hbase .sh master:startingzookeeper,loggingto /home/hadoop/hbase/bin/ .. /logs/hbase-hadoop-zookeeper-master .out slave1:startingzookeeper,loggingto /home/hadoop/hbase/bin/ .. /logs/hbase-hadoop-zookeeper-slave1 .out slave2:startingzookeeper,loggingto /home/hadoop/hbase/bin/ .. /logs/hbase-hadoop-zookeeper-slave2 .out startingmaster,loggingto /home/hadoop/hbase/bin/ .. /logs/hbase-hadoop-master-master .out slave1:startingregionserver,loggingto /home/hadoop/hbase/bin/ .. /logs/hbase-hadoop-regionserver-slave1 .out slave2:startingregionserver,loggingto /home/hadoop/hbase/bin/ .. /logs/hbase-hadoop-regionserver-slave2 .out #查看进程 [hadoop@masterbin]$jps 39532QuorumPeerMain 38917SecondaryNameNode 39147ResourceManager 39918HMaster 38767NameNode 40027Jps [hadoop@slave1data]$jps 3021HRegionServer 3133Jps 2535NodeManager 2379DataNode 2942HQuorumPeer [hadoop@slave2~]$jps 8430HRegionServer 8351HQuorumPeer 8150NodeManager 8558Jps 8004DataNode #验证 [hadoop@masterbin]$. /hbase shell 2015-03-2116:11:44,534INFO[main]Configuration.deprecation:hadoop.native.libisdeprecated.Instead,useio.native.lib.available HBaseShell;enter 'help<RETURN>' for listofsupportedcommands. Type "exit<RETURN>" toleavetheHBaseShell Version0.98.11-hadoop2,r6e6cf74c1161035545d95921816121eb3a516fe0,TueMar300:23:49PST2015 hbase(main):001:0>list TABLE SLF4J:ClasspathcontainsmultipleSLF4Jbindings. SLF4J:Foundbinding in [jar: file : /home/hadoop/hbase-0 .98.11-hadoop2 /lib/slf4j-log4j12-1 .6.4.jar! /org/slf4j/impl/StaticLoggerBinder .class] SLF4J:Foundbinding in [jar: file : /home/hadoop/hadoop-2 .2.0 /share/hadoop/common/lib/slf4j-log4j12-1 .7.5.jar! /org/slf4j/impl/StaticLoggerBinder .class] SLF4J:Seehttp: //www .slf4j.org /codes .html #multiple_bindingsforanexplanation. 2015-03-2116:11:56,499WARN[main]util.NativeCodeLoader:Unabletoloadnative-hadooplibrary for yourplatform...using builtin -javaclasseswhereapplicable 0row(s) in 1.9010seconds =>[] 11、查看集群状态 HDFS UIhttp://192.168.1.2:50070/dfshealth.jsp YARN UIhttp://192.168.1.2:8088/cluster jobhistory UIhttp://192.168.1.2:19888/jobhistory HBASE UIhttp://192.168.1.2:60010/master-status 本文转自ljl_19880709 51CTO博客，原文链接：http://blog.51cto.com/luojianlong/1622823，如需转载请自行联系原作者

2017-11-13