hadoop分布式安装-低调大师

hadoop分布式安装

2017-11-11 480

分布式安装(至少三台主机)：
环境所需软件：
CentOS7
hadoop-2.7.3.tar.gz
jdk-8u102-linux-x64.tar.gz

安装前准备工作：

修改 /etc/hosts 文件
vim /etc/hosts
内容：
192.168.10.11 bigdata1
192.168.10.12 bigdata2
192.168.10.13 bigdata3

配置免密钥登陆
cd
ssh-keygen -t rsa
一直回车，直到结束

             ssh-copy-id   .ssh/id_rsa.pub    bigdata1
             ssh-copy-id   .ssh/id_rsa.pub    bigdata2
             ssh-copy-id   .ssh/id_rsa.pub    bigdata3

同步时间
通过设置计划任务实现各主机间的时间同步
vim /etc/crontab
0 0 1 root ntpdate -s time.windows.com

            或者部署一个时间服务器实现同步，这里就不详细讲解了

    （*）hdfs-site.xml

        <!--数据块的冗余度，默认是3-->
        <property>
          <name>dfs.replication</name>
          <value>2</value>
        </property>

        <!--是否开启HDFS的权限检查，默认：true-->
        <!--
        <property>
          <name>dfs.permissions</name>
          <value>false</value>
        </property>
        -->

    core-site.xml
        <!--NameNode的地址-->
        <property>
          <name>fs.defaultFS</name>
          <value>hdfs://bigdata1:9000</value>
        </property> 

        <!--HDFS数据保存的目录，默认是Linux的tmp目录-->
        <property>
          <name>hadoop.tmp.dir</name>
          <value>/root/training/hadoop-2.7.3/tmp</value>
        </property> 

    mapred-site.xml
        <!--MR程序运行的容器是Yarn-->
        <property>
          <name>mapreduce.framework.name</name>
          <value>yarn</value>
        </property>     

    yarn-site.xml
        <!--ResourceManager的地址-->
        <property>
          <name>yarn.resourcemanager.hostname</name>
          <value>bigdata1</value>
        </property>     

        <!--NodeManager运行MR任务的方式-->
        <property>
          <name>yarn.nodemanager.aux-services</name>
          <value>mapreduce_shuffle</value>
        </property> 

    对NameNode进行格式化: hdfs namenode -format
                     日志：Storage directory /root/training/hadoop-2.7.3/tmp/dfs/name has been successfully formatted.

    scp -r  /root/training/hadoop-2.7.3   bigdata2:/root/training/hadoop-2.7.3
    scp -r  /root/training/hadoop-2.7.3   bigdata3:/root/training/hadoop-2.7.3

    启动：start-all.sh = start-dfs.sh + start-yarn.sh

                验证 
（*）命令行：hdfs dfsadmin -report
（*）网页：HDFS：http://192.168.157.12:50070/
           Yarn：http://192.168.157.12:8088

（*）Demo：测试MapReduce程序
           example: /root/training/hadoop-2.7.3/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jar
           hadoop jar hadoop-mapreduce-examples-2.7.3.jar wordcount /input/data.txt /output/wc1204

本文转自菜鸟的征程 51CTO博客，原文链接:http://blog.51cto.com/songqinglong/2049138

微信关注我们

原文链接：https://yq.aliyun.com/articles/512666

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Hive部署

什么是 Hive Hive 是一个翻译器，它可以将SQL语句翻译成一个 MapReduce 程序常见的数据分析引擎： Hive, Pig, Impala, Spark SQL Hive 是一个基于Hadoop 之上的数据分析引擎（数据仓库） Hives HDFS 表 --------> 目录数据 --------> 文件分区 --------> 目录环境部署：部署前准备：环境变量：vi ~/.bash_profile HIVE_HOME=/root/training/apache-hive-2.3.0-bin export HIVE_HOME PATH=$HIVE_HOME/bin:$PATH export PATH 嵌入式部署：（1）使用Hive自带的Derby数据库来存储元信息（2）Hive只支持一个连接创建 conf/hive-site.xml <?xml version="1.0" encoding="UTF-8" standalone="no"...

2017-11-12

519

HBase讲解及部署

HBase 是一个 NoSQL 数据库什么是 NoSQL 数据库？基于 Key-value 来保存数据 NoSQL 数据库不支持事物常见的 NoSQL 数据库： HBase: 基于 HDFS ，面向列的数据库表 ----> 目录数据 ----> 文件 Redis: 基于内存的一个 NoSQL 数据库，支持持久化（RDB，AOF）前身： MemCached 不支持持久化 MongoDB：文档型的 NoSQL 数据库（BSON文档，JSON的二进制） Cassandra: 面向列的 NoSQL 数据库 HBase 的表结构 article(表) rowkey 内容作者评论标题正文用户内容文章1 先有鸡还是先有蛋 …… 某人喷手鸡都不造你是肿么造的文章…… …… …… …… …… …… 体系结构 HBase 环境部署：本地模式 ---1台主机：不需要 HDFS ，直接把数据存在操作系统上 1. 安装 JAVA 环境，修改环境变量 2. 安装 HBase 伪分...

2017-11-12

525

资源下载

更多资源

Mario，低调大师唯一一个Java游戏作品

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Oracle Database，又名Oracle RDBMS

Oracle Database，又名Oracle RDBMS，或简称Oracle。是甲骨文公司的一款关系数据库管理系统。它是在数据库领域一直处于领先地位的产品。可以说Oracle数据库系统是目前世界上流行的关系数据库管理系统，系统可移植性好、使用方便、功能强，适用于各类大、中、小、微机环境。它是一种高效率、可靠性好的、适应高吞吐量的数据库方案。

Eclipse（集成开发环境）

Eclipse 是一个开放源代码的、基于Java的可扩展开发平台。就其本身而言，它只是一个框架和一组服务，用于通过插件组件构建开发环境。幸运的是，Eclipse 附带了一个标准的插件集，包括Java开发工具（Java Development Kit，JDK）。

Sublime Text 一个代码编辑器

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。