Hadoop大象之旅007-配置Hadoop伪分布模式-低调大师

Hadoop大象之旅007-配置Hadoop伪分布模式

2014-12-01 791

Hadoop大象之旅007-配置Hadoop伪分布模式

老帅

安装hadoop分为本地模式、伪分布模式、集群模式。本地模式是运行在本地，只负责存储，没有计算功能。伪分布模式是在一台机器上模拟分布式部署，方便学习和调试。集群模式是在多个机器上配置hadoop，是真正的“分布式”。

伪分布模式是在一台单机上运行，但用不同的 Java 进程模仿分布式运行中的各类结点 ( NameNode, DataNode, JobTracker, TaskTracker, SecondaryNameNode )。

分布式运行中的这几个结点的区别：从分布式存储的角度来说，集群中的结点由一个 NameNode 和若干个 DataNode 组成, 另有一个Secondary NameNode 作为NameNode 的备份。从分布式应用的角度来说，集群中的结点由一个JobTracker 和若干个 TaskTracker 组成，JobTracker 负责任务的调度，TaskTracker 负责并行执行任务。TaskTracker 必须运行在 DataNode 上，这样便于数据的本地计算。JobTracker 和 NameNode 则无须在同一台机器上。

本章讲述伪分布模式的安装。

1.先研究一下Hadoop的目录结构

参照前面章节中所述方法，使用SecureCRTPortable.exe登录CentOS;

使用命令“cd/usr/local/hadoop”或者“cd $HADOOP_HOME”进入到Hadoop根目录;

使用命令“ll”查看一下目录结构,如下图所示：

其中d开头的表示文件夹，-开头的表示文件

我们要进行伪分布模式安装，需要修改的配置文件，都在“$HADOOP_HOME/conf”文件夹中

使用命令“cd $HADOOP_HOME/conf”进入到Hadoop根目录下;

使用命令“ll”查看一下目录结构,如下图所示：

2.修改hadoop-env.sh

这是Hadoop环境变量配置文件。

为了使Hadoop认识JDK，需要设置JAVA_HOME。

使用命令“vihadoop-env.sh”编辑配置文件，如下图所示：

使用快捷键“i”进入文件编辑模式，修改内容如上图所示

export JAVA_HOME=/usr/local/jdk

记住要把前面的#注释删除

使用快捷键“esc”退出文件编辑模式，

使用“Shift”和“：”组合键进入命令模式，

输入命令“wq”保存并退出。

3.修改core-site.xml

这是Hadoop的核心配置文件。

使用命令“vicore-site.xml”编辑配置文件，如下图所示：

<name>hadoop.tmp.dir</name>

<value>/home/hadoop/tmp</value>

<description>hadoop的运行临时文件的主目录</description>

</property>

<name>fs.default.name</name>

<value>hdfs://hadoop001:9000</value>

<description>HDFS的访问路径</description>

</property>

hadoop.tmp.dir 的意思是 hadoop 运行时产生临时文件的主目录，我们把它放在/home/hadoop/temp 下；

fs.default.name 的意思是 hdfs 的访问路径，我们把它定义在 CentOS 下的 9000 端口；

这里的 hadoop001 就是在主机的名字，配置在/etc/hosts。

4.修改hdfs-site.xml

这是hdfs的配置文件。

使用命令“vihdfs-site.xml”编辑配置文件，如下图所示：

<name>dfs.replication</name>

<description>存储副本数</description>

</property>

</configuration>

dfs.replication 的意思是hdfs存放文件副本的数量，默认为 3，在这里，我们是伪分布模式，这里设置为 1

5.修改 mapred-site.xml

这是mapreduce的配置文件

使用命令“vimapred-site.xml”编辑配置文件，如下图所示：

<name>mapred.job.tracker</name>

<value>hadoop001:9001</value>

<description>JobTracker的访问路径</description>

</property>

</configuration>

mapred.job.tracker 的意思是hadoop 中对于jobTracker 的访问路径，我们把它定义在 CentOS 下的 9001 端口；

这里的 hadoop001 就是在主机的名字，配置在/etc/hosts。

这就是安装伪分布模式的最小化配置。

微信关注我们

原文链接：https://yq.aliyun.com/articles/258309

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Hadoop大象之旅006-安装Hadoop环境

Hadoop大象之旅006-安装Hadoop环境老帅我们的硬件电脑上跑的是Windows7x64，并且在Windows7安装好了VMWare10虚拟机，VMWare中也安装配置了CentOS6.5操作系统，CentOS中也已经安装配置了jdk1.6.0_45，并也准备好了连接CentOS的工具软件SecureCrSecureFx。万事具备，应该安装Hadoop了，但是Hadoop有很多版本，我们怎么选择呢？从这里我们可以看出，hadoop-1.1.X 对 hbase0.94 和 hbase0.96是支持的，所以，我们这里选择 hadoop1.1.X 的目前最高版本（2014-4-10），也就是hadoop-1.1.2.tar.gz，这个文件可以在下面我提供的地址下载到：官方地址：http://archive.apache.org/dist/hadoop/core/hadoop-1.1.2/ 1.将Hadoop文件上传到CentOS中参照前面章节中所述方法，使用SecureFXPortable.exe在CentOS中建立/usr/local文件夹，将hadoop...

2014-12-01

784

Hadoop大象之旅008-启动与关闭Hadoop 老帅 Hadoop是一个运行在Linux文件系统上的分布式文件系统，在使用之前需要启动。 1.Hadoop的启动命令存储位置参照前面章节中所述方法，使用SecureCRTPortable.exe登录CentOS; 使用命令“cd/usr/local/hadoop”或者“cd $HADOOP_HOME”进入到Hadoop根目录; 使用命令“ll”查看一下目录结构,如下图所示：其中d开头的表示文件夹，-开头的表示文件我们所使用的启动和关闭hadoop的命令都在bin目录下；使用命令“cd $HADOOP_HOME/bin”进入到该目录下; 使用命令“ll”查看一下目录结构,如下图所示： 2.格式化文件系统 hdfs是文件系统，所以在第一次使用之前需要进行格式化。执行命令“hadoopnamenode –format” 格式化成功后，如下图所示：注意：只在第一次启动的时候格式化，不要每次启动都格式化。如果真的有必要再次格式化，请先把“hadoop.tmp.dir”目录下的文件全部删除。读者可以自己观察目录“hadoo...

2014-12-01

755

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。