hadoop伪分布式安装-低调大师

hadoop伪分布式安装

2015-02-02 696 89

首先需要有一台linux的虚拟机，什么版本的都差不多

这里以redhat为例

下载hadoop（只是为了学习使用的是老版本的0.20.2）

网上有很多下载的地方

为服务器安装jdk

jdk文件版本为jdk-7u45-linux-i586.rpm

可以在官网上下载各个版本的linux jdk文件

使用命令

rpm -ivh jdk-7u45-linux-i586.rpm

进行安装

安装完成之后编辑profile文件配置环境变量

vi /etc/profile

在末尾追加

export JAVA_HOME=/usr/java/jdk1.7.0_45
export PATH=$JAVA_HOME/bin/:$PATH
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

注意jdk对应的版本号

编辑完成后使用命令

source /etc/profile

保存配置

之后输入java -version可以查看jdk版本信息

配置ssh免密码登录

在服务器上

输入命令

chmod -R 755 /home/hadoop
mkdir ~/.ssh
ssh-keygen -t rsa

ssh-keygen -t dsa

rsa和dsa分别生成不同加密格式的ssh密钥，直接一直按回车键保存在默认的路径

在节点上配置authorized_keys文件

输入命令

cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

将本地的密钥保存在authorized_keys

输入命令

chmod -R 700 ~/.ssh

注意当前你所在的路径

接下来可以在服务器上测试ssh是否可以免密码登录了

例：

ssh localhost date

将会提示

The authenticity of host 'master (10.10.10.100)' can't be established.
RSA key fingerprint is 99:ef:c2:9e:28:e3:b6:83:e2:00:eb:a3:ee:ad:29:d8.
Are you sure you want to continue connecting (yes/no)?

这是因为这台机器上的ssh没有把master记录在已知的主机列表中

输入yes回车即可

（之后的各个节点一样，输入yes让其记住主机，之后就可以免密码登录）

如果中间出现什么异常或者错误，有可能是权限问题导致，请百度之

在节点上配置hadoop

将hadoop包放到/home/hadoop目录下方便操作

1.修改hadoop-env.sh文件

添加

export JAVA_HOME=/usr/java/jdk1.7.0_45

配置jdk的环境变量，注意jdk版本

2.修改core-site.xml文件

<property>
<name>fs.default.name</name>
<value>hdfs://master:9000</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/home/hadoop/tmp</value>
</property>

设置namenode节点的IP和端口

设置hadoop.tmp.dir路径，默认是/tmp/$username，重启就会删除该目录的文件，所以这里给他配置一个自定义的路径

3.修改hdfs-site.xml文件

<property>
<name>dfs.data.dir</name>
<value>/home/hadoop/hadoop-data</value>
</property>
<property>
<name>dfs.name.dir</name>
<value>/home/hadoop/hadoop-name</value>
</property>
<property>
<name>fs.checkpoint.dir</name>
<value>/home/hadoop/hadoop-namesecondary</value>
</property>
<property>
<name>dfs.replication</name>
<value>3</value>
</property>

设置hdfs文件系统

4.修改mapred-site.xml文件

<property>
<name>mapred.job.tracker</name>
<value>master:9001</value>
</property>

设置jobtracker的ip和端口

以上xml文件的配置都只是在源文件的基础上添加对应的property节点即可

输入命令

hadoop namenode -format

开始格式化namenode

注意看提示格式化是否成功

在输入命令

start-all.sh

启动hadoop集群

启动完成后

输入命令jps

可以看到5个java进程

分别是

NameNode

SecondaryNameNode

JobTracker

TaskTracker

DataNode

伪分布式安装启动完成

微信关注我们

原文链接：https://yq.aliyun.com/articles/667841

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

如何正确在IDEA 里非maven或非SBT构建的项目中引入lib的jar包（图文详解）

以下是我，手动的一个项目假设，大家，还需要导入导入spark的jar包：是安装主目录下的jars所有jar包和examples/jars包。本文转自大数据躺过的坑博客园博客，原文链接：http://www.cnblogs.com/zlslch/p/7447529.html，如需转载请自行联系原作者

633

完全分布式安装hadoop

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/qq1010885678/article/details/43499577 以三个节点为例的服务器集群来安装和配置hadoop 以下是各服务器ip地址和对应所做的节点 192.168.61.128 master 192.168.61.129 slave1 192.168.61.133 slave2 首先修改每个服务器上的hosts文件使用命令 vi /etc/hosts编辑在最后追加 192.168.61.128 master 192.168.61.129 slave1 192.168.61.133 slave2 三行为每个服务器创建hadoop账户在root用户下，使用命令 useradd hadoop passwd hadoop 输入两遍新密码完成为每个服务器安装jdk jdk文件版本为jdk-7u45-linux-i586.rpm 可以在官网上下载各个版本的linux jdk文件使用命令 rpm -ivh jdk-7u45-linux-i586.rpm 进行安装安装完成...

587

资源下载

更多资源

Oracle Database，又名Oracle RDBMS

Oracle Database，又名Oracle RDBMS，或简称Oracle。是甲骨文公司的一款关系数据库管理系统。它是在数据库领域一直处于领先地位的产品。可以说Oracle数据库系统是目前世界上流行的关系数据库管理系统，系统可移植性好、使用方便、功能强，适用于各类大、中、小、微机环境。它是一种高效率、可靠性好的、适应高吞吐量的数据库方案。

Apache Tomcat7、8、9（Java Web服务器）

Tomcat是Apache 软件基金会（Apache Software Foundation）的Jakarta 项目中的一个核心项目，由Apache、Sun 和其他一些公司及个人共同开发而成。因为Tomcat 技术先进、性能稳定，而且免费，因而深受Java 爱好者的喜爱并得到了部分软件开发商的认可，成为目前比较流行的Web 应用服务器。

Java Development Kit(Java开发工具)

JDK是 Java 语言的软件开发工具包，主要用于移动设备、嵌入式设备上的java应用程序。JDK是整个java开发的核心，它包含了JAVA的运行环境（JVM+Java系统类库）和JAVA工具。

Sublime Text 一个代码编辑器

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。