hadoop 安装配置启动

2016-07-17 657 89

1. Ubuntu12.04基本设置

1) 设置与Windows共享(通过hgfs)
2) 设置root密码
sudo passwd root
3) 设置root登录
vim /etc/lightdm/lightdm.conf
在最后添加一行：greeter-show-manual-login=true
3) #adduser test
#passwd test
#mkdir -p /home/test
4) 查看我是谁
whoami

2. 安装组件

$ sudo apt-get install ssh
$ sudo apt-get install rsync

3. 下载解压JDK (1.7)至/opt目录下

4. 下载解压Hadoop (2.6.4)/opt目录下

5. 增加JDK和Hadoop Path到/root/.bashrc和当用户的~/.bashrc中

[html]view plain copy 
   
 
 export JAVA_HOME=/opt/jdk1.7.0_79   
 export HADOOP_HOME=/opt/hadoop-2.6.4   
 export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin   
    
 # improve Could not resolve hostname library: Name or service not known   
 export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native   
 export HADOOP_OPTS="-Djava.library.path=$HADOOP_HOME/lib/native"   

如果把HADOOP_OPTS配置为：

[html]view plain copy 
   
 HADOOP_OPTS="-Djava.library.path=$HADOOP_HOME/lib"

则会出现如下错误：

[html]view plain copy 
   
 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable

6. hadoop_env.sh (JAVA_HOME, HADOOP_PREFIX)

[html]view plain copy 
   
 
 # set to the root of your Java installation   
 export JAVA_HOME=/opt/jdk1.7.0_79   
    
 # Assuming your installation directory is /opt/hadoop-2.6.4   
 export HADOOP_PREFIX=/opt/hadoop-2.6.4   

注：以上安装都以root用户执行

7. 实例测试

7.1 单机模式

（不需要做任何配置，但不启动任何dfs和mapreduce daemon进程）
计算在这些.xml文件中总共有多少个configuration
~$ mkdir input
~$ cp /opt/hadoop-2.6.4/etc/hadoop/*.xml input
~$ hadoop jar /opt/hadoop-2.6.4/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.4.jar grep input output 'configuration'

~$ cat output/*

查看debug信息（即代码中LOG.debug打印的信息）：

test@ubuntu:~/hadoop$ export HADOOP_ROOT_LOGGER=DEBUG,console
test@ubuntu:~/hadoop$ hadoop fs -text /test/data/origz/access.log.gz

7.2 伪分布式模式

7.2.1 配置环境

1）etc/hadoop/core-site.xml:

[html]view plain copy 
   
 
 <configuration>   
        
     <!-- set the host of namenode residing -->      
     <property>   
         <name>fs.defaultFS</name>   
         <value>hdfs://localhost:9000</value>   
     </property>   
        
        
     <!-- set the position of dfs directory  -->   
     <property>   
         <name>hadoop.tmp.dir</name>   
         <value>/home/test/hadoop/tmp</value>    
     </property>   
 </configuration>   

2）etc/hadoop/hdfs-site.xml:

[html]view plain copy 
   
 
 <configuration>   
     <property>   
         <name>dfs.replication</name>   
         <value>1</value>   
     </property>   
 </configuration>   

3）ssh免密码登录
~$ssh-keygen (一直默认回车)
~$cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
~$ssh localhost (应该无密码)

7.2.2 在本地运行MapReduce Job

1）格式化文件系统
$ hdfs namenode -format

生成的dfs文件夹位于：/home/test/hadoop/tmp

2）启动NameNode daemon和DataNode daemon
$ start-dfs.sh

hadoop daemon log输出目录为$HADOOP_LOG_DIR, 默认为$HADOOP_HOME/logs
给test用户授与/opt/hadoop-2.6.4权限
sudo chown -hR test /opt/hadoop-2.6.4

可通过jps查看到以下JVM进程：
11340 SecondaryNameNode
9927 NameNode
10142 DataNode

3) 通过Web界面来查看NameNode运行状况，默认为：
http://localhost:50070
http://192.168.4.91:50070

4）创建执行MapReduce Job需要的HDFS目录
$hdfs dfs -mkdir /user
$hdfs dfs -mkdir /user/<username>

error:mkdir: Cannot create directory /user. Name node is in safe mode.
solution:hdfs dfsadmin -safemode leave

5）把输入文件copy到分布式文件系统
$hdfs dfs -put /opt/hadoop-2.6.4/etc/hadoop input

6）运行例子程序
$hadoop jar /opt/hadoop-2.6.4/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.4.jar grep input output 'dfs[a-z.]+'

7）检查输出文件
把输出文件从分布式文件系统copy到本地文件系统，然后查看
$hdfs dfs -get output output
$cat output/*
或者
$hdfs dfs -cat output/*

8) 停止NameNode daemon和DataNode daemon
$stop-dfs.sh

7.2.3 在YARN上运行MapReduce Job

1) 配置环境
在【7.2.1 配置环境】的基础上增加如下配置
(1)etc/hadoop/mapred-site.xml:

[html]view plain copy 
   
 
 <configuration>   
     <property>   
         <name>mapreduce.framework.name</name>   
         <value>yarn</value>   
     </property>   
 </configuration>   

(2)etc/hadoop/yarn-site.xml:

[html]view plain copy 
   
 
 <configuration>   
     <property>   
         <name>yarn.nodemanager.aux-services</name>   
         <value>mapreduce_shuffle</value>   
     </property>   
 </configuration>   

2）格式化文件系统
$ hdfs namenode -format

生成的dfs文件夹位于：/home/test/hadoop/tmp

3）启动NameNode daemon和DataNode daemon
$ start-dfs.sh

hadoop daemon log输出目录为$HADOOP_LOG_DIR, 默认为$HADOOP_HOME/logs
给test用户授与/opt/hadoop-2.6.4权限
sudo chown -hR test /opt/hadoop-2.6.4

可通过jps查看到以下JVM进程：
11340 SecondaryNameNode
9927 NameNode
10142 DataNode

4) 通过Web界面来查看NameNode运行状况，默认为：
http://localhost:50070
http://192.168.4.91:50070

5）创建执行MapReduce Job需要的HDFS目录
$hdfs dfs -mkdir /user
$hdfs dfs -mkdir /user/<username>

6）启动ResourceManager daemon和NodeManager daemon
$start-yarn.sh

7) 通过Web界面来查看ResourceManager运行状况，默认为：
http://localhost:8088
http://192.168.4.91:8088

8）把输入文件copy到分布式文件系统
$hdfs dfs -put /opt/hadoop-2.6.4/etc/hadoop input

9）运行例子程序
$hadoop jar /opt/hadoop-2.6.4/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.4.jar grep input output 'dfs[a-z.]+'

10）检查输出文件
把输出文件从分布式文件系统copy到本地文件系统，然后查看
$hdfs dfs -get output output
$cat output/*
或者
$hdfs dfs -cat output/*

11）$stop-yarn.sh

12）$stop-dfs.sh

微信关注我们

原文链接：https://yq.aliyun.com/articles/70037

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

2016-07-18 00:00:00

hadoop eclipse 插件配置使用

第一次使用hadoop，另外eclipse也不太熟悉，现在把自己在安装过程中得琐碎问题记录下来。 eclipse版本：eclipse-jee-indigo-SR2-linux-gtk.tar.gz hadoop版本：hadoop-0.20.203.0 本文前提是，你已经正确安装了hadoop-0.20.203.0，hadoop伪分布模式的安装过程网上有很多。 eclipse下载解压后，直接点击eclipse图标打开即可(很绿色环保～～） 1.插件安装在$HADOOP_HOME/contrib/eclipse-plugin/文件夹中有个hadoop-eclipse-plugin-0.20.203.0.jar，把这个文件复制到eclipse/plugins（这是eclipse的插件目录）下面即可。注意在直接复制时会出错，主要是缺少jar包。解决方法：（1）将commons-httpclient-3.0.1.jar,jackson-core-asl-1.0.1.jar,jackson-mapper-asl-1.0.1.jar,commons-configuration-1.6.jar,...

767

2016-07-18 00:00:00

Spark的这些事<一>——Windows下spark开发环境搭建

一、首先准备需要安装的软件 scala-2.10.4 下载地址：http://www.scala-lang.org/download/2.10.4.html scala-SDK-4.4.1-vfinal-2.11-win32.win32.x86_64 下载地址：http://scala-ide.org/ spark-1.6.2-bin-hadoop2.6 下载地址：http://spark.apache.org/ 当然还有jdk这里就不说了 scala-2.10.4下载后直接安装~ scala-SDK-4.4.1-vfinal-2.11-win32.win32.x86_64和spark-1.6.2-bin-hadoop2.6下载后直接解压 scalaIDE解压后就是一个eclipse，这个大家都比较熟悉了。打开IDE，在解压后的spark包中的lib文件夹下找到spark-assembly-1.6.2-hadoop2.6.0，添加到IDE中。然后环境就搭建完成了~ 下面就来开发一个测试程序试一下： package com.day1.spark import org.apache.sp...

522

资源下载

更多资源

优质分享Android(本站安卓app)

近一个月的开发和优化，本站点的第一个app全新上线。该app采用极致压缩，本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Mario，低调大师唯一一个Java游戏作品

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Eclipse（集成开发环境）

Eclipse 是一个开放源代码的、基于Java的可扩展开发平台。就其本身而言，它只是一个框架和一组服务，用于通过插件组件构建开发环境。幸运的是，Eclipse 附带了一个标准的插件集，包括Java开发工具（Java Development Kit，JDK）。

Sublime Text 一个代码编辑器

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

hadoop 安装配置启动

1. Ubuntu12.04基本设置

2. 安装组件

3. 下载解压JDK (1.7)至/opt目录下

4. 下载解压Hadoop (2.6.4)/opt目录下

5. 增加JDK和Hadoop Path到/root/.bashrc和当用户的~/.bashrc中

6. hadoop_env.sh (JAVA_HOME, HADOOP_PREFIX)

7. 实例测试

7.1 单机模式

7.2 伪分布式模式

7.2.1 配置环境

7.2.2 在本地运行MapReduce Job

7.2.3 在YARN上运行MapReduce Job

hadoop eclipse 插件配置使用

Spark的这些事<一>——Windows下spark开发环境搭建

相关文章

发表评论

资源下载

优质分享Android(本站安卓app)

Mario，低调大师唯一一个Java游戏作品

Eclipse（集成开发环境）

Sublime Text 一个代码编辑器

欢迎您！

hadoop 安装配置启动

1. Ubuntu12.04基本设置

2. 安装组件

3. 下载解压JDK (1.7)至/opt目录下

4. 下载解压Hadoop (2.6.4)/opt目录下

5. 增加JDK和Hadoop Path到/root/.bashrc和当用户的~/.bashrc中

6. hadoop_env.sh (JAVA_HOME, HADOOP_PREFIX)

7. 实例测试

7.1 单机模式

7.2 伪分布式模式

7.2.1 配置环境

7.2.2 在本地运行MapReduce Job

7.2.3 在YARN上运行MapReduce Job

hadoop eclipse 插件配置使用

Spark的这些事&lt;一&gt;——Windows下spark开发环境搭建

相关文章

发表评论

资源下载

优质分享Android(本站安卓app)

Mario，低调大师唯一一个Java游戏作品

Eclipse（集成开发环境）

Sublime Text 一个代码编辑器

欢迎您！

Spark的这些事<一>——Windows下spark开发环境搭建