Hadoop大象之旅006-安装Hadoop环境
Hadoop大象之旅006-安装Hadoop环境
老帅
我们的硬件电脑上跑的是Windows7x64,并且在Windows7安装好了VMWare10虚拟机,VMWare中也安装配置了CentOS6.5操作系统,CentOS中也已经安装配置了jdk1.6.0_45,并也准备好了连接CentOS的工具软件SecureCrSecureFx。
万事具备,应该安装Hadoop了,但是Hadoop有很多版本,我们怎么选择呢?
从这里我们可以看出,hadoop-1.1.X 对 hbase0.94 和 hbase0.96是支持的,所以,我们这里选择 hadoop1.1.X 的目前最高版本(2014-4-10),也就是hadoop-1.1.2.tar.gz,这个文件可以在下面我提供的地址下载到:
官方地址:http://archive.apache.org/dist/hadoop/core/hadoop-1.1.2/
1.将Hadoop文件上传到CentOS中
参照前面章节中所述方法,使用SecureFXPortable.exe在CentOS中建立/usr/local文件夹,将hadoop-1.1.2.tar.gz上传到/usr/local中
2.安装Hadoop
参照前面章节中所述方法,使用SecureCRTPortable.exe登录CentOS,进入到/usr/local目录下。
使用命令“tar -xzvf hadoop-1.1.2.tar.gz”解压hadoop-1.1.2.tar.gz
解压缩完成后,我们使用命令“ls”查看到新产生的目录hadoop-1.1.2
使用命令“mv hadoop-1.1.2 hadoop”重命名文件夹名,目的是方便以后引用
3.配置Hadoop环境变量
接下来把Hadoop配置到环境变量中。
使用命令“vi/etc/profile”编辑配置文件
使用快捷键“i”进入文件编辑模式,文件最后增加以下内容。
export JAVA_HOME=/usr/local/jdk
export HADOOP_HOME=/usr/local/hadoop
export PATH=.:$HADOOP_HOME/bin:$JAVA_HOME/bin:$PATH
使用快捷键“esc”退出文件编辑模式,使用“Shift”和“:”组合键进入命令模式,输入命令“wq”保存并退出。
这里解释一下:“export”是关键字,用于设置环境变量。我们设置了两个环境变量,一个是 HADOOP_HOME,
一个是 PATH。对于环境变量的引用,使用“$”,多个环境变量之间的连接,使用“:”。
使用命令“source /etc/profile”使上面的配置立即生效
使用命令“hadoop version”检测hadoop是否配置成功! 看到如下提示,恭喜,配置成功了~!~

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Hadoop大象之旅005-安装JDK环境
Hadoop大象之旅005-安装JDK环境 老帅 由于Hadoop 需要运行在JAVA平台,所以我们还需要在CentOS中安装java的环境,在这里,我们选择java的版本是jdk-6u45-linux-i586.bin; 1.将JDK文件上传到CentOS中 参照前面章节中所述方法,使用SecureFXPortable.exe在CentOS中建立/usr/local文件夹,将jdk-6u45-linux-i586.bin上传到/usr/local中 2.安装JDK 参照前面章节中所述方法,使用SecureCRTPortable.exe登录CentOS,进入到/usr/local目录下。 使用命令“./jdk-6u45-linux-i586.bin”解压安装jdk, 如果不能执行,先使用命令“chmod 755 jdk-6u45-linux-i586.bin”赋予当前用户执行该文件的权限 解压缩完成后,我们使用命令“ls”查看到新产生的目录jdk1.6.0_45 使用命令“mvjdk1.6.0_45/ jdk”重命名文件夹名,目的是方便以后引用 3.配置JDK环境变量 接下来把j...
- 下一篇
Hadoop大象之旅007-配置Hadoop伪分布模式
Hadoop大象之旅007-配置Hadoop伪分布模式 老帅 安装hadoop分为本地模式、伪分布模式、集群模式。本地模式是运行在本地,只负责存储,没有计算功能。伪分布模式是在一台机器上模拟分布式部署,方便学习和调试。集群模式是在多个机器上配置hadoop,是真正的“分布式”。 伪分布模式是在一台单机上运行,但用不同的 Java 进程模仿分布式运行中的各类结点 ( NameNode, DataNode, JobTracker, TaskTracker, SecondaryNameNode )。 分布式运行中的这几个结点的区别:从分布式存储的角度来说,集群中的结点由一个 NameNode 和若干个 DataNode 组成, 另有一个Secondary NameNode 作为NameNode 的备份。从分布式应用的角度来说,集群中的结点由一个JobTracker 和若干个 TaskTracker 组成,JobTracker 负责任务的调度,TaskTracker 负责并行执行任务。TaskTracker 必须运行在 DataNode 上,这样便于数据的本地计算。JobTracker...
相关文章
文章评论
共有0条评论来说两句吧...