《Hadoop海量数据处理:技术详解与项目实战(第2版)》一2.6 安装Sqoop
本节书摘来异步社区《Hadoop海量数据处理:技术详解与项目实战(第2版)》一书中的第2章,第2.6节,作者: 范东来 责编: 杨海玲,更多章节内容可以访问云栖社区“异步社区”公众号查看。 2.6 安装Sqoop Sqoop是一个开源工具,它允许用户将数据从关系型数据库抽取到Hadoop中,用于进一步的处理。抽取出的数据可以被MapReduce作业使用,也可以被其他类似于Hive的工具使用。一旦形成分析结果,Sqoop便可以将这些结果导回数据库,供其他客户端使用。 Sqoop的版本同样选择CDH5,完整的版本号为sqoop-1.4.5-cdh5.6.0,安装Sqoop的步骤非常简单,主要就是修改配置文件,并且Sqoop和Hive作为Hadoop的客户端,也只有一种运行方式,Sqoop可以被安装至集群任意一个节点(以主节点为例)。 将Sqoop安装包上传到/opt文件夹下,执行命令(hadoop用户,主节点执行): tar -zxvf /opt/sqoop-1.4.5-cdh5.6.0.tar.gz Sqoop的配置文件同样存放在/opt/sqoop-1.4.5-cdh5.6.0/con...