《Hadoop实战手册》一1.7 从HDFS导出数据到MongoDB
本节书摘来异步社区《Hadoop实战手册》一书中的第1章,第1.7节,作者: 【美】Jonathan R. Owens , Jon Lentz , Brian Femiano 译者: 傅杰 , 赵磊 , 卢学裕 责编: 杨海玲,更多章节内容可以访问云栖社区“异步社区”公众号查看。 1.7 从HDFS导出数据到MongoDB 本节将使用MongoOutputFormat类加载HDFS中的数据并收集到MongoDB中。 准备工作使用Mongo Hadoop适配器最简单的方法是从GitHub上克隆 Mongo-Hadoop工程,并且将该工程编译到一个特定的Hadoop版本。克隆该工程需要安装一个Git客户端。 本节假定你使用的Hadoop版本是CDH3。 Git客户端官方的下载地址是:http://git-scm.com/downloads。 在Windows操作系统上可以通过http://windows.github.com/访问GitHub。 在Mac操作系统上可以通过http://mac.github.com/访问GitHub。 可以通过https://github.com/mongo...