《Hadoop MapReduce实战手册》一2.8 使用HDFS的Java API
本节书摘来异步社区《Hadoop MapReduce实战手册》一书中的第2章,第2.8节,作者: 【美】Srinath Perera , Thilina Gunarathne 译者: 杨卓荦 责编: 杨海玲,更多章节内容可以访问云栖社区“异步社区”公众号查看。 2.8 使用HDFS的Java API Hadoop MapReduce实战手册HDFS Java API可用于任何Java程序与HDFS交互。该API使我们能够从其他Java程序中利用到存储在HDFS中的数据,也能够使用其他非Hadoop的计算框架处理该数据。有时,可能也会遇到要直接从MapReduce应用程序中访问HDFS的用例。但是,如果你是在HDFS中直接通过map或reduce任务写入或修改文件,那么你要知道,这样做实际上违反了MapReduce构架的无副作用的本质,可能会导致某些用例出现数据一致性问题。 准备工作设置HADOOP_HOME环境变量指向Hadoop的安装根目录。 操作步骤下列步骤显示了如何使用HDFS的Java API来对HDFS集群使用Java程序执行文件系统操作。 下面的示例程序会在HDFS中创建一...