《深入理解大数据:大数据处理与编程实践》一一3.5 HDFS基本编程接口与示例
本节书摘来自华章计算机《深入理解大数据:大数据处理与编程实践》一书中的第3章,第3.5节,作者 主 编:黄宜华(南京大学)副主编:苗凯翔(英特尔公司),更多章节内容可以访问云栖社区“华章计算机”公众号查看。
3.5 HDFS基本编程接口与示例
除了上一节提到的命令之外,Hadoop提供了可用于读写、操作文件的API,这样可以让程序员通过编程实现自己的HDFS文件操作。
Hadoop提供的大部分文件操作API都位于org.apache.hadoop.fs这个包中。基本的文件操作包括打开、读取、写入、关闭等。为了保证能跨文件系统交换数据,Hadoop的API也可以对部分非HDFS的文件系统提供支持;也就是说,用这些API来操作本地文件系统的文件也是可行的。
3.5.1 HDFS编程基础知识
在Hadoop中,基本上所有的文件API都来自File