《Hadoop技术详解》一2.5 管理文件系统元数据
本节书摘来异步社区《Hadoop技术详解》一书中的第2章,第2.5节,作者: 【美】Eric Sammer 译者: 刘敏 , 麦耀锋 , 李冀蕾 , 等,更多章节内容可以访问云栖社区“异步社区”公众号查看。 2.5 管理文件系统元数据 NameNode将文件系统的元数据以不同的文件保存在本地磁盘中,其中最重要的两个文件是fsimage和edits。和数据库一样,fsimage包含文件系统元数据的完整快照,而edits仅包含元数据的增量修改。对高吞吐率的数据存储而言,一个常用方法是使用预写日志(WAL),如edits文件,实现顺序增加操作来减少I/O操作(在NameNode中,所有操作都在RAM中完成),从而避免高消耗的查找操作,获取更好的整体性能。NameNode启动后,直接加载fsimage到RAM,再通过回放引入edits的增量变化,最终在内存中建立拥有最新信息的文件系统视图。 在Hadoop较新的几个版本中(具体地说,就是Apache Hadoop 2.0和CDH4;有关Hadoop更多版本信息,请参见4.1节“挑选Hadoop的发行版本”),底层元数据的存储拥有更好的可恢复性和...