hadoop from rookie to ninja - 1. Basic Architecture(基础架构)
1. Daemons(守护进程)
新老架构
老的:
主要是描述数据属性(property)的信息,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能。)
2-3) 由于在内存中存储元数据信息,因此名称节点后台进程也同时在硬盘上存储了一个用来持久化元数据的检查点文件,该文件名叫fsimage。
每当集群中的文件发生 新增/删除/更新 操作的时候,动作信息会被更新到一个叫做edits log的日志文件中。
a. Hadoop 1.x里的名称节点是单节点的,因此,如果该服务器宕机了的话,整个HDFS文件系统将不可使用了。
为了解决这种情况,以前管理员需要配置下,把fsimage同时写到本地磁盘和网络上的远程磁盘。
那台新备份的机器其实相当于冷备份,在名称节点宕机的时候可以临时启动。
b. Hadoop 2.x支持高可用(High Availability - HA)
部署2台名称节点的服务器, 分别是active和passive, 如果active的那台服务器宕机了, passive的那台服务器会接管
控制权,相当于双机热备份。
3. Secondary namenode(第二名称节点)