Hadoop深入浅出,Hadoop的部署
Doc By xvGe Hadoop深入浅出-001 什么是Hadoop? The Apache Hadoop project develops open-source software for reliable,scalable,distributed,computing. Hadoop解决的问题: --海量数据存储 --海量数据分析 --资源管理调度 作者:Doug Cutting ********************************* (1)hadoop核心组件及文件系统概念: ********************************* 版本: Apache:官方版本。 Cloudera:稳定,有商业支持,推荐使用。 HDP:Hortonworks公司的发行版 Hadoop核心: --HDFS:分布式文件系统 --YARN:资源管理调度系统 --MapReduce:分布式运算框架 ******************************** (2)hdfs的实现机制和文件系统概念: ******************************** 1.容量...