hadoop 各种概念整理
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/xmt1139057136/article/details/82717144 Hadoop Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。 HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求,可以以流的形式访问(streaming access)文件系统中的数据。 Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,则MapReduce为海量的数据提供了计算。 Hadoop解决哪些问题? 海量数据需要及时分析和处理 海量数据需要深入分析和挖掘 数据需要长期保存 海量数据存储的问题: 磁盘IO称为一种瓶颈,而非CPU资源 网络带宽是一种稀缺资源 硬件故障成为影响稳定的一...


