hadoop介绍
以下内容是我的学习笔记,网络课程的笔记。出处 Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。 HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求,可以以流的形式访问(streaming access)文件系统中的数据。 介绍hadoop就是需要先了解hadoop的使用场景,先熟悉一下下面的概念: 什么是大数据 基本概念 简单说就是 数据处理 在互联网技术发展到现今阶段,大量日常、工作等事务产生的数据都已经信息化, 人类产生的数据量相比以前有了爆炸式的增长, 以前的传统的数据处理技术已经无法胜任,需求催生技术,一套用来处理海量数据的软件工具应运而生,这就是大数据! 处理海量数据的核心技术 * 海量数据存储:分布式 海量数据运算:分布式 这些核心技术的实现是不需要用户从零开始造轮子的 存储和运算,都已经有大量的成...