Hadoop概念学习系列之大数据、Hadoop和云计算(十三)
我们知道,Hadoop最擅长的事情就是可以高效地处理海量规模的数据,这样Hadoop就和大数据及云计算结下了不解之缘。讲解Hadoop、大数据以及云计算之间的关系,使你从大数据和云计算的角度来认识Hadoop。 大数据一般是指这样的数据:数据量巨大,需要运用新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。大数据可分成大数据技术、大数据工程、大数据科学和大数据应用等领域。目前人们谈论最多的是大数据技术和大数据应用,大数据工程和大数据科学尚未被重视。大数据工程指大数据的规划建设及其运营管理的系统工程;大数据科学关注的是大数据网络发展和运营过程中发现和验证大数据的规律及其与自然和社会活动之间的关系。 大数据的特征有四个层面: 第一、数据量巨大。从TB级别,跃升到PB级别; 第二、数据类型繁多。包括网络fl志、视频、图片、地理位置信息等; 第三,价值密度低。商业价值高,以视频为例.在连续不间断的监控过程中,可能有用的数据仅仅只有一两秒; 第四、处理速度快。最后这一点也和传统的数据挖掘技术有着本质的不同。业界将其归纳为4V —— Volume、Vari...
