Hadoop The First Day!!!
Hadoop :内部工作机制非常复杂,是一个集分布式系统理论、实际工程理论和常识于一体的系统。提供用于构建分布式系统的每一个工具(用于数据存储、数据分析和协调处理)都非常简单。这些工具都非常抽象,对偶尔有大量数据需要存储的程序员、有大量数据需要分析的额程序员、有大量计算机需要管理的程序员等时期利用Hadoop构建基础平台,满足需要。 我特么才发现,需要点java基础,如果要看Hadoop的话。学前篇:2006年数字世界(digital universe)项目统计的出全球数据总量为0.18ZB并预测在2011年将达到1.8ZB。 小姿势:1ZB=10^21字节=1000EB(exabytes) 1 000 000 PB = 10亿TB(terrabytes) 数据来源可能为2007年纽约证交所曾有段时间统计数据:一天交易数据多达1TBFaceBook 存储的照片至少100亿张,存储容量约为1PBAncestry.com存储的数据约为2.5PB互联网档案馆(The Internet Archive)存储的数据量约为2PB,并以每月至少20TB的速度持续增长瑞士日内瓦附近的大型强子对撞机每年...