《Hadoop技术详解》一第1章 简介
本节书摘来异步社区《Hadoop技术详解》一书中的第1章,第1.1节,作者: 【美】Eric Sammer 译者: 刘敏 , 麦耀锋 , 李冀蕾 , 等,更多章节内容可以访问云栖社区“异步社区”公众号查看。 第1章 简介 Hadoop技术详解在过去的几年里,数据的存储、管理和处理发生了巨大的变化。各个公司存储的数据比以前更多,数据来源更加多样,数据格式也更加丰富。这不是因为我们变成了林鼠(译注:林鼠喜欢收集各种物品),而是因为我们想要创造出可以让我们进一步了解某一领域的产品、功能以及对其智能预测(这个领域可以是指用户、数据搜索、机器日志或者是某机构的任何信息)。为了更好地服务其成员,各组织正在寻找新的方式来使用那些曾经被认为没有什么价值或者存储起来过于昂贵的数据。采集和存储数据只是其中的一部分工作,但现在处理这些数据并从中挖掘有用信息已经成为每一个现代商业组织日常运营中的重要工作。 数据的存储、处理存在困难,并不是个新问题。在近几十年里,商业金融机构防欺诈、运营机构发现异常、广告组织做人口统计分析……很多类似的情况下,我们都不得不存储处理大量的数据。但是近来,数据的容量、处理的速度、数...