《智能数据时代:企业大数据战略与实战》一1.5 大数据环境下的处理分析工具
.本节书摘来自华章出版社《智能数据时代:企业大数据战略与实战》一书中的第1章,第1.5节,作者 TalkingData ,更多章节内容可以访问云栖社区“华章计算机”公众号查看
1.5 大数据环境下的处理分析工具
- Apache Hadoop
Apache Hadoop(包括基于它的各种包装,以下通称Hadoop)是一种开源工具,它提供了处理大数据的新平台。虽然Hadoop已经存在一段时间了,但是越来越多的企业才刚刚开始利用其功能。Hadoop平台旨在解决大量数据造成的问题,特别是包含复杂结构化数据和非结构化数据的混合数据,这些数据不适合放在表中。Hadoop在需要深度分析和计算量大(如集群和定位)的情况下运行良好。
对于寻求利用大数据的决策者而言,Hadoop解决了与大数据相关的最常见的问题:以高效的方式存储和访问大量数据。
Hadoop的内