一图以蔽之:Hadoop在大数据企业应用中的崛起
对于试图分类和整理大数据科技,特别是 Hadoop的那些企业,这是一个振奋人心的全新信息图。这个对Hadoop的分析,也许能帮助公司的决策领导者更好地了解该技术平台。
Apache Hadoop是2005 年(由Apache Software Foundation)开发的开源软件框架,特别为大数据和大规模数据处理量身定制。它包含四个主要模块:
1. Hadoop Common: 包含其它Hadoop模块所需的所有库和功能。
2. Hadoop 分布式文件系统(Distributed File System),简称HDFS。它是一个文档储存系统,能够在数据集群间提供高带宽。
3. Hadoop Yarn: 管理计算机集群中计算资源的平台,并利用这些资源做应用调度。
4. Hadoop MapReduce:处理大规模数据