What is Apache Hadoop?
本文来自:自译+百度Apache Hadoop 是一款可靠、可升级、分布式计算的开源软件。Apache Hadoop 的开源软件库是专门为处理跨大数据簇而设计的处理模型族。它主要被设计用来按比例从一个到成千上万的无服务平均的分配计算任务和内存。而不是依靠硬件提供高可用性,库本身的目的是检测和处理应用层的故障,因此再一组计算机上提供高可用性服务,每一台计算机都容易出现故障。这个项目包括这些模型:Hadoop Common:支持其它Hadoop模块的通用实用程序。 Hadoop Distributed File System(HDFS):提供对应用程序数据的高通量访问的分布式文件系统。Hadoop YARN:作业调度与集群资源管理框架。 Hadoop MapReduce:基于线性的大数据量并行处理系统。Apache 中的其它与Hadoop相关的项目包括:Ambari:一个基于网络的工具、配置、管理、监控Apache的Hadoop集群包括Hadoop HDFSHiveHCatalogHBaseZooKeeperOoziePig and Sqoop.Ambari还提供了一个仪表板查看集群健康如...