《深入理解大数据:大数据处理与编程实践》一一1.3 MapReduce并行计算技术简介
本节书摘来自华章计算机《深入理解大数据:大数据处理与编程实践》一书中的第1章,第1.3节,作者 主 编:黄宜华(南京大学)副主编:苗凯翔(英特尔公司),更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1.3 MapReduce并行计算技术简介
1.3.1 MapReduce的基本概念和由来
1.?什么是MapReduce
MapReduce是面向大数据并行处理的计算模型、框架和平台,它隐含了以下三层含义:
1)MapReduce是一个基于集群的高性能并行计算平台(Cluster Infrastructure)。它允许用市场上普通的商用服务器构成一个包含数十、数百至数千个节点的分布和并行计算集群。
2)MapReduce是一个并行计算与运行软件框架(Software Framework)。它提供了一个庞大但设计精良的并行计算软件框架,能