《Spark大数据处理:技术、应用与性能优化》——第3章 Spark计算模型3.1 Spark程序模型
本节书摘来自华章计算机《Spark大数据处理:技术、应用与性能优化》一书中的第3章,第3.1节,作者:高彦杰 更多章节内容可以访问云栖社区“华章计算机”公众号查看。
第3章 Spark计算模型
创新都是站在巨人的肩膀上产生的,在大数据领域也不例外。微软的Dryad使用DAG执行模式、子任务自由组合的范型。该范型虽稍显复杂,但较为灵活。Pig也针对大关系表的处理提出了很多有创意的处理方式,如flatten、cogroup。经典虽难以突破,但作为后继者的Spark借鉴经典范式并进行创新。经过实践检验,Spark的编程范型在处理大数据时显得简单有效。的数据处理与传输模式也大获全胜。
Spark站在巨人的肩膀上,依靠Scala强有力的函数式编程、Actor通信模式、闭包、容器、泛型,借助统一资源分配调度框架Mesos,融合了MapReduce和