《Spark大数据处理：技术、应用与性能优化》——第3章 Spark计算模型3.1　Spark程序模型-低调大师

《Spark大数据处理：技术、应用与性能优化》——第3章 Spark计算模型3.1　Spark程序模型

2017-07-02 639

本节书摘来自华章计算机《Spark大数据处理：技术、应用与性能优化》一书中的第3章，第3.1节,作者:高彦杰更多章节内容可以访问云栖社区“华章计算机”公众号查看。

第3章 Spark计算模型

创新都是站在巨人的肩膀上产生的，在大数据领域也不例外。微软的Dryad使用DAG执行模式、子任务自由组合的范型。该范型虽稍显复杂，但较为灵活。Pig也针对大关系表的处理提出了很多有创意的处理方式，如flatten、cogroup。经典虽难以突破，但作为后继者的Spark借鉴经典范式并进行创新。经过实践检验，Spark的编程范型在处理大数据时显得简单有效。的数据处理与传输模式也大获全胜。
Spark站在巨人的肩膀上，依靠Scala强有力的函数式编程、Actor通信模式、闭包、容器、泛型，借助统一资源分配调度框架Mesos，融合了MapReduce和

微信关注我们

原文链接：https://yq.aliyun.com/articles/120261

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

《Spark大数据处理：技术、应用与性能优化》——2.3　本章小结

本节书摘来自华章计算机《Spark大数据处理：技术、应用与性能优化》一书中的第2章，第2.3节,作者:高彦杰更多章节内容可以访问云栖社区“华章计算机”公众号查看。 2.3　本章小结本章主要介绍了如何在Linux和Windows环境下安装部署Spark集群。由于Spark主要使用HDFS充当持久化层，所以完整地使用Spark需要预先安装Hadoop。通过本章介绍，读者就可以开启Spark的实战之旅了。下一章将介绍Spark的计算模型，Spark将分布式的内存数据抽象为弹性分布式数据集（RDD），并在其上实现了丰富的算子，从而对RDD进行计算，最后将算子序列转化为有向无环图进行执行和调度。

2017-07-02

619

在当今的数据架构中，治理已成为一个关键的组成部分。没有它，公司可能会失去有意义的商业智能。当STEVE CRETNEY仔细查看存储数量时，他从中发现了颠覆Colony BrandsIT战略的细节。 “我们观察到，在我们的SAN(存储区域网络)中，有几百TB的存储，”Colony Brands公司的CIO Cretney说，该直销零售商位于威斯康星州门罗。其中的大部分，来源于操作系统，一部分会用于分析，但大多数则打包，成了闲置数据。相比之下，Colony Brand的数据仓库内只包含10到15 TB的数据，用于特定的业务分析和报告。两者之间的差异让Cretney和他的团队思考：如果数据科学团队能够获取SAN里的数据，会有什么发现呢？ Cretney，3年前加入Colony Brands，就一直深信云计算。为了能够利用闲置数据，并推动公司向云方向发展，他选择了Amazon S3云存储服务，以及Amazon Redshift数据仓库。他的计划中，第一阶段将在4月完成，不仅是将公司的数据仓库功能迁移到云，还要使用数据湖开发公司数据。数据湖，或数据中心，是一种在不牺牲数据结构的情况下， ...

2017-07-02

599

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。