《循序渐进学Spark》一3.6　Shuffle机制-低调大师

《循序渐进学Spark》一3.6　Shuffle机制

2017-05-01 650

本节书摘来自华章出版社《循序渐进学Spark》一书中的第3章，第3.6节，作者小象学院　杨　磊，更多章节内容可以访问云栖社区“华章计算机”公众号查看。

3.6　Shuffle机制

在MapReduce框架中，Shuffle是连接Map和Reduce之间的桥梁，Map的输出要用到Reduce中必须经过Shuffle这个环节，Shuffle的性能高低直接影响了整个程序的性能和吞吐量。Spark作为MapReduce框架的一种实现，自然也实现了Shuffle的逻辑。对于大数据计算框架而言，Shuffle阶段的效率是决定性能好坏的关键因素之一。

3.6.1　什么是Shuffle

Shuffle是MapReduce框架中的一个特定的阶段，介于Map阶段和Reduce阶段之间，当Map的输出结果要被Reduce使用时，输出结果需要按关键字值（ke

微信关注我们

原文链接：https://yq.aliyun.com/articles/87670

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

《大数据系统构建：可扩展实时数据系统构建原理与最佳实践》一 1.3　NoSQL不是万能的

本节书摘来自华章出版社《大数据系统构建：可扩展实时数据系统构建原理与最佳实践》一书中的第1章，第1.1节，南森·马茨（Nathan Marz） [美]　詹姆斯·沃伦（JamesWarren）　著马延辉　向　磊　魏东琦　译，更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.3　NoSQL不是万能的过去的十年，可扩展数据系统已经取得了大量的创新，其中包括如Hadoop这样的大规模计算系统，如Cassandra和Riak这样的数据库。这些系统可以处理大量的数据，但是需要认真的权衡。比如Hadoop可以在非常大量的数据上并行化大规模批量计算，但计算具有较高的延迟。对于任何需要低延迟结果的计算，Hadoop是不适用的。又如Cassandra这样的NoSQL数据库，通过提供一个比SQL中使用得更有限的数据模型，来实现可扩展性。压

2017-05-01

653

本节书摘来自华章出版社《循序渐进学Spark》一书中的第3章，第3.7节，作者小象学院　杨　磊，更多章节内容可以访问云栖社区“华章计算机”公众号查看。 3.7　本章小结本章主要讲述了Spark的工作机制与原理。首先剖析了Spark的提交和执行时的具体机制，重点强调了Spark程序的宏观执行过程：提交后的Job在Spark中形成了RDD DAG（有向无环图），然后进入一系列切分调度的过程。在剖析过程中，结合Spark的源码呈现了这些调度过程的代码细节。本章后半部分接着剖析了Spark的存储及IO、Spark通信机制，最后讲述了Spark的容错机制及Shuffle机制。本章内容比较多，希望读者仔细体会。

2017-05-01

650

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。