深入理解Spark：核心思想与源码分析. 3.3　创建metadataCleaner-低调大师

深入理解Spark：核心思想与源码分析. 3.3　创建metadataCleaner

2017-05-01 633

3.3　创建metadataCleaner

SparkContext为了保持对所有持久化的RDD的跟踪，使用类型是TimeStamped-WeakValueHashMap的persistentRdds缓存。metadataCleaner的功能是清除过期的持久化RDD。创建metadataCleaner的代码如下。

private[spark] val persistentRdds = new TimeStampedWeakValueHashMap[Int, RDD[_]]

private[spark] val metadataCleaner =

new MetadataCleaner(MetadataCleanerType.SPARK_CONTEXT, this.cleanup, conf)

我们仔细看看MetadataCleane

微信关注我们

原文链接：https://yq.aliyun.com/articles/82167

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

《MapReduce设计模式》一1.5　Pig和Hive

本节书摘来异步社区《MapReduce设计模式》一书中的第1章，第1.5节，作者：【美】Donald Miner , Adam Shook 译者：徐钊 , 赵重庆责编：杨海玲，更多章节内容可以访问云栖社区“异步社区”公众号查看。 1.5　Pig和Hive 在Hadoop生态系统中有了Hive和Pig这类工具，对MapReduce设计模式没有太强烈的需求。但我们还是想借本书的开始部分解释为什么MapReduce设计模式依然如此重要。 Pig和Hive是对MapReduce更高层次的抽象。虽然它们提供的接口与“map”和“reduce”无关，但实际上它们会将较高级的语言翻译成一组MapReduce作业。就像关系型数据库管理系统（RDBMS）中的查询计划器（query planner）会将SQL语句解析成对数据的实际操作一样，Hive和Pig也是将它们各自的语言翻译成MapReduce操作。在本书相关章节中可以看到，相对于用Java写的原生Hadoop实现，使用Pig和SQL（或HiveQL）将更为简洁。例如，用Java实现一个全排序，可能要写上几页代码，但用Pig只需要几行。既...

2017-05-02

645

本节书摘来自华章社区《深入理解Spark:核心思想与源码分析》一书中的第1章环境准备，作者耿嘉安，更多章节内容可以访问云栖社区“华章社区”公众号查看第1章环境准备凡事豫则立，不豫则废；言前定，则不跲；事前定，则不困。—《礼记·中庸》本章导读在深入了解一个系统的原理、实现细节之前，应当先准备好它的源码编译环境、运行环境。如果能在实际环境安装和运行Spark，显然能够提升读者对于Spark的一些感受，对系统能有个大体的印象，有经验的技术人员甚至能够猜出一些Spark采用的编程模型、部署模式等。当你通过一些途径知道了系统的原理之后，难道不会问问自己：“这是怎么做到的？”如果只是游走于系统使用、原理了解的层面，是永远不可能真正理解整个系统的。很多IDE本身带有调试的功能，每当你阅读源码，陷入重围时，调试能让我们更加理解运行期的系统。

2017-05-02

612

资源下载

更多资源

优质分享App

近一个月的开发和优化，本站点的第一个app全新上线。该app采用极致压缩，本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。