《Spark与Hadoop大数据分析》一一3.5　持久化与缓存-低调大师

《Spark与Hadoop大数据分析》一一3.5　持久化与缓存

2017-07-02 734

本节书摘来自华章计算机《Spark与Hadoop大数据分析》一书中的第3章，第3.5节,作者：文卡特·安卡姆（Venkat Ankam）更多章节内容可以访问云栖社区“华章计算机”公众号查看。

3.5　持久化与缓存

Spark 的一个独特功能是在内存中持久化 RDD。你可以使用 persist 或 cache 变换来持久化 RDD，如下所示：

上述两个语句都是相同的，并且会在 MEMORY_ONLY 存储级别缓存数据。它们的区别在于：cache 是指 MEMORY_ONLY 存储级别，而 persist 可以根据需要选择不同的存储级别，如下表所示。当第一次使用动作来进行计算时，它将保存在节点上的内存中。了解缓存 RDD 的百分比及其大小的最简单方法是检查管理界面中的 Storage 选项卡，如图3-11 所示：

图3-11　缓存的 RDD

微信关注我们

原文链接：https://yq.aliyun.com/articles/117481

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

CIO:主流大数据厂商汇总分类

目前国内外做大数据的厂商依旧分为两类：一类是现在已经有获取大数据能力的公司，他们打算利用自身优势地位冲击大数据领域，将现有安装基础及产品线口碑推广到新一轮技术浪潮当中。如IBM、微软、谷歌、亚马逊、百度、腾讯、阿里巴巴等互联网巨头以及华为、浪潮、中兴等国内领军企业，涵盖了数据采集，数据存储，数据分析，数据可视化以及数据安全等领域;另一类则是初创的大数据公司，他们依赖于大数据工具，针对市场需求，为市场带来创新方案并推动技术发展。其中大部分的大数据应用还是需要第三方公司提供服务，希望为市场带来创新方案并推动技术发展。本文将主流的大数据厂商分为大数据基础设施类，大数据分析类，大数据应用类，大数据数据源类等。下面就来盘点下大数据领域国内外的主力阵营吧，其中一些早已名满天下，另外大部分则属初来乍到。 1. 大数据基础设施类 1)硬件类主要厂商有IBM、HP、DELL、华为、联想、浪潮、中兴、云创大数据等。 2)软件类基于大数据基础设施提供云服务的有Amazon Web Service Elastic MapReduce、Google Big Query、Infochimps、Microso...

2017-07-02

529

近日，IBM公布了全新的四项数据服务，允许用户对自身数据进行分析，并且能够访问IBM的数据集。这意味着，IBM可以将部分数据部署到包括私有云在内的云平台上。根据IBM公布的信息，这四项服务分别为Analytics Exchange（分析交换）、Compose Enterprise（企业及数据库服务）、Graph（图形数据库服务）和Predictive Analytics（预测分析）。其中，Analytics Exchange涉及超过150个公共数据集，数据类别包括通信、经济、地理、政务、交通等等。例如，它包括全球手机订阅的统计数据，或者世界上所有国家的水道统计数据。目前，这项服务还在测试中。 Compose Enterprise是基于被IBM收购的一家公司Compose原有的成果基础上改进的，这项服务会在2016年3月初发布。该服务包括多个数据库——MongoDB，Redis，Elasticsearch，PostgreSQL和RethinkDB，通过RabbitMQ实现消息队列。用户可以在IBM的SoftLayer上安装服务，也可以在AWS集群或专用服务器上安装。 Graph是一个...

2017-07-02

528

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。