《循序渐进学Spark》一3.5　容错机制及依赖-低调大师

《循序渐进学Spark》一3.5　容错机制及依赖

2017-05-01 561

本节书摘来自华章出版社《循序渐进学Spark》一书中的第3章，第3.5节，作者小象学院　杨　磊，更多章节内容可以访问云栖社区“华章计算机”公众号查看。

3.5　容错机制及依赖

一般而言，对于分布式系统，数据集的容错性通常有两种方式：

1）数据检查点（在Spark中对应Checkpoint机制）。

2）记录数据的更新（在Spark中对应Lineage血统机制）。

对于大数据分析而言，数据检查点操作成本较高，需要通过数据中心的网络连接在机器之间复制庞大的数据集，而网络带宽往往比内存带宽低，同时会消耗大量存储资源。

Spark选择记录更新的方式。但更新粒度过细时，记录更新成本也不低。因此，RDD只支持粗粒度转换，即只记录单个块上执行的单个操作，然后将创建RDD的一系列变换序列记录下来，以便恢复丢失的分区。

3.5.1　Lineage（血统）机制

微信关注我们

原文链接：https://yq.aliyun.com/articles/87652

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

《HBase权威指南》一1.5　HBase：Hadoop数据库

本节书摘来异步社区《HBase权威指南》一书中的第1章，第1.5节，作者：【美】Lars George 译者：代志远 , 刘佳 , 蒋杰责编：杨海玲，更多章节内容可以访问云栖社区“异步社区”公众号查看。 1.5　HBase：Hadoop数据库看过BigTable的架构之后，我们可能会简单地认为HBase完全是Google的BigTable的开源实现。但是这个说法可能过于简单，因为两者之间还有些差异（大多是细微的）值得一提。 1.5.1　历史 HBase是Powerset㉑在2007年创建的，最初是Hadoop的一部分。之后，它逐步成为Apache软件基金会旗下的顶级项目，具备Apache软件许可证，版本为2.0。 HBase项目的主页是http://hbase.apache.org/，通过这个主页可以链接到文档（documentation）、wiki、源代码库（source repository），以及已经发布的库和源代码的下载站点。下面是一个HBase随时间发展的简短概述。 2006年11月：Google发布BigTable论文。 2007年2月：HBase宣布在Hado...

2017-05-02

620

本节书摘来异步社区《HBase权威指南》一书中的第3章，第3.1节，作者：【美】Lars George 译者：代志远 , 刘佳 , 蒋杰责编：杨海玲，更多章节内容可以访问云栖社区“异步社区”公众号查看。第3章　客户端API：基础知识 HBase权威指南本章将会介绍HBase提供的客户端API。在前文提到过，HBase是使用Java编写的，所以原生的API也是Java开发的，不过这并不意味着必须通过Java访问HBase。我们会在第6章介绍如何通过其他编程语言使用HBase。

2017-05-02

585

资源下载

更多资源

优质分享App

近一个月的开发和优化，本站点的第一个app全新上线。该app采用极致压缩，本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。