hbase snapshot源码分析

2017-11-23 623

snapshot操作在硬盘上形式：

/hbase/.snapshots
       /.tmp                &lt;---- working directory
       /[snapshot name]     &lt;----- completed snapshot

当snapshot完成时的形式展示：

     /hbase/.snapshots/[snapshot name]
                .snapshotinfo          &lt;--- Description of the snapshot
                .tableinfo             &lt;--- Copy of the tableinfo
               /.logs
                     /[server_name]
                         /... [log files]
                      ...
                /[region name]           &lt;---- All the region's information
                .regioninfo              &lt;---- Copy of the HRegionInfo
                   /[column family name]
                       /[hfile name]     &lt;--- name of the hfile in the real region
                       ...
                   ...

snapshot基本步骤：

1.执行前会枷锁操作，不允许删除添加操作；

2.在hdfs在创建指定目录，写入相关的信息进去；

3.刷新memstore中的数据到hfile，

4.为hfile文件创建引用指针.

以下是大体的代码流程。

hbaseAdmin执行发起的snapshot：

    public void snapshot(final String snapshotName, final TableName tableName, SnapshotDescription.Type type) throws IOException,       SnapshotCreationException, IllegalArgumentException {
        SnapshotDescription.Builder builder = SnapshotDescription.newBuilder();
        builder.setTable(tableName.getNameAsString());
        builder.setName(snapshotName);
        builder.setType(type);
        snapshot(builder.build());
    }

执行快照并等待服务器完成该快照（阻止）。HBase实例一次只能有一个快照，或者结果可能是未定义（你可以告诉多个HBase集群同时快照，但只有一个在单个群集同时）。

    public void snapshot(SnapshotDescription snapshot) throws IOException, SnapshotCreationException, IllegalArgumentException {
        // actually take the snapshot
        SnapshotResponse response = takeSnapshotAsync(snapshot);

MasterRpcService:异步触发并完成一次snapshot：

        `master.snapshotManager.takeSnapshot(snapshot);`

SnapshotManager类：完成一次snapshot需要根据表的状态：disabled或者enabled

    if (assignmentMgr.getTableStateManager().isTableState(snapshotTable, ZooKeeperProtos.Table.State.ENABLED)) {
            LOG.debug("Table enabled, starting distributed snapshot.");
            snapshotEnabledTable(snapshot);
            LOG.debug("Started snapshot: " + ClientSnapshotDescriptionUtils.toString(snapshot));
        }
        // For disabled table, snapshot is created by the master
        else if (assignmentMgr.getTableStateManager().isTableState(snapshotTable, ZooKeeperProtos.Table.State.DISABLED)) {
            LOG.debug("Table is disabled, running snapshot entirely on master.");
            snapshotDisabledTable(snapshot);
            LOG.debug("Started snapshot: " + ClientSnapshotDescriptionUtils.toString(snapshot));
        } 

        private synchronized void snapshotEnabledTable(SnapshotDescription snapshot) throws HBaseSnapshotException {
        // setup the snapshot
        prepareToTakeSnapshot(snapshot);

        // Take the snapshot of the enabled table
        EnabledTableSnapshotHandler handler = new EnabledTableSnapshotHandler(snapshot, master, this);
        snapshotTable(snapshot, handler);
    }

enabled状态下执行表的snapshot：

        // setup the snapshot
        准备工作
        prepareToTakeSnapshot(snapshot);

        // Take the snapshot of the enabled table
        EnabledTableSnapshotHandler handler = new EnabledTableSnapshotHandler(snapshot, master, this);
        开始执行snapshot
        snapshotTable(snapshot, handler);
    }

snapshot开始之前的设置准备：检查是否有一个在运行的snapshot工作以及还原snapshot工作的请求存在。#

        // make sure we aren't already running a snapshot 
        if (isTakingSnapshot(snapshot)) {
            SnapshotSentinel handler = this.snapshotHandlers.get(snapshotTable);
            throw new SnapshotCreationException("Rejected taking " + ClientSnapshotDescriptionUtils.toString(snapshot) + " because we are already running another snapshot " + (handler != null ? ("on the same table " + ClientSnapshotDescriptionUtils.toString(handler.getSnapshot())) : "with the same name"), snapshot);
        }

        // make sure we aren't running a restore on the same table
        if (isRestoringTable(snapshotTable)) {
            SnapshotSentinel handler = restoreHandlers.get(snapshotTable);
            throw new SnapshotCreationException("Rejected taking " + ClientSnapshotDescriptionUtils.toString(snapshot) + " because we are already have a restore in progress on the same snapshot " + ClientSnapshotDescriptionUtils.toString(handler.getSnapshot()), snapshot);
        }

        try {
            // delete the working directory, since we aren't running the snapshot. Likely leftovers
            // from a failed attempt.
            fs.delete(workingDir, true);

            // recreate the working directory for the snapshot
            if (!fs.mkdirs(workingDir)) {
                throw new SnapshotCreationException("Couldn't create working directory (" + workingDir + ") for snapshot", snapshot);
            }

设置准备工作完成就开始进行snapshot用指定的handler进行snapshot工作：

            handler.prepare();
            this.executorService.submit(handler);
            this.snapshotHandlers.put(TableName.valueOf(snapshot.getTable()), handler);
            ...

TakeSnapshotHandler真正开始处理snapshot操作：

1.将snapshot描述信息写入.snapshotinfo目录

FsPermission perms = FSUtils.getFilePermissions(fs, fs.getConf(), HConstants.DATA_FILE_UMASK_KEY);
        Path snapshotInfo = new Path(workingDir, SnapshotDescriptionUtils.SNAPSHOTINFO_FILE);
        try {
            FSDataOutputStream out = FSUtils.create(fs, snapshotInfo, perms, true);
            try {
                snapshot.writeTo(out);
            } finally {
                out.close();
            }
        }

2.复制表的信息：

snapshotManifest.addTableDescriptor(this.htd);

3.获取hregionserver上的regions以及位置信息 ##：

List<Pair<HRegionInfo, ServerName>> regionsAndLocations;
            if (TableName.META_TABLE_NAME.equals(snapshotTable)) {
                regionsAndLocations = new MetaTableLocator().getMetaRegionsAndLocations(server.getZooKeeper());
            } else {
                regionsAndLocations = MetaTableAccessor.getTableRegionsAndLocations(server.getZooKeeper(), server.getConnection(), snapshotTable, false);
            }

4.开始执行snapshot操作，上面获取到的region信息及位置信息

 // run the snapshot
snapshotRegions(regionsAndLocations);
启动snapshot程序：：：

在regionserver上开始snapshot // start the snapshot on the RS所有的snapshot操作的具体细节

    Procedure proc = coordinator.startProcedure(this.monitor, this.snapshot.getName(), this.snapshot.toByteArray(), 

    Lists.newArrayList(regionServers));
    if (proc == null) {
        String msg = "Failed to submit distributed procedure for snapshot '" + snapshot.getName() + "'";
        LOG.error(msg);
        throw new HBaseSnapshotException(msg);
    }

等待snapshot完成：

proc.waitForCompleted();

将下线的region作为disabled处理

// Take the offline regions as disabled
        for (Pair<HRegionInfo, ServerName> region : regions) {
            HRegionInfo regionInfo = region.getFirst();
            if (regionInfo.isOffline() && (regionInfo.isSplit() || regionInfo.isSplitParent())) {
                LOG.info("Take disabled snapshot of offline region=" + regionInfo);
                snapshotDisabledRegion(regionInfo);
            }
        }

5.相关region信息以及servername，用来验证snapshot的有效性

// extract each pair to separate lists
            Set<String> serverNames = new HashSet<String>();
            for (Pair<HRegionInfo, ServerName> p : regionsAndLocations) {
                if (p != null && p.getFirst() != null && p.getSecond() != null) {
                    HRegionInfo hri = p.getFirst();
                    if (hri.isOffline() && (hri.isSplit() || hri.isSplitParent()))
                        continue;
                    serverNames.add(p.getSecond().toString());
                }
            }

6.刷新内存状态，写snapshot-mnifest信息到目录

// flush the in-memory state, and write the single manifest
            status.setStatus("Consolidate snapshot: " + snapshot.getName());
            snapshotManifest.consolidate();

7.开始验证snapshot的有效性

// verify the snapshot is valid
            status.setStatus("Verifying snapshot: " + snapshot.getName());
            verifier.verifySnapshot(this.workingDir, serverNames);

8.完成snapshot，转移目录等

// complete the snapshot, atomically moving from tmp to .snapshot dir.
completeSnapshot(this.snapshotDir, this.workingDir, this.fs);
msg = "Snapshot " + snapshot.getName() + " of table " + snapshotTable + " completed";
status.markComplete(msg);
LOG.info(msg);
metricsSnapshot.addSnapshot(status.getCompletionTimestamp() - status.getStartTime());

微信关注我们

原文链接：https://yq.aliyun.com/articles/556194

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Spark Test

练习关于讲list分为奇偶并求出占比练习关于需求表合并 reduce filter 等操作 Spark 中 RDD 过程 transformation 和 Action 大多数操作基于transformation 所以可以链式写法 package com.zhiyou100 import org.apache.spark.{SparkConf, SparkContext} object HomeWork { val conf =new SparkConf().setMaster("local[*]").setAppName("home work") val sc= SparkContext.getOrCreate(conf) //作业一 def ListsortTest()={ val list =List(1,2,43,5,6,7,76,8,9,0,3) val rdd=sc.parallelize(list) val allnum =rdd.count() val qiAccmulator=sc.longAccumulator("qishu") val ouAccmul...

2017-11-23

737

1，什么是mapreduce ？ Mapreduce是一种编程模型，是一种编程方法，抽象理论。 hadoop要分布式包括两部分，一是分布式文件系统hdfs,一部是分布式计算框，就是mapreduce,缺一不可，也就是说，可以通过mapreduce很容易在hadoop平台上进行分布式的计算编程。MR由两个阶段组成，map和reduce，用户只需要实现map（）和reduce（）两个函数，即可实现分布式计算 2，mapreduce工作原理和执行步骤见下： Shuffle的本意是洗牌、混乱的意思，类似于java中的Collections.shuffle(List)方法，它会随机地打乱参数list里的元素顺序。MapReduce中的Shuffle过程。所谓Shuffle过程可以大致的理解成：怎样把map task的输出结果有效地传送到reduce输入端。也可以这样理解， Shuffle描述着数据从map task输出到reduce task输入的这段过程。上图表示的是Shuffle的整个过程。在Hadoop这样的集群环境中，大部分map task与reduce task的执行是在不同的...

2017-11-23

835

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

hbase snapshot源码分析

snapshot操作在硬盘上形式：

当snapshot完成时的形式展示：

snapshot基本步骤：

1.执行前会枷锁操作，不允许删除添加操作；

2.在hdfs在创建指定目录，写入相关的信息进去；

3.刷新memstore中的数据到hfile，

4.为hfile文件创建引用指针.

以下是大体的代码流程。

hbaseAdmin执行发起的snapshot：

执行快照并等待服务器完成该快照（阻止）。HBase实例一次只能有一个快照，或者结果可能是未定义（你可以告诉多个HBase集群同时快照，但只有一个在单个群集同时）。

MasterRpcService:异步触发并完成一次snapshot：

SnapshotManager类：完成一次snapshot需要根据表的状态：disabled或者enabled

enabled状态下执行表的snapshot：

snapshot开始之前的设置准备：检查是否有一个在运行的snapshot工作以及还原snapshot工作的请求存在。#

设置准备工作完成就开始进行snapshot用指定的handler进行snapshot工作：

TakeSnapshotHandler真正开始处理snapshot操作：

1.将snapshot描述信息写入.snapshotinfo目录

2.复制表的信息：

3.获取hregionserver上的regions以及位置信息 ##：

4.开始执行snapshot操作，上面获取到的region信息及位置信息

在regionserver上开始snapshot // start the snapshot on the RS所有的snapshot操作的具体细节

等待snapshot完成：

将下线的region作为disabled处理

5.相关region信息以及servername，用来验证snapshot的有效性

6.刷新内存状态，写snapshot-mnifest信息到目录

7.开始验证snapshot的有效性

8.完成snapshot，转移目录等

Spark Test

map/reduce之间的shuffle，partition，combiner过程的详解

相关文章

发表评论

资源下载

Mario

Spring

Rocky Linux

Sublime Text

欢迎您来访！