技术篇-HBase 2.0 新特性之 In-Memory Compaction
In-Memory Compaction 是 HBase2.0 中的重要特性之一,通过在内存中引入 LSM 结构,减少多余数据,实现降低 flush 频率和减小写放大的效果。本文根据 HBase2.0 中相关代码以及社区的讨论、博客,介绍 In-Memory Compaction 的使用和实现原理。
1. 原理
1.1 概念和数据结构
In-Memory Compaction 中引入了 MemStore 的一个新的实现 类 CompactingMemStore 。顾名思义,这个类和默认 memst。 CompactingMemStore 中,数据以 segment 作为单位进行组织,一个 memStore 中包含多个 segment。数据写入时首先进入一个被称为 active 的 segment,这个 segment 是可修改的。当 a
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
技术篇-HBase 2.0 之修复工具 HBCK2 运维指南
概述 目前社区已经发布了 HBase 的 2.0 版本,很多公司都希望去尝试新版本上的新功 能,但是不得不面对的问题就是当集群出了问题应该如何解决。在之前的 HBase版本中,我们可以依赖 hbck 来帮助检查问题和修复问题,在新的版本上我们应 该如何去处理呢?HBASE-19121[1]给了我们答案——HBCK2。HBCK2 目前发布 了 1.0 版本,还在一直开发中,感兴趣的同学看看这个 issue 1. WHY HBCK2由于之前的 hbck(hbck-1)是会直接去向 region server 或者 hdfs 发送请求进行修 复,而在 HBase 2.0 版本上集群内部操作全部都被挪到了 procedure v2(下文都称 为 procedure)上进行处理。因为所有的命令都是经过 master 来协调处理,所以在修复时也需
- 下一篇
[Phoenix] 十一、查询计划详解
一、概要 在数据库中,执行计划就是表示一条SQL将要执行的步骤,这些步骤按照不同的数据库运算符号(算子)组成,具体的组成和执行方式由数据库中的查询优化器来决定。换而言之,执行计划决定了SQL的执行效率。在数据库的使用中了解其查询计划的构成,是进行查询性能调优的必要条件。本文将详细介绍Phoenix的查询计划语法、组成结构,以及一些注意事项。 二、查询计划 1. 基本说明 在phoenix中,查询计划能告诉我们如下的信息: 将要扫描的CHUNK数量 客户端并发线程数量 执行模式(并行或串行) 查询过滤字段或者扫描范围 将会查询的表名 估算扫描数据bytes大小(依赖stats信息) 估算扫描数据量大小(依赖stats信息) 估算数量bytes大小和数据量时间 操作符被执行在客户端或者服务端 涉及的查询operations(sort、filter, scan,
相关文章
文章评论
共有0条评论来说两句吧...