HBase blockcache原理介绍-低调大师

HBase blockcache原理介绍

2020-04-01 996

1.核心组件

总入口是CacheConfig，这个类根据配置信息，来返回不同的具体cache组件；

默认会返回LruBlockCache，所有类型的block都会存入；

启用了BucketCache时，会返回CombinedBlockCache，此类中根据block类型，data block存入BucketCache，其它存入LruBlockCache；

2.LruBlockCache

LruBlockCache内部较为简单，主要就是一个map，如上图所示，由hfilename+offset来唯一标识一个block；

LruBlockCache所能够使用的内存为堆的一定比例，通过hfile.block.cache.size设置，默认是0.4；
so，maxSize = heapSize * hfile.block.cache.size，以下参数都根据maxSize计算；

acceptSize：
使用量达到一定比例时会触发驱逐，该阈值通过hbase.lru.blockcache.acceptable.factor设置，默认是0.99；

minSize：
驱逐后最少剩余比例，该阈值通过hbase.lru.blockcache.min.factor设置，默认是0.95；

hardLimit：
使用量达到一定比例时则拒绝写入，该阈值通过hbase.lru.blockcache.hard.capacity.limit.factor设置，默认是1.2，这意味允许一定的超出；

关于驱逐：

block分为3种类型，由BlockPriority字段区分，取值为single、mutli、inMem，空间分配默认为0.25：0.5：0.25；
系统表以及其它指定了InMem的表所含block会标记为inMem，其它block初次存入时标记为single，再次访问时会修改为multi；
存放时只要还有空间即可放入，空间分配比例只是在驱逐发生时进行计算使用；
驱逐时，会用minSize乘以各类型的比例，得到各类型最少要保留的minSize；
根据目前的算法，驱逐后的size，应该是略大于minSize的一个值，伪代码如下；

expectFreeSize = usedSize - minSize;//预期释放总大小
freedSize = 0;//当前已释放总大小
n=3;//类型数量
for type in ('single','multi','inMem'):
    overFlow = type.usedSize - type.minSize
    toBeFree = min(overFlow,(expectFreeSize - freedSize)/n)
    free(toBeFree)
    freedSize += toBeFree
    n--;

3.BucketCache

LruBlockCache的优点是实现简单，缺点是block的存入和释放伴随着内存的申请和释放，会带来内存碎片和gc过多的问题；

BucketCache采用了类似池的思路，预先申请内存并划分为一个个的bucket，这些bucket会一直存在并重复使用；

总体的读写流程如下图所示：

Block缓存写入流程：

将block写入RAMCache，然后系统会根据blockkey进行hash，根据hash结果将block分配到一组blockingQueue中；
HBase会同时启动多个WriteThead，分别关联一个blockingQueue，并发的执行异步写入；
每个WriteThead读取到block数据后，调用bucketAllocator为这些block分配内存空间；
BucketAllocator会选择与block大小对应的bucket进行存放，并且返回对应的物理地址偏移量offset；
WriteThead将block以及分配好的物理地址偏移量传给IOEngine模块，执行具体的内存写入操作；
写入成功后，将类似这样的映射关系写入BackingMap中，方便后续查找时根据blockkey可以直接定位；

Block缓存读取流程：

首先从RAMCache中查找，对于还没有来得及写入到bucket的缓存block，一定存储在RAMCache中；
如果在RAMCache中没有找到，再在BackingMap中根据blockKey找到对应entry；
根据entry中的offset可以直接从内存中查找对应的block数据；

其中最核心的组件是BucketAllocator和IoEngine，前者负责block的逻辑地址分配，后者负责block的实际物理存放，内部结构如下：

hbase中blocksize是可以灵活设置的，bucketCache预设了一组支持的大小，从4K~512k不等；

一个Bucket只能存放一种size的block，一种size对应一个BucketSizeInfo进行管理；

初始化时，每种size先分配1个bucket，剩余的都分配给最大的那个size，如黑色箭头所示；

分配过程中当前size如果空间不够，会挪用其它size的空闲bucket，如棕色箭头所示，这意味着有可能某个Bucket一开始存放了32k的block

，后面释放后空闲，被挪用后变成存放64k的block；

ioEngine有多种实现，可支持onheap、offheap、disk等；

关于驱逐：

2种情况下会触发，1是已使用超过95%（acceptableFactor），2是某个size的block分配不了(总量虽然没达到阈值，但不存在完全空闲的bucket供挪用)；
驱逐后的最少剩余比例为85%（minFactor），遍历各个bucketSizeInfo，把超过85%的部分加起来，再乘以一个系数0.1（extraFreeFactor），就是要释放的大小；
具体计算方法复用了LruBlockCache的代码，也是按照single、multi、inMem及其比例进行计算和释放；
实际清理动作是修改一些状态数据，比如Bucket对象的freeList、freeCount，以及backMapping的键值对等，并不需要对底层的byteBuffer做什么操作；
对于refCount大于0的block，会先将其markedForEvict置为true，待各个使用方读取完成后调用returnBlock进行释放；

参考资料

http://hbasefly.com/2016/04/26/hbase-blockcache-2/?xuxezc=17idz1

微信关注我们

原文链接：https://yq.aliyun.com/articles/752980

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

个人自主建站方式汇总（各种软件镜像快速建站）

本文汇总了各类型网站的部署方式，便于您自助搭建网站。网站类型部署方式说明 WordPress 云市场镜像搭建WordPress使用ROS搭建WordPress手动搭建WordPress（CentOS 7）手动搭建WordPress（Windows） WordPress是一款常用的搭建个人博客网站的软件。您可以使用WordPress架设自己的网站，也可以搭建内容管理系统CMS（Content Management System）。使用镜像或资源编排服务ROS（Resource Orchestration Service）模板部署WordPress解决了空间和程序的问题，降低了建站的门槛，即买即用。ROS通过一个JSON格式的模板文件，创建一组阿里云资源。您也可以手动搭建WordPress。 LNMP 环境 ROS模板部署镜像部署手动部署（CentOS6）手动部署（CentOS7） LNMP分别代表Linux、Nginx、MySQL和PHP。使用镜像和资源编排服务ROS模板可以帮您省时省力地部署LNMP环境。如果您熟悉Linux操作系统，希望满足个性化部署的要求，您也可以选择手动部署...

2020-04-02

860

总体交互示意图集群状态更新主要包含以下两部分，分别代表集群负载和region分布； clusterMetrics 各个regionserver会定时上报其负载数据到master，并存放在ServerManager组件中，ClusterStatusChore每分钟会将其连同其它信息一起更新到LoadBalancer中，LoadBalancer会保留最近15次的数据，后续在进行ReadRequest、WriteRequest和MemStoreSize等相关计算时，可以根据这些历史数据计算出最近一段时间的平均值； clusterLoad 代表region在各个regionserver的分配情况，从AssignmentManager中获取；生成plan 所谓plan，就是一些action的集合，action的类型有AssignRegionAction、MoveRegionAction和SwapRegionsAction三种；而action由CandidateGenerator产生，目前主要是以下几种： RandomCandidateGenerator 随机选择2个server，1个称为...

2020-04-01

1082

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。