中国HBase技术社区第二届MeetUp -笔记摘要
kylin:通过预计算(已知要查询的维度),通过spark,mr遍历计算这些指标,然后将结果存储到hbase中,最后直接查询hbase表即可。
hbase rowkey定义不宜过长,否则存储压力会很大。这里通过使用字典编码。
hbase 优化经验:
火焰图分析:从下往上分析,峰值的分布(满载还是正常)
hbase内存消耗主因(memstore(写文件), blockcache(读取))
两种不同的gc算法:
hbase gc 参数配置:
使用G1算法,效果显著。
hbase WAL 和核心业务配置为ALL_SSD(所有副本使用SSD)
指定队列
分别使用HDD, ONE_SSD, ALL_SSD ,和使用读写分离。性能的变化。。
设置zone_reclaim。。可以避免本地内存不够导致OOM。(numa的问题)
hbase (高一致性,一行数据一般都是通过一个regionserver来处理,通过单机来保证一致性,所以发生故障,恢复可能会较慢)和
Cassandra(HA要求高,一致性较低(一半副本写完既可以,所以读取时可能读取不到最新数据,然后通过异步刷新,知道最终写完副本),
redis(集群方式不完善)的区别
why?region crash 为true, 就无法恢复上不了线。
不做compaction(合并),flush。
怎么把磁盘打满(利用起来)?
限流不要太狠,需因地制宜
避免小文件生成,和compaction合并。是否配置自动(1h)flush,和多少changes(3千万)flush。
到底写多少hlog根据盘数目:(怎么把磁盘用起来)
远程读和hybrid 都需要注意网络问题
使用jsata去查看handler wait在哪里?

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
云上大数据系列2:如何最大化利用你的集群资源
本篇是云上大数据系列第二篇文章,主要介绍Hadoop系统的基础调优,让Hadoop集群的资源能够被充分利用起来。在后续的文章中,我们还将会分享更多关于云上大数据系统的性能分析和调优经验,敬请期待。 大数据系统对资源的占用较大,如果不进行合适的基础调优,很容易造成资源的浪费。尤其是在云端部署大数据系统,按量计费却没有最大化利用购买的资源,往往导致投入产出比较低。本篇我们介绍如何对Hadoop系统进行基础优化,让 Hadoop 系统的资源能够被充分利用起来。 资源环境:ecs.d1.6xlarge × 5 软件系统:CDH 5.14.2 (Spark 1.6) 操作系统:CentOS 7.3 我们以 CDH 5.14.2 为例,介绍 Spark-on-YARN 的基础调优方法,在这一版本的 CDH 中,Spark 版本是 1.6 。值得注意的是,Spark 1.6 以后(含),其内存管理方式发生了变化,本文论述的方法不一定适用于之前的版本。阅读本文前,你需要有一定的 Hadoop 使用或开发经验。 1. Spark-on-YARN 的资源分配 提交 Spark 任务的时候,YARN 在做什...
- 下一篇
Apache旗下顶级开源盛会 HBasecon Asia 2018众多大咖分享
8月17日,HBasecon Asia 2018,直播之后,视频回看生成中,相关资料将在社区下载频道呈现。请开发者们关注官网信息。地址:https://yq.aliyun.com/promotion/631 keynote部分资料分享:https://yq.aliyun.com/download/2939Track1、2、3部分 https://yq.aliyun.com/download/2940 作为Apache基金会旗下HBase社区的顶级用户峰会,HBaseCon大会是Apache HBase™官方从2012年开始发起和延续至今的技术会议,先后在美国加州、日本东京和中国深圳等地举办,得到了Google、Facebook、雅虎和阿里巴巴等众多全球顶级互联网公司支持。 第二届Apache HBasecon Asia 峰会于8月17日
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- 设置Eclipse缩进为4个空格,增强代码规范
- CentOS8编译安装MySQL8.0.19
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长
- Docker安装Oracle12C,快速搭建Oracle学习环境
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- Mario游戏-低调大师作品
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题