中国HBase技术社区第二届MeetUp -笔记摘要-低调大师

中国HBase技术社区第二届MeetUp -笔记摘要

2018-07-20 704

kylin：通过预计算（已知要查询的维度），通过spark，mr遍历计算这些指标，然后将结果存储到hbase中，最后直接查询hbase表即可。

hbase rowkey定义不宜过长，否则存储压力会很大。这里通过使用字典编码。

hbase 优化经验：

火焰图分析：从下往上分析，峰值的分布（满载还是正常）

hbase内存消耗主因（memstore（写文件）， blockcache（读取））

两种不同的gc算法：
hbase gc 参数配置：

使用G1算法，效果显著。

hbase WAL 和核心业务配置为ALL_SSD（所有副本使用SSD）

指定队列

分别使用HDD， ONE_SSD, ALL_SSD ，和使用读写分离。性能的变化。。

设置zone_reclaim。。可以避免本地内存不够导致OOM。（numa的问题）

hbase （高一致性，一行数据一般都是通过一个regionserver来处理，通过单机来保证一致性，所以发生故障，恢复可能会较慢）和
Cassandra（HA要求高，一致性较低（一半副本写完既可以，所以读取时可能读取不到最新数据，然后通过异步刷新，知道最终写完副本），
redis（集群方式不完善）的区别

why？region crash 为true，就无法恢复上不了线。

不做compaction（合并），flush。

怎么把磁盘打满（利用起来）？

限流不要太狠，需因地制宜

避免小文件生成，和compaction合并。是否配置自动（1h)flush，和多少changes（3千万）flush。

到底写多少hlog根据盘数目：（怎么把磁盘用起来）

远程读和hybrid 都需要注意网络问题

使用jsata去查看handler wait在哪里？

微信关注我们

原文链接：https://yq.aliyun.com/articles/624478

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

云上大数据系列2：如何最大化利用你的集群资源

本篇是云上大数据系列第二篇文章，主要介绍Hadoop系统的基础调优，让Hadoop集群的资源能够被充分利用起来。在后续的文章中，我们还将会分享更多关于云上大数据系统的性能分析和调优经验，敬请期待。大数据系统对资源的占用较大，如果不进行合适的基础调优，很容易造成资源的浪费。尤其是在云端部署大数据系统，按量计费却没有最大化利用购买的资源，往往导致投入产出比较低。本篇我们介绍如何对Hadoop系统进行基础优化，让 Hadoop 系统的资源能够被充分利用起来。资源环境：ecs.d1.6xlarge × 5 软件系统：CDH 5.14.2 (Spark 1.6) 操作系统：CentOS 7.3 我们以 CDH 5.14.2 为例，介绍 Spark-on-YARN 的基础调优方法，在这一版本的 CDH 中，Spark 版本是 1.6 。值得注意的是，Spark 1.6 以后（含），其内存管理方式发生了变化，本文论述的方法不一定适用于之前的版本。阅读本文前，你需要有一定的 Hadoop 使用或开发经验。 1. Spark-on-YARN 的资源分配提交 Spark 任务的时候，YARN 在做什...

2018-07-20

711

8月17日，HBasecon Asia 2018，直播之后，视频回看生成中，相关资料将在社区下载频道呈现。请开发者们关注官网信息。地址：https://yq.aliyun.com/promotion/631 keynote部分资料分享：https://yq.aliyun.com/download/2939Track1、2、3部分 https://yq.aliyun.com/download/2940 作为Apache基金会旗下HBase社区的顶级用户峰会，HBaseCon大会是Apache HBase™官方从2012年开始发起和延续至今的技术会议，先后在美国加州、日本东京和中国深圳等地举办，得到了Google、Facebook、雅虎和阿里巴巴等众多全球顶级互联网公司支持。第二届Apache HBasecon Asia 峰会于8月17日

2018-07-22

814

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。