HBase优化之路-合理的使用编码压缩
为什么要讨论HBase编码压缩
- 编码+压缩能够成倍的减少数据的磁盘占用空间,节省可观的存储费用
- 编码+压缩通常情况下可以提高系统吞吐率,让系统可以做更多的功
- 默认建表不启用编码或者压缩,对初学者不友好
了解HBase编码
举个栗子,我们有一张物流表叫"express",记录物流订单的流转详情。如下面表格:rowkey包含两个部分,用#号分割,左边是物流订单号,右边是物流信息的更新时间点。表包含两个列,一个物流状态,一个是物流描述信息
rowkey | 状态列 | 描述信息列 |
---|---|---|
10324224#2019-04-21 10:51 | 已发货 | 包裹正在等待揽收 |
10324224#2019-04-21 19:46 | 已揽件 | [嘉兴市]平湖南桥的xxx已揽收 |
10324224#2019-04-21 19:46 | 运输中 | [嘉兴市]快件已从平湖南桥出发,准备发往嘉兴中转部 |
10324224#2 |

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
对比MySQL,一文看透HBase的能力及使用场景
MySQL + HBase 是我们日常应用中常用的两个数据库,分别解决应用的在线事务问题和大数据场景的海量存储问题。 本文内容适合初次理解HBase的读者,包括技术、功能及场景,也欢迎老司机们补充和温故。
-
下一篇
阿里云MaxCompute、城市大脑双双荣获浙江省科技进步一等奖
5月14日,浙江省科学技术奖励大会正式召开,阿里云自研大数据计算平台MaxCompute和城市大脑双双获得浙江省科技进步一等奖。 MaxCompute是国内最早自研的大数据计算平台之一。十年前,阿里云创始人王坚博士带领团队研发该平台,目前已拥有EB级别的数据存储能力、百PB级的单日计算能力,广泛应用于金融、互联网、能源、交通、政务等行业。 借助MaxCompute,浙江省率先实现“最多跑一次”,将与老百姓办事最密切相关的100个事项70多亿条数据实现共通共享共用。老百姓办事不仅能最多跑一次,甚至一次都不跑。 十年来,该平台创造了多个世界记录:2013年,首次突破单集群内5000台服务器的规模;2015、2016年,刷新世界计算奥运会SortBenchmark的六项世界纪录;2017年,完成全球首次基于公共云的100TB BigBench
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- CentOS8编译安装MySQL8.0.19
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- CentOS7,8上快速安装Gitea,搭建Git服务器
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- Dcoker安装(在线仓库),最新的服务器搭配容器使用
- CentOS关闭SELinux安全模块
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果