HBase优化之路-合理的使用编码压缩
为什么要讨论HBase编码压缩
- 编码+压缩能够成倍的减少数据的磁盘占用空间,节省可观的存储费用
- 编码+压缩通常情况下可以提高系统吞吐率,让系统可以做更多的功
- 默认建表不启用编码或者压缩,对初学者不友好
了解HBase编码
举个栗子,我们有一张物流表叫"express",记录物流订单的流转详情。如下面表格:rowkey包含两个部分,用#号分割,左边是物流订单号,右边是物流信息的更新时间点。表包含两个列,一个物流状态,一个是物流描述信息
rowkey | 状态列 | 描述信息列 |
---|---|---|
10324224#2019-04-21 10:51 | 已发货 | 包裹正在等待揽收 |
10324224#2019-04-21 19:46 | 已揽件 | [嘉兴市]平湖南桥的xxx已揽收 |
10324224#2019-04-21 19:46 | 运输中 | [嘉兴市]快件已从平湖南桥出发,准备发往嘉兴中转部 |
10324224#2 |

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
对比MySQL,一文看透HBase的能力及使用场景
MySQL + HBase 是我们日常应用中常用的两个数据库,分别解决应用的在线事务问题和大数据场景的海量存储问题。 本文内容适合初次理解HBase的读者,包括技术、功能及场景,也欢迎老司机们补充和温故。
- 下一篇
阿里云MaxCompute、城市大脑双双荣获浙江省科技进步一等奖
5月14日,浙江省科学技术奖励大会正式召开,阿里云自研大数据计算平台MaxCompute和城市大脑双双获得浙江省科技进步一等奖。 MaxCompute是国内最早自研的大数据计算平台之一。十年前,阿里云创始人王坚博士带领团队研发该平台,目前已拥有EB级别的数据存储能力、百PB级的单日计算能力,广泛应用于金融、互联网、能源、交通、政务等行业。 借助MaxCompute,浙江省率先实现“最多跑一次”,将与老百姓办事最密切相关的100个事项70多亿条数据实现共通共享共用。老百姓办事不仅能最多跑一次,甚至一次都不跑。 十年来,该平台创造了多个世界记录:2013年,首次突破单集群内5000台服务器的规模;2015、2016年,刷新世界计算奥运会SortBenchmark的六项世界纪录;2017年,完成全球首次基于公共云的100TB BigBench
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Red5直播服务器,属于Java语言的直播服务器
- Windows10,CentOS7,CentOS8安装Nodejs环境
- CentOS7,8上快速安装Gitea,搭建Git服务器
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- SpringBoot2全家桶,快速入门学习开发网站教程
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- SpringBoot2整合Redis,开启缓存,提高访问速度
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7