Ali-HBase的SQL实践与改进
2017云栖大会Hbase专场,阿里巴巴技术专家天穆带来Ali-HBase的SQL实践与改进的演讲。本文主要从为什么需要SQL开始谈起,进而讲解了SQL on Hbase,接着着重分享了Ali-Hbase SQL的优化与改进,最后对未来进行了展望。
以下是精彩内容整理:
为什么需要SQL?
时间序列数据的存取:按照时间顺序追加新记录,按照时间范围查询数据,查询结果按时间倒排。我们数据是按照时间产生的,最新写的数据一定写在表头,在分布式情况下所有操作都落在表头,这台服务器必然会成为热点。
Hash散列
解决写热点问题就是打散、随机分布,任何一个操作都可以随机地放在表格里面。这带来一个新的问题,整个表不是有序,一旦时间有序就会产生写热点。
分桶
我们需要做一些折中,也就是分桶,我们对它做一个取模的操作,任何一次操作都可以落在随机的“桶”里面,数据在


