Why HBase
3.1.1,为什么选用HBases a)容量巨大 HBase 的单表可以有百亿行、百万列数据矩阵横向和纵向两个维度所支持的数据量级 都非常具有弹性。传统的关系型数据库如 Oracle 和 MySQL 等如果数据记录在亿级别 查询和写入的性能都会呈指数级下降所以更大的数据量级对传统数据库来讲是一种灾难。 而 HBase 对于存储百亿、千亿甚至更多的数据都不存在任何问题。对于高维数据百万量级的列没有任何问题。 b)面向列 HBase 是面向列的存储和权限控制并支持列独立检索。有些读者可能不清楚什么是列 式存储下面进行简单介绍。列式存储不同于传统的关系型数据库其数据在表中是按某列 存储的这样在查询只需要少数几个字段的时候能大大减少读取的数据量比如一个字段 的数据聚集存储那就更容易为这种聚集存储设计更好的压缩和解压算法。下面是传统行式 数据库与列式数据库的不同特性。 传统行式数据库的特性如下 数据是按行存储的。 没有索引的查询使用大量 I/O。 建立索引和物化视图需要花费大量的时间和资源。 面对查询需求数据库必须被大量膨胀才能满足需求。 列式数据库的特性如下 数据按列存储即每一列单独存...