《HBase权威指南》一导读
前 言 HBase权威指南你阅读本书的理由可能有很多。可能是因为听说了Hadoop,并了解到它能够在合理的时间范围内处理PB级的数据,在研读Hadoop的过程中发现了一个处理随机读写的系统,它叫做HBase。或者将其称为目前流行的一种新的数据存储架构,传统数据库解决大数据问题时成本更高,更适合的技术范围是NoSQL。 无论你是如何来到这里的,我都希望你能够了解并学习如何在企业或组织中使用HBase解决海量数据问题。你可能有关系型数据库的背景,但更希望去研究这个“列式存储”系统;也许你听说HBase能够不费力地进行线性拓展,并且有足够的理由成为下一代网络系统。 在2007年年底,我曾面临百万级的文档存储需求,并且需要满足容错和可扩展等要求。我拥有丰富的MySQL数据库经验,并使用这种数据库来存储数据,最终服务于我的网站的用户。MySQL可以在运行于一台服务器的同时,拥有另一台备份服务器,其无法应对如此海量数据的处理,于是我只好寻找其他可用的存储数据库。 我的口头禅是:“Google是如何解决这类问题的?”后来我接触了Hadoop,在短暂使用Hadoop之后,我面临随机读写的问题——但是这...