《MapReduce 2.0源码分析与编程实战》一2.2 数据操作
本节书摘来异步社区《MapReduce 2.0源码分析与编程实战》一书中的第2章,第2.2节,作者: 王晓华 责编: 陈冀康,更多章节内容可以访问云栖社区“异步社区”公众号查看。 2.2 数据操作 HBase实战HBase表的行有唯一标识符,叫做行键(rowkey)。其他部分用来存储HBase表里的数据,但是行键是第一重要的。就像关系型数据库的主键,HBase表中每行的行键值都是不同的。每次访问表中的数据都从行键开始。TwitBase中每个用户是唯一的,所以users表使用用户名字作为行键很方便,一会儿就这么用。 和数据操作有关的HBase API称为命令(command)。有5个基本命令用来访问HBase,Get(读)、Put(写)、Delete(删除)、Scan(扫描)和Increment(递增)。用来存储数据的命令是Put。为了往表里存储数据,你需要创建一个Put实例。根据行键创建Put实例,如下所示: 为什么不能直接存储用户名字呢?HBase中所有数据都是作为原始数据(raw data)使用字节数组的形式存储的,行键也是如此。Java客户端函数库提供了一个公用类Bytes,用来...
