《MapReduce 2.0源码分析与编程实战》一第2章入门-低调大师

《MapReduce 2.0源码分析与编程实战》一第2章入门

2017-05-01 673

本节书摘来异步社区c书中的第2章，第2.1节，作者：王晓华责编：陈冀康，更多章节内容可以访问云栖社区“异步社区”公众号查看。

第2章入门

HBase实战
本章涵盖的内容

连接到HBase和定义表
与HBase交互的基本命令
HBase的物理数据模型和逻辑数据模型
基于复合行键的查询

下面几章的一个目标是教你如何使用HBase。作为一名应用开发人员，首先你要适应HBase的特性。你将学习HBase的逻辑数据模型（logical data model），访问HBase的各种方式，以及如何使用这些API的细节。另外一个目标是教你进行HBase模式（schema）设计。HBase有着和以往关系型数据库不同的物理数据模型（physical data model）。我们将介绍一些HBase物理模型的基本原理，以便设计数据模型时你能够利用它对自已的应用系统进行优化。

为了完成这些目标，你将从头开始搭建一个应用系统。请允许我们给你介绍一下完全建立在HBase上的TwitBase，它是社交网络Twitter的简化克隆版。我们不会实现Twitter的所有功能，而且这也不是一个准备投入使用的系统。我们只是把TwitBase看做Twitter的初级原型产品。TwitBase和Twitter早期版本的主要区别是，TwitBase设计中考虑了可扩展性，因此需要依赖数据存储来实现这一点。

本章从基本原理开始讲起。你会看到如何创建HBase表，如何导入数据和读取数据。我们将介绍HBase处理数据的基本操作，以及数据模型的基本组件。同时，你会学到一些HBase的内部工作机制。这些知识可以帮助你在模式设计时作出正确决定。本章是学习HBase和其余章节的起点。

要获取本章及全书的代码，请访问 https://github.com/hbaseinaction/twitbase。

微信关注我们

原文链接：https://yq.aliyun.com/articles/97392

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

《HBase权威指南》一导读

前言 HBase权威指南你阅读本书的理由可能有很多。可能是因为听说了Hadoop，并了解到它能够在合理的时间范围内处理PB级的数据，在研读Hadoop的过程中发现了一个处理随机读写的系统，它叫做HBase。或者将其称为目前流行的一种新的数据存储架构，传统数据库解决大数据问题时成本更高，更适合的技术范围是NoSQL。无论你是如何来到这里的，我都希望你能够了解并学习如何在企业或组织中使用HBase解决海量数据问题。你可能有关系型数据库的背景，但更希望去研究这个“列式存储”系统；也许你听说HBase能够不费力地进行线性拓展，并且有足够的理由成为下一代网络系统。在2007年年底，我曾面临百万级的文档存储需求，并且需要满足容错和可扩展等要求。我拥有丰富的MySQL数据库经验，并使用这种数据库来存储数据，最终服务于我的网站的用户。MySQL可以在运行于一台服务器的同时，拥有另一台备份服务器，其无法应对如此海量数据的处理，于是我只好寻找其他可用的存储数据库。我的口头禅是：“Google是如何解决这类问题的？”后来我接触了Hadoop，在短暂使用Hadoop之后，我面临随机读写的问题——但是这...

2017-05-01

756

早先就看到过这样一篇文章，叫《大数据对于运维的意义》。该文章基本上是从三个层面阐述的：工程数据，譬如工单数量，SLA可用性，基础资源，故障率，报警统计业务数据，譬如业务DashBoard,Trace调用链，业务拓扑切换，业务指标，业务基准数据，业务日志挖掘数据可视化当然，这篇文章谈的是运维都有哪些数据，哪些指标，以及数据呈现。并没有谈及如何和大数据相关的架构做整合，从而能让这些数据真的变得活起来。比较凑巧的是，原先百度的桑文峰的分享也讲到日志的多维度分析，吃完饭的时候，一位优酷的朋友也和我探讨了关于业务监控的的问题。而我之前发表在肉饼铺子里的一篇文章《大数据给公司带来了什么》也特地提到了大数据对于整个运维的帮助，当时因为这篇内容的主旨是罗列大数据的用处，自然没法细讲运维和大数据的整合这一块。上面的文字算引子，在步入正式的探讨前，有一点我觉得值得强调：虽然这里讲的是如何将大数据思维/架构应用于运维，平台化运维工作，但是和大数据本质上没有关系，我们只是将大数据处理的方式和思想应用在运维工作上。所以，即使你现在所在的公司没有数据团队支撑，也是完全可以通过现有团队完成这件...

2017-05-01

538

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。