6天如何玩转HBase?(57集视频+源码+笔记)
1、什么是HBase?
HBase是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。
就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类似于Bigtable的能力。HBase是Apache的Hadoop项目的子项目。HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。另一个不同的是HBase基于列的而不是基于行的模式。
2、HBase体系架构(图)
3、HBase具有哪些优点
(1)写入性能高,且几乎可以无限扩展。
(2)海量数据下(100TB级别表)的查询依然能保持在5ms级别。
(3)存储容量大,不需要做分库分表,切勿维护简单。
(4)表的列可以灵活配置,1行可以有多个非固定的列。
4、2019好程序员大数据教程-6天如何玩转HBase
(1)课程简介
在本课程中,主要讲述了HBase详细的架构原理及特点、HBase内部各个角色的详细介绍、安装配置、HBase的Shell操作、新旧版本的读写数据详细流程、HBase的API操作等等。
(2)哪些人适合学习:
具有一定大数据基础的人群
(3)课程目录:
day1
01.HBase是什么
02.HBase的作用
03.HBase的表结构
04.HBase的内部结构原理
05.HBase各个节点之间的关联
06.HBase各个节点之间的映射关系
day2
07.HBase的单机节点安装前准备
08.HBase的单机节点安装
09.HBase的单机测试与启动
10.HBase的伪分布式安装介绍
11.HBase的伪分布式安装以及配置说明
12.HBase的全分布式安装说明
13.HBase的全分布式安装以及配置说明
14.HBase全分布式启动与测试
day3
15.ddl:namespace
16.ddl建表
17.ddl表的其他操作
18.dml:put
19.dml:scan
20.dml:get
21.dml修改数据和删除
22.dml:count
23.JAVA API 连接HBase服务
day4
24.封装连接工具类
25.封装模板类
26.Namespace的CRUD
27.Table的创建
28.查询表中所有列簇
29.修改表
30 删除表中的列簇
31 删除表
32 进一步重构工具类
33 添加记录
34.获取行键指定的列簇信息
35.批量查询Get
36.scan查询
37.再次重构工具类
38.删除表数据
day5
39.单列过滤器
40.过滤器链进行列值查询
41.重构工具类
42.RegexStringComparator
43.SubstringComparator
44.BinaryPrefixComparator
45.BinaryComparator
46.FamilyFilter
47.QualifierFilter
48.ColumnPrefixFilter
49.MultipleColumnPrefixFilter
50.RowFilter
day6
51.布隆过滤器
52.HBase的寻址机制
53.HBase2HDFS
54.HBase2HDFS的文件格式问题
55.HDFS2HBase
56.Hive2HBase
57.HBase2Hive测试
尾注:
精心整理,实属不易,手动点赞,以示鼓励
想获取更多WEB相关学习资源(视频+工具+面试题+技术文档+源码+……+整合项目)加裙:645186603
关注作者vx公众号“好程序员”,回复“DT2”即可领取57集的“6天玩转HBase”视频+源码+笔记!想学习大数据的小伙伴抓紧时间领取!
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
容器日志知多少 (2) 开源日志管理方案 ELK/EFK
本篇已加入《.NET Core on K8S学习实践系列文章索引》,可以点击查看更多容器化技术相关系列文章。上一篇《你必须知道的容器日志(1)》中介绍了Docker自带的logs子命令以及其Logging driver,本篇将会介绍一个流行的开源日志管理方案ELK。 一、关于ELK 1.1 ELK简介 ELK 是Elastic公司提供的一套完整的日志收集以及展示的解决方案,是三个产品的首字母缩写,分别是ElasticSearch、Logstash 和 Kibana。 Elasticsearch是实时全文搜索和分析引擎,提供搜集、分析、存储数据三大功能 Logstash是一个用来搜集、分析、过滤日志的工具 Kibana是一个基于Web的图形界面,用于搜索、分析和可视化存储在 Elasticsearch指标中的日志数据 1.2 ELK日志处理流程 上图展示了在Docker环境下,一个典型的ELK方案下的日志收集处理流程: Logstash从各个Docker容器中提取日志信息 Logstash将日志转发到ElasticSearch进行索引和保存 Kibana负责分析和可视化日志信息 由于Lo...
- 下一篇
python学习笔记(1):配置虚拟开发环境
问题 有的时候开发不同的业务,所需要的环境不一样。一直在同一个环境中开发时候,不同的包版本升级可能会导致另外的业务不能正常工作。另外,有的github上的项目需要的开发环境与你使用的环境不同,冒然的按照它的requirements安装相应的包会产生类似的问题。一般而言,针对这种情况,对不同的业务,如果是存在依赖包存在版本升降级问题,常规的办法是对不同的业务创建不同的虚拟环境,在各个业务下,先进入虚拟环境,然后需要那种依赖包再进行安装,这样就不会产生版本不一样,或者版本升级导致的其它业务不能正常工作这一问题了。 解决办法 Mac Os 系统 安装 pip Pip , Python数据包的安装器, 其官方文档介绍在此.一般而言,当安装好python3后,pip也随之安装。如果获得如下错误 pip command not found 使用下面的命令安装pip: sudo easy_install pip 安装 virtualenv virtualenv 是一个创建隔离python项目的工具。类似于将各个项目的python及依赖包进行隔离。输入下面命令进行安装 sudo pip install...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS关闭SELinux安全模块
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- Mario游戏-低调大师作品
- CentOS6,CentOS7官方镜像安装Oracle11G
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- Windows10,CentOS7,CentOS8安装Nodejs环境
- Docker安装Oracle12C,快速搭建Oracle学习环境
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- CentOS8编译安装MySQL8.0.19
- MySQL8.0.19开启GTID主从同步CentOS8