Apache NiFi之Kafka流数据到HBase

2019-08-06 940

一.说明

在大数据平台的业务场景中，处理实时kafka数据流数据，以成为必要的能力；此篇将尝试通过Apache NiFi来接入Kafka数据然后处理后存储之HBase

二.开拔

Ⅰ).配置ConsumeKafka_0_10

测试使用了kafka0.10版本，所以NiFi中也选择对于版本

a).选择ConsumeKafka_0_10

在Processor中搜索ConsumeKafka_0_10

b).配置ConsumeKafka_0_10

1.Kafka Brokers: hostname1:9092,hostname2:9092:hostname3:9092
2.Topic Name(s): entry_index_nifi
3.Group ID: entry_index_nifi

Ⅱ).配置PutHBaseJSON

a).选择PutHBaseJSON

在Processor中搜索PutHBaseJSON

b).配置PutHBaseJSON

1.HBase Client Service：选择匹配版本的HBaseClient
2.Table Name：配置入库HBase表名
3.Row Identifier Field Name：配置RowKey值
4.Column Family: 配置列簇

c).选择HBase_1_1_2_ClientService

在Processor中搜索HBase_1_1_2_ClientService

d).配置HBase_1_1_2_ClientService

1.Zookeeper Quorum: hostname1:2181,hostname2:2181,hostname3:2181
2.Zookeeper Client Port: 2181
3.Zookeeper ZNode Parent: /hbase

e).激活HBase_1_1_2_ClientService

Ⅲ).启动服务

可以点击选择单个Processor启动，也可以在空白处点击流程启动

Ⅳ).验证结果

a).Kafka源数据

./bin/kafak-console-consumer.sh --zookeeper hostname1:2181,hostname2:2181,hostname3:2181 ---topic entry_index_nifi

b).HBase入库数据

scan 'kafka.entry_index_nifi',{LIMIT=>10}

三.HBase命令

## 创建表空间
create_namespace 'kafka'

## 查看表空间
list_namespace_tables 'kafka'

## 创建表
create 'kafka.entry_index_nifi','cf1'

## 查看表数据
scan 'kafka.entry_index_nifi',{LIMIT=>10}

微信关注我们

原文链接：https://yq.aliyun.com/articles/713120

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

大数据平台测试

一.大数据平台测试简述大数据平台测试包括2部分：基础能力测试和性能测试 Ⅰ).基础能力测试大数据平台的基本功能和数据的导入导出对SQL任务、NoSQL任务、机器学习、批处理任务的支持大数据平台是否能够通过界面的形式方便用户进行非运行维护，主要包括集群的安装、监控、配置、操作等大数据平台是否能够提供基本的安全方案 a).是否具备认证功能以防止恶意访问和攻击 b).是否能够进行细粒度的权限管理 c).是否能够提供审计和数据加密功能大数据平台是否具备高可用的机制，防止机器的失效带来的任务失败以及数据丢失大数据平台是否能够支持机器快速平滑地扩展和缩容时带来线性的计算能力大数据平台是否能够支持多个调用接口以及对SQL语法的支持情况大数据平台是否能够根据队列、用户的权重来细粒度地分配计算资源 Ⅱ).性能测试基准测试:数据生成、负载选择和明确测试指标等内容性能测试：基准测试之上的扩展二.大数据平台测试流程 Ⅰ).数据生成 BDGS: 能够快速生成保持真实数据特性的文本、表和图数据的数据生成工具 BDGS构造方法 a).数据筛选：选取代表性的真实数据集和相应的建模方法或工具 b)...

2019-08-06

1051

一.说明将Apache NiFi做为关系型数据与非关系型数据库的数据同步工具使用，在此场景中需要将mysql导出的avro数据格式转化为json入库HBase 二.开拔 Ⅰ).配置ExecuteSQLRecord a).选择ExecuteSQLRecord 在Processor中搜索ExecuteSQLRecord b).配置ExecuteSQLRecord 1.创建Database Connection Pool2.创建JsonRecordSetWriter3.配置SQL select query select Host,User,authentication_string from mysql.user; c).创建DBCPConnectionPool 在Database Connection Pool中选择DBCPConnectionPool d).配置DBCPConnectionPool 1.Database Connection URL: jdbc:mysql://hostname:3306/druid2.Database Driver Class Name: com.my...

2019-08-08

1126

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。