创建消息队列（Kafka）源表-低调大师

创建消息队列（Kafka）源表

2018-11-13 752

本页目录

Kafka源表的实现来源于自社区的kafka版本实现。

注意：本文档只适合独享模式下使用。

Kafka需要定义的DDL如下。

create table kafka_stream(
messageKey VARBINARY,
`message` VARBINARY,
topic varchar,
`partition` int,
`offset` bigint
) with (
type ='kafka010',
topic = 'xxx',
`group.id` = 'xxx',
bootstrap.servers = 'ip:端口,ip:端口,ip:端口'
);

注意：以上表中的五个字段顺序务必保持一致。

WITH参数

通用配置

参数	注释说明	备注
type	Kafka对应版本	推荐使用KAFKA010
topic	读取的单个topic	topic名称

必选配置

（1）kafka08必选配置:

参数	注释说明	备注
group.id	无	消费组id
zookeeper.connect	zk链接地址	zk连接id

（2）kafka09/kafka010/kafka011必选配置：

参数	注释说明	备注
group.id	无	消费组id
bootstrap.servers	kafka集群地址	kafka集群地址

Kafka集群地址：

如果您的kafka是阿里云商业版，请参考kafka商业版准备配置文档。

如果您的kafka是阿里云公测版，请参考kafka公测版准备配置文档。

可选配置

"consumer.id","socket.timeout.ms","fetch.message.max.bytes","num.consumer.fetchers","auto.commit.enable","auto.commit.interval.ms","queued.max.message.chunks", "rebalance.max.retries","fetch.min.bytes","fetch.wait.max.ms","rebalance.backoff.ms","refresh.leader.backoff.ms","auto.offset.reset","consumer.timeout.ms","exclude.internal.topics","partition.assignment.strategy","client.id","zookeeper.session.timeout.ms","zookeeper.connection.timeout.ms","zookeeper.sync.time.ms","offsets.storage","offsets.channel.backoff.ms","offsets.channel.socket.timeout.ms","offsets.commit.max.retries","dual.commit.enabled","partition.assignment.strategy","socket.receive.buffer.bytes","fetch.min.bytes"

注意：其它可选配置项参考kafka官方文档:
Kafka09
https://kafka.apache.org/0110/documentation.html#consumerconfigs
Kafka010
https://kafka.apache.org/090/documentation.html#newconsumerconfigs
Kafka011
https://kafka.apache.org/0102/documentation.html#newconsumerconfigs

kafka版本对应关系

Type	Kafka 版本
Kafka08	0.8.22
Kafka09	0.9.0.1
Kafka010	0.10.2.1
Kafka011	0.11.0.2

Kafka消息解析

默认Kafka读到的消息:

messageKey varbianry,
message varbianry,
topic varchar,
partition int,
offset bigint

这样一个五元组，如果您希望在source阶段把数据parser成特定的其它格式，可以按照下面实践进行。

参数	注释说明	备注
parserUdtf	自定义解析函数	用于解析从kafka读到的消息映射到ddl具体对应的类型

如何写一个parserUdtf参见自定义表值函数（UDTF）。

自建kafka

与阿里云Kafka消息队列一样，DDL定义相同。

示例：

create table kafka_stream(
messageKey VARBINARY,
`message` VARBINARY,
topic varchar,
`partition` int,
`offset` bigint
) with (
type ='kafka011',
topic = 'kafka_01',
`group.id` = 'CID_blink',
bootstrap.servers = '192.168.0.251:9092'
);

WITH参数

关于自建Kafka的with参数，请参考本文档Kafka创建时DDL的with参数说明。需要注意的是 bootstrap.servers参数需要填写自建的地址和端口号。

注意：无论是阿里云Kafka还是自建Kafka，目前实时计算均无Tps、Rps等指标信息。在作业上线之后，运维界面暂时不支持显示指标信息。

上一篇：创建消息队列（MQ）源表

下一篇：数据结果表概述

概念介绍

什么是工作流工作流是大数据数仓体系必备的功能。主要用来进行任务调度，包括定时调度和依赖调度两个功能。为了解决Blink批处理功能在公共云的调度问题，Blink内部集成了开源的Airflow，并将其与Blink的开发平台进行集成，为用户提供一个一站式的批/流/工作流开发运维平台。 Blink工作流架构为了更好的与用户已有的阿里云系统进行打通，工作流会部署在用户指定的VPC中。基本架构如下：架构特点：工作流部署在用户指定的VPC中，可与用户VPC内的其他云服务互联工作流不仅能调度Blink作业，也可以通过shell/python调度用户已有的Hadoop作业。用户独享调度资源，没有安全问题。目前工作流功能仅在独享集群开放，用户可申请独享集群试用，并注明试用工作流即可本文转自实时计算——概念介绍

2018-11-14

610

实时计算 Flink使用CREATE TABLE作为输出结果数据的格式定义，同时定义数据如何写入到目的数据存储。实时计算有Append类型和Update类型。 Append类型：如果输出存储是日志系统或消息系统，或未定义主键的RDS，则流的输出结果都会以追加的方式写入存储中，而不会修改存储中原有的数据。 Update类型：如果输出存储是声明了主键（PRIMARY KEY）的数据库（例如RDS、HBase），流的输出结果会发生以下两种情况。如果根据主键查询数据在数据库中不存在，则会将该数据插入到数据库。如果根据主键查询数据在数据库中存在，则会根据主键更新数据。语法 CREATE TABLE tableName (columnName dataType [, columnName dataType ]*) [ WITH (propertyName=propertyValue [, propertyName=propertyValue ]*) ]; 示例 create table rds_output( id int, len int, content VARCHAR, primary...

2018-11-14

590

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。