Flink SQL 功能解密系列 —— 阿里云流计算/Blink支持的connectors
Blink Connectors
总览
Connector 是连接外部数据和blink计算框架的桥梁,也是流计算的入口和出口。目前,blink支持了集团内部绝大多数的上下游(如下图),详细的接入方法可以见官方文档,本文主要阐述connector设计和使用上需要注意的问题。
Source插件
1. source connector控制消费位点
blink读取上游数据时,会记录消费位点和控制消费速度。结合blink checkPoint机制,source connector会周期性的把当前消费位点存储到rocksDB中。在发生failover的时候,source connector会从上一次成功消费的位点开始重追数据,保证at least once
或excatly once
的计算语义(取决于任务配置)。这也要求上游插件能够支持从特定位点恢复读,

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Flink SQL 功能解密系列 —— 流计算“撤回(Retraction)”案例分析
什么是retraction(撤回) 通俗讲retract就是传统数据里面的更新操作,也就是说retract是流式计算场景下对数据更新的处理 方式。 首先来看下流场景下的一个词频统计列子。 没有retract会导致最终结果不正确↑: retract发挥的作用 下面再分享两个双十一期间retract保证数据正确性的业务case: case1: 菜鸟物流订单统计 同一个订单的商品在运输过程中,因为各种原因,物流公司是有可能从A变成B的。为了统计物流公司承担的订单数目,菜鸟团队使用blink计算的retraction机制进行变key汇总操作。 -- TT source_table 数据如下: order_id tms_company 0001 中通 0002 中通 0003 圆通
- 下一篇
云场景实践研究第73期:国网浙江电力
更多云场景实践研究案例,点击这里: 【云场景实践研究合集】联合不是简单的加法,而是无限的生态,谁会是下一个独角兽 国网浙江电力大数据平台架构师陈振带来Dataworks/MaxCompute在国网应用的实践。本文主要从建设数据仓库的三个痛点开始谈起,借助阿里云服务引出企业级数仓架构设计,数据集成和企业级管理的提升,最后作了简要的展望。 采用的阿里云产品 阿里云Dataworks 阿里云MaxCompute 阿里云云效(RDS) 阿里云ADS 阿里云云数据库HBase 为什么使用阿里云 借助阿里云服务助力国网浙江电力建设数据仓库,构建企业级数仓架构,数据集成和企业级管理 关于国网浙江电力 国网浙江省电力公司是国家电网公司下属的全资子公司,主要承担建设、运营、发展浙江电网,为浙江经济社会发展和人民生活提供可靠优质的电力保障,促进全省电力资源优化配置
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- Hadoop3单机部署,实现最简伪集群
- CentOS7,CentOS8安装Elasticsearch6.8.6
- Linux系统CentOS6、CentOS7手动修改IP地址
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- CentOS8安装Docker,最新的服务器搭配容器使用
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- CentOS关闭SELinux安全模块
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16