阿里巴巴捐赠的 Flink CDC 项目正式加入 Apache 基金会
摘要:本文整理自阿里云开源大数据平台徐榜江 (雪尽),关于阿里巴巴捐赠的 Flink CDC 项目正式加入 Apache 基金会,内容主要分为以下四部分:
1、Flink CDC 新仓库,新流程
2、Flink CDC 新定位,新玩法
3、Flink CDC 捐赠契机
4、Flink CDC 未来规划
在2023年12月举行的 Flink Forward Asia 大会上,阿里巴巴正式宣布将 Flink CDC项目捐赠给Apache基金会,作为 Apache Flink 的官方子项目。在接下来的三个月中,阿里巴巴与 Flink CDC 社区的开发者们共同完成了一系列捐赠事宜,包括社区捐赠投票、版权签署、仓库迁移、代码整理、文档迁移、工作项(issue)迁移和持续集成(CI)迁移等。至此,Flink CDC 的全部捐赠流程已正式完成。
Flink CDC 新仓库,新流程
新仓库
随着 Flink CDC 的捐赠流程完成,社区原有代码仓库和文档网站将不再使用,请大家移步 Apache 基金会下的仓库和文档网站。
-
代码仓库已经从http https://github.com/ververica/flink-cdc-connectors
-
文档网站已经从 https://ververica.github.io/flink-cdc-connectors
迁移到 https://nightlies.apache.org/flink/flink-cdc-docs-master/
新流程
作为Apache Flink的官方子项目,Flink CDC的后续开发将严格遵循Apache Flink社区的规范。工作项和缺陷将通过Flink Jira管理,而社区开发讨论和交流则逐步从钉钉群转移至Flink社区邮件列表。
-
工作项的管理和缺陷管理会在 Flink JIRA上进行,请大家在开 issue 时,模块名选择 Flink CDC。
Flink JIRA 地址:https://issues.apache.org/jira/projects/FLINK/issue
-
开发相关的工作项讨论会在 Flink dev 邮件列表中进行,用户答疑和交流将会在 Flink user(英文用户)和Flink user-zh(中文用户)邮件列表中进行,欢迎大家参考Flink邮件列表订阅指南按需订阅,参与社区开发和交流。
Flink 邮件列表订阅指南:https://flink.apache.org/what-is-flink/community/#mailing-lists
Flink CDC 新定位,新玩法
新定位
Flink CDC 是一个分布式的端到端实时数据集成工具。数据源不再局限于数据库,支持多种数据源,同时支持写出到多种下游系统,提供完整的端到端数据集成能力。对于离线数据集成场景,Flink CDC 也将在后续版本支持离线数据集成。
新玩法
Flink CDC 创新性地通过 YAML 这种简洁的 API 来描述数据集成的业务需求,为数据集成用户带来优雅的开发体验。下述例子描述了 Flink CDC 将 MySQL 整库同步到 Doris,Flink CDC 会根据上游表结构推导下游 Doris 表结构并在下游自动建表后开始数据同步,数据同步过程中,上游 MySQL 中表结构变更默认会自动同步到下游 Doris。
在这极简的 YAML 背后是 Flink CDC 优秀的框架设计和优雅的封装。Flink CDC 框架会解析用户的 YAML 文件生成深度定制化的 Flink 算子并自动编排,算子之间使用高性能的数据结构,框架层面支持了 Schema Evolution、整库同步、分库分表同步等高级功能,现在这些功能用户只需要理解 YAML 就能实现按需启用,无需使用 Java 开发 DataStream 应用。
Flink CDC 捐赠契机
Flink CDC 是阿里巴巴旗下 Ververica 公司于 2020 年 7 月在 Github 上开源的一个数据集成项目,在过去的三年多时间里,在云邪、雪尽、孙家宝、阮航、龚中强、任庆盛、川粉等社区 maintainer 成员带领下,Flink CDC 陆续推出了2.0 和 3.0 两个重要版本,其中 2.0 版本支持了全增量一体化、无锁读取、并行读取等核心功能, 3.0 版本支持了端到端数据集成、Schema Evolution 等核心特性。凭借这些核心特性,Flink CDC 简化了用户数据集成链路,社区也取得了高速的发展,目前社区 Github star 超过 5k,社区用户群破万,Flink CDC 技术也在国内外多个行业落地。
在社区发展过程中,我们也发现了项目发展的两大限制,一是技术原因:一些 Flink CDC 的底层功能开发依赖于 Flink 的 public API 修改,而 Flink API 开发和管理非常严谨,作为一个周边生态项目去推动 Flink 社区改动现有 public API 的流程比较复杂,推动也较慢。二是社区共建原因:虽然项目使用的是非常友好的 Apache License V2 开源协议,但项目版权归属于 Ververica 公司,对于一些注重版权的企业和开发者,在参与 Flink CDC 开源社区共建时有一些担忧。针对这些发展限制,考虑到项目的长期发展,来自阿里巴巴、Ververica、蚂蚁、XTransfer、大健云仓的社区维护成员内部进行了多次讨论,最终决定将该项目捐赠给 Apache 基金会作为 Apache Flink 的官方子项目,这样的好处是不仅可以让 Flink CDC 所需的 Flink API 演进能够在 Flink 社区获得更快的响应,同时也能消除企业和开发者对社区共建的版权担忧。
Flink CDC 未来规划
Flink CDC 捐赠的过程中,社区开发者一直在持续开发 3.1 版本 Roadmap 中规划的功能,可以透露的是多个重点功能已经就绪。因此,预计在4月份,我们将发布进入 Apache 之后的第一个版本 3.1.0, 该版本框架将会支持期待已久的 Transform 操作,包括列裁剪、计算列、表达式计算和常用的内置函数等,同时 Flink CDC 的连接器生态将会支持重点湖仓,下游系统将会支持写入 Paimon 数据湖和 Kafka 消息队列,敬请期待。
Flink Forward Asia 2023
本届 Flink Forward Asia 更多精彩内容,可微信扫描图片二维码观看全部议题的视频回放及 FFA 2023 峰会资料!
更多内容
活动推荐
阿里云基于 Apache Flink 构建的企业级产品-实时计算 Flink 版现开启活动:
59 元试用 实时计算 Flink 版(3000CU*小时,3 个月内)
了解活动详情:https://free.aliyun.com/?pipCode=sc

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
三星计划 2025 年初推出 AI 芯片 Mach-1
韩媒 Sedaily 报道称,三星电子在第 55 届年度股东大会上宣布,该公司正准备在 2025 年初推出自主研发的 AI 芯片 Mach-1。此举被解读为三星试图打破英伟达(Nvidia)在人工智能半导体市场的主导地位,重新夺回全球最大半导体公司的地位。 三星电子半导体(DS)部门总裁庆桂显(Kye Hyun Kyung)表示:"我们已经通过可编程芯片(FPGA)完成了 Mach-1 的技术验证,目前正在设计系统芯片(SoC)。预计将在今年年底前制造出芯片,明年年初你就可以看到用我们的芯片制造的 AI 系统了。" Sedaily 指出,Mach-1 是一款适用于 AI 推理的最佳芯片,且该芯片预计采用的是一种革命性的结构,可以将内存和 GPU 之间的瓶颈减少到现有水平的八分之一左右。此外,它有望成为一款“轻量级”AI 芯片,可以利用低功耗内存,而不需要 AI 半导体中使用的昂贵的高带宽内存(HBM)。 除了专注于开发 Mach-1 芯片外,庆桂显透露三星还在积极参与更广泛的 AI 半导体开发工作。该公司在硅谷建立了一个实验室,致力于通用人工智能(AGI)研究。该实验室的使命是创建新型...
- 下一篇
玄湾 OS 重磅开源!专为容器安全运行的轻量级云原生操作系统
一、项目简介 玄湾OS 是云原生 OS 的重要组件之一。玄湾项目聚焦于镜像的构建和升级。常规的 OS 镜像一般是通过 Linux 发行版衍生而来,在云原生场景下,具有体积臃肿、版本零散、攻击面广等不足。玄湾项目的引入,就是为了解决传统的镜像构建和升级带来的弊端。 玄湾项目的功能分类包括: 构建系统:玄湾可以根据不同产品需求,可配置其包含的组件。组件可以来自指定软件仓库,也可以通过源代码编译产生。组件分为:基础组件(无需配置)和产品组件; 升级系统:玄湾提供快速升级机制以及异常版本回退机制,并且基于 overlayfs 实现的只读根文件系统 A/B 盘方式升级,同时提供受控可供用户安装的隔离空间。既防止了系统的碎片化,又保证了一定的灵活性。 测试系统:自动化容器部署测试工具。基于构建出的系统镜像创建虚拟机测试组,自动部署测试容器。支持多虚拟机部署,自动统计测试结果。 二、诞生背景 常规的虚拟机镜像一般是通过 Linux 发行版衍生而来,该类型的镜像通常需要人为的去管理和控制镜像的内容和版本,这就造就镜像可能会比较臃肿,也可能非常不可靠,容易引发一些意想不到的问题。 同时对于镜像中包含的组...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Linux系统CentOS6、CentOS7手动修改IP地址
- CentOS7设置SWAP分区,小内存服务器的救世主
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- SpringBoot2全家桶,快速入门学习开发网站教程
- CentOS8编译安装MySQL8.0.19
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- CentOS7,CentOS8安装Elasticsearch6.8.6