Apache Doris Flink Connector 24.0.0 版本正式发布
亲爱的社区伙伴们,Apache Doris Flink Connector 24.0.0 版本已于 2024 年 9 月 5 日正式发布。该版本新增了对 Flink 1.20 的支持,并支持通过 Arrow Flight SQL 高速读取 Doris 中数据。此外,整库同步所依赖的 FlinkCDC,也需升级至 3.1.x 版本,以便更好的应用。
下载地址:https://github.com/apache/doris-flink-connector/releases/tag/24.0.0
行为变更
-
将整库同步所依赖的 FlinkCDC 版本升级至 FlinkCDC 3.1.x。由于 FlinkCDC 3.1 及后续版本已捐赠给 Apache 基金会,并与 FlinkCDC 2.4 版本不兼容,因此在升级 Doris Flink Connector 时,已运行的整库同步作业无法从之前的状态重启,需要在将 Flink CDC 升级到 3.1 版本后进行一次无状态重启。具体可参考 Apache Flink CDC 3.1.0 发布公告 兼容性章节。
-
考虑到上述不兼容性以及与其他 Connector(如 Spark 和 Kafka)版本的一致性,我们将 Connector 版本号更改为 24.x 系列。具体可参考: [DISCUSS] About the next version change of Connector
新增功能
-
支持 Flink 1.20
-
支持 DB2 的数据库同步
-
CDC SchemaChange 支持使用 JSQLParser 框架解析 DDL
-
支持 Stream Load GZ 压缩导入
-
支持通过 Arrow Flight SQL 读取 Doris 中数据
改进提升
-
升级 FlinkCDC 版本到 3.1.1
-
支持 DB2/Postgres/SQLServer 进行数据同步的 JDBC 参数设置
-
优化攒批写入模式
-
优化部分 CDC 同步的逻辑
-
MySQL 整库同步支持 Integer 类型
Bug 修复
-
修复 Map 子类型为 Date/Datetime 类型时的读取序列化问题
-
修复 FlinkSQL 投影下推的 Bug
-
修复 MongoDB 同步 Decimal 类型的问题
-
兼容 Doris 修复 arrow 读取 timestamp 类型的问题
-
CDC 整库同步修复 delete 事件不生效的问题
-
修复 Schema Change 默认值空时转换逻辑错误的问题
致谢
在此向参与版本设计、开发、测试、讨论的社区贡献者们表示感谢,他们分别是:
@bingquanzhao
@DongLiang-0
@JasonLeeCoding
@JNSimba@MaoMiMao
@qg-lin@tmc9031
@vinlee19

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
loveqq-framewoek 1.0.5 发布,比 Spring 更强大的条件注解推断
本次更新: 优化: loveqq-boot-starter-netty,新增 WebSocketHandler 以支持 websocket 链接,并兼容命令式编码风格 优化: loveqq-boot-starter-netty,新增 WsFilter,以支持 websocket 过滤器 优化: loveqq-boot-starter-netty,新增 sse 响应支持 优化:引入熟悉的 @AliasFor,全面支持注解继承、复合注解 优化:ioc 容器启动性能、反射调用性能 优化:支持 ide 中 shorten command line 启动 优化:支持 ide 中,动态构建 jar index 启动应用 优化:得益于自定义 JarIndexClassLoader,只需将 ClassFileTransformer 实现类配置到 k.factories 中,即可生效,而无需配置 javaagent 以及 Pre-Main 优化:@Configuration 的自调用默认无需生成代理类 简介 轻量级 ioc/aop 框架,比 spring 更强大的条件推断;抽象出 mvc 模式,提供嵌入...
- 下一篇
李彦宏内部讲话曝光:谈大模型三大认知误区,未来模型之间的差距会变大
“外界对大模型有相当多的误解,”近日据媒体报道,李彦宏的一则内部讲话曝光。 在最近一次和员工交流中,李彦宏谈及三个大模型认知误区,涵盖了大模型竞争、开源模型效率、智能体趋势等热点话题。 李彦宏谈到,未来大模型之间的差距可能会越来越大。他表示,大模型的天花板很高,现在距离理想情况还相差非常远,所以模型要不断快速迭代、更新和升级;需要能几年、十几年如一日地投入,不断满足用户需求,降本增效。 以下为内部讲话内容 问:有观点认为,大模型之间的能力已经没有壁垒了? 李彦宏:这个说法我不同意。我认为外界对大模型有相当多的误解,每一个新模型发布时,肯定都想说自己有多好,每次都去跟GPT-4o做比较,拿测试集或者弄一些榜单,说我的得分已经跟它差不多了,甚至某些单项上得分已经超过它了,但这并不能证明这些新发的模型跟OpenAl最先进的模型相比已经没有那么大的差距了。 模型之间的差距是多维度的,一个维度是能力方面,不管是理解能力、生成能力、逻辑推理能力还是记忆能力等这些基本能力上的差距;另一个维度是成本方面,你想具备这个能力或者想回答这些问题,你付出的成本是多少?有些模型可能推理速度很慢,虽然也达到同样的...
相关文章
文章评论
共有0条评论来说两句吧...