数据采集 ETL 工具 Elasticsearch-datatran v6.3.3 发布
数据采集ETL工具 Elasticsearch-datatran v6.3.3 发布, v6.3.3修复了v6.3.2,v6.3.1版本引入的一系列问题,建议升级。
Elasticsearch-datatran 由 bboss 开源的数据采集同步ETL工具,提供数据采集、数据处理清洗和数据入库功能。支持在Elasticsearch、关系数据库(mysql,oracle,db2,sqlserver、达梦等)、Mongodb、HBase、Hive、Kafka、文本文件、SFTP/FTP多种数据源之间进行海量数据同步;支持日志文件实时增量采集到kafka/elasticsearch/database。
Elasticsearch版本兼容性:支持各种Elasticsearch版本(1.x,2.x,5.x,6.x,7.x,+)之间相互数据迁移
v6.3.3 功能改进
-
数据同步改进:处理异步更新状态可能导致的死锁问题
-
数据同步改进:处理在closeEOF为true情况下filelog插件重启后不采集数据问题和filelog插件不采集新增文件数据问题
-
数据同步改进:优化作业停止资源处理机制
-
数据同步改进:优化作业状态管理机制
-
数据同步改进:filelog插件增加FileFilter机制,自定义筛选需要采集日志的文件
v6.3.2 功能改进
-
数据同步改进:启用日志文件采集探针closeOlderTime配置,允许文件内容静默最大时间,单位毫秒,如果在idleMaxTime访问内一直没有数据更新,认为文件是静默文件,将不再采集静默文件数据,关闭文件对应的采集线程,作业重启后也不会采集
-
数据同步改进:日志文件采集插件增加对CallInterceptor的支持,采集文件任务新增/结束时会调用拦截器方法,可以在refactor方法中获取拦截器设置的数据,文件采集完毕后释放
-
数据同步工具完善:修复同步数据到kafka productor初始化问题
-
数据同步工具完善:修复停止filelog作业报错问题
-
数据同步工具改进:发送kafka控件改进,设置发送多少条消息后打印发送统计信息
bboss数据采集ETL案例大全

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
Kotlin 1.5.30 首个 RC 版本发布
Kotlin 1.5.30 发布了首个 RC 版本。RC 意味着所有特性已确定,在正式发布前的主要工作是修复 bug。 主要新特性包括: 对 Opt-in 要求的更新 Kotlin/JS IR 后端进入 Beta 阶段 Gradle 插件对 Java 工具链的支持 标准库中对 Regex 和 Duration 的改进 Kotlin/JS IR 后端进入 Beta 阶段 自 Kotlin 1.4 发布以来,Kotlin/JS 编译器的 IR 后端一直处于 Alpha 状态。现在终于进入了 Beta 阶段,这意味着后续不会出现破坏性变化,未来工作主要集中在提升稳定性上。 文档:https://kotlinlang.org/docs/js-ir-compiler.html Gradle:构建脚本中 Kotlin 守护进程增加 JVM 选项以及Java 工具链支持 Gradle 6.7 引入了对 Java 工具链的支持——可用于为项目编译选择 JDK。开发者只需在构建脚本中声明所需的版本,Gradle 会自动完成剩下的工作。Kotlin 1.5.30-RC 针对 Kotlin 编译任务启用了 ...
-
下一篇
Midway v2.12.3 发布,Node.js 框架
Midway 是一个适用于构建 Serverless 服务,传统应用、微服务,小程序后端的 Node.js 框架。 Bugfix 1、修复上版本 task 组件在 egg 下重复定义 context.logger 的问题 2、处理 @midwayjs/decorator 包中 decoratorManager 的单例问题(现在不同的 @midwayjs/decorator 包会复用同一个 decoratorManager 实例) Features 1、发布了一个支持 vercel 的启动器 2、configuration 中 importConfigs 支持直接对象描述配置 3、configuration 新增一个 onConfigLoad 生命周期(灰度)
相关文章
文章评论
共有0条评论来说两句吧...