数据采集 ETL 工具 bboss-datatran v6.7.6 发布
数据采集 ETL 工具 bboss-datatran v6.7.6 发布,支持Elasticsearch 8以及其他Elasticsearch低版本和Opensearch之间数据同步。
bboss-datatran 是一款基于 java 语言开发的数据采集同步工具,提供数据采集、数据清洗转换处理和数据入库功能,支持在 Elasticsearch、关系数据库 (mysql,oracle,db2,sqlserver、达梦等)、Mongodb、HBase、Hive、Kafka、文本文件 / 日志文件、excel 文件、csv 文件、SFTP/FTP、http/https 等多种数据源之间进行海量数据采集同步;支持数据实时增量和全量数据采集;提供了作业任务控制 API、作业监控 api,支持作业启动、暂停 (pause)、继续(resume)、停止控制机制;支持 http jwt 服务认证和数据签名。基于 bboss 可轻松定制一款属于自己的 ETL 管理工具。
v6.7.6 功能改进
异步批处理增加scriptField功能,通过其指定操作的dsl脚本,使用案例:
data = new HashMap<String,Object>(); data.put("id",1000); data.put("script","{\"name\":\"duoduo104\",\"goodsid\":104}"); clientOptions = new ClientOptions(); clientOptions.setIdField("id"); clientOptions.setScriptField("script"); bulkProcessor.insertData("bulkdemo",data,clientOptions); data = new HashMap<String,Object>(); data.put("id",1000); data.put("script","{\"name\":\"updateduoduo104\",\"goodsid\":1104}"); clientOptions = new ClientOptions(); clientOptions.setIdField("id"); clientOptions.setScriptField("script"); bulkProcessor.updateData("bulkdemo",data,clientOptions);
https协议支持Elasticsearch官方的三种ssl证书,参考文档:https协议配置
优化客户端工具类索引字段管理方法,将内置嵌套结构也增加到字段清单中
调整JobTaskMetrics中作业开始时间、作业id、作业名称的设置机制,避免作业执行异常时未正确设置作业信息
修复Elasticsearch输入插件createBaseDataTran方法被重复调用两次问题
文件输入输出插件改进:ftp发送失败文件重试扫描机制、备份文件清理扫描机制改进
文件输入输出插件改进:将生成的文件信息(本地文件路径、ftp文件路径)添加到作业jobmetrics中,获取方法:
/** * 文件导出时特定的文件类型任务上下文,包含了导出文件清单信息 */ public void afterCall(TaskContext taskContext) { JobTaskMetrics taskMetrics = taskContext.getJobTaskMetrics(); List<GenFileInfo> genFileInfos = (List<GenFileInfo>) taskMetrics.readJobExecutorData(FileOutputConfig.JobExecutorDatas_genFileInfos); }
数据同步作业开发视频教程:
https://www.bilibili.com/video/BV1xf4y1Z7xu
bboss 案例大全
https://esdoc.bbossgroups.com/#/bboss-datasyn-demo
Quick Start
https://esdoc.bbossgroups.com/#/quickstart
开发交流

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
智能制造云办公 v3.8.6 发布,ERP 更新
智能制造云办公系统[SpringBoot2 - 快速开发平台],适用于制造业、建筑业、汽车行业、互联网、教育、政府机关等机构的管理。包含文件在线操作、工作日志、多班次考勤、CRM、ERP 进销存、项目管理、EHR、拖拽式生成问卷、日程、笔记、工作计划、行政办公、薪资模块、动态表单、知识库、公告模块、企业论坛、云售后模块、生产模块、系统模块化同步模块等多种复杂业务功能。 智能制造云办公系统 skyeye v3.8.6 发布,更新内容如下: 新增ERP商品多规格插件 ERP商品新增成品/半成品/物料的选项 ERP商品新增多规格扩展,支持自定义规格 支持业务与动态表单绑定的注解注册服务 新增动态枚举,支持跨服务枚举的获取 新增多视图的动态枚举,为后期的其他视图做准备 修改若干问题 erp:https://gitee.com/doc_wei01/erp-pro OA:https://gitee.com/doc_wei01/skyeye 报表:https://gitee.com/doc_wei01/skyeye-report 企业版信息:https://docs.qq.com/doc/DQlRx...
- 下一篇
渠成企业软件百宝箱 2.0 版本发布,支持对接外部 LDAP
大家好,渠成企业软件百宝箱2.0版本发布,支持对接外部 LDAP 配置及调整应用内存大小,方便用户根据自己的使用情况进行调整。本次更新还上架、更新了多款应用,欢迎体验! 我们的官网提供渠成软件百宝箱的试用,您可以在应用市场选取喜欢的应用体验安装与试用,同时,我们还提供每一款应用的演示服务,让您快速体验不同的应用。 一、新增功能 1.1 支持对接外部 LDAP 1.2 支持调整应用内存大小 二、2.0 版本详细更新列表 2.1 新特性 支持对接外部 LDAP 支持调整应用内存大小 服务的高级设置中增加关联/取消关联 LDAP 2.2 新增应用 上架 Discourse 上架 Nexus3 上架 Grafana Gitea 更新到 1.17.3 Drawio 更新到 20.4.2 code-server 更新到 4.7.1 ModStartCMS 更新到 5.0.0 2FAuth 更新到 3.4.0 2.3 变更 q命令: 优化卸载流程,清理容器网络资源 优化域名申请流程 安装时检查硬盘大小 2.4 Bug修复 修复了数据目录中存在软链接时,导致还原失败的问题 修复了 Gogs 应用关闭 ...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- MySQL8.0.19开启GTID主从同步CentOS8
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- Red5直播服务器,属于Java语言的直播服务器
- CentOS7,8上快速安装Gitea,搭建Git服务器
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- SpringBoot2全家桶,快速入门学习开发网站教程
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库