ETL & 流批一体化框架 bboss v7.2.0 发布
数据采集 ETL & 流批一体化框架 bboss v7.2.0 发布,大幅提升数据加工处理性能 --- 高效、稳定、快速、安全
bboss 是一个基于开源协议 Apache License 发布的开源项目,由开源团队 bboss 运维,主要由以下三部分构成:
-
Elasticsearch Highlevel Java Restclient , 一个高性能高兼容性的 Elasticsearch/Opensearch java orm 客户端框架
-
数据采集同步 ETL ,一个基于 java 语言实现数据采集作业的强大 ETL 工具,提供丰富的输入插件和输出插件,可以基于插件规范轻松扩展新的输入插件和输出插件
-
流批一体化计算框架,提供灵活的数据指标统计计算流批一体化处理功能的简易框架,可以结合数据采集同步 ETL 工具,实现数据流处理和批处理计算,亦可以独立使用;计算结果可以保存到各种关系数据库、分布式数据仓库 Elasticsearch、Clickhouse 等,特别适用于数据体量和规模不大的企业级数据分析计算场景,具有成本低、见效快、易运维等特点,助力企业降本增效。
-
数据采集同步改进:增加并行模式执行数据加工方法datarefactor,大幅提升数据加工处理性能
除数据库输入插件,其他输入插件采用并行模式执行数据加工方法datarefactor。
数据库输入插件默认采用串行模式执行,可以通过dbInputConfig.setParallelDatarefactor(true)切换为并行执行模式
并行加工处理模式只有在并行作业任务模式才起作用,参考章节【4.3 串行执行和并行执行】
-
修复Elasticsearch输出插件日期转换空指针异常问题
-
数据采集同步改进:文件输入插件从ftp下载文件,重启作业时,文件过滤器检测状态表中文件异常时将异常抛出去,而不是认为文件不存在,避免不可以预知的异常
- RecordGenerator接口方法参数由Context调整为TaskContext,简化接口设计
public void buildRecord(Context taskContext, CommonRecord record, Writer builder) throws Exception; 调整为: public void buildRecord(TaskContext taskContext, CommonRecord record, Writer builder) throws Exception;
- kafka输出插件改进,增加并行批量消息输出能力,提升插件性能
- 处理采用sqlserver数据库管理增量同步状态管理表无法创建问题
- Elasticsearch客户端和http-proxy支持http请求拦截器功能,配置HttpRequestInterceptor
- 增加对Clickhouse jdbc官方驱动的支持(使用http端口),参考文档:https://doc.bbossgroups.com/#/persistent/datasource-cluster
- 插件改进:优化http输出插件、文本文件输出插件、dummy输出插件、Elasticsearch输出插件,大幅提升并行批处理任务性能
- 流处理指标计算改进:调整etl和流处理混合模式中的流处理功能到批处理任务中执行,提升流处理计算性能
- 简化回调处理结果和参数对象泛型结构定义
- 添加增量采集配置正确性校验功能
- 增加统一异常信息构建工具
- 处理作业过程中指标分析器提示metricspersistent已经停止问题
bboss低版本作业升级到7.2.0教程
https://www.bilibili.com/video/BV1gm421g7Zg/
bboss 详细介绍文档
https://esdoc.bbossgroups.com/#/README
项目源码地址参考:源码下载和构建
Elasticsearch Highlevel Java Restclient 快速上手
https://esdoc.bbossgroups.com/#/quickstart
导入和使用 bboss ETL maven 坐标
bboss 版本最新版本号从以下文档章节【1.1 在工程中导入 bboss maven 坐标】获取:
https://esdoc.bbossgroups.com/#/db-es-tool
bboss ETL & 流处理插件使用指南
https://esdoc.bbossgroups.com/#/datatran-plugins
bboss 实战视频
Elasticsearch Bboss Stream ETL 介绍视频
Elasticsearch 导出 Excel 文件,按记录数切割 Excel 文件,解决单个文件导出数量过大问题
通用数据库管理工具 -- 支持关系数据库、Clickhouse、doris 等数据库管理

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
功能强大的开源数据中台系统 DataCap 2024.03.4 发布
推荐一套基于 SpringBoot 开发的简单、易用的开源权限管理平台,建议下载使用:https://github.com/devlive-community/authx 推荐一套为 Java 开发人员提供方便易用的 SDK 来与目前提供服务的的 Open AI 进行交互组件:https://github.com/devlive-community/openai-java-sdk DataCap 发布! 发布版本 发布时间 2024.03.4 2024-05-19 主要功能 移除 stale ci 修复聊天对话框文本过多导致样式混乱的问题 添加数据库、表、列补全符 修复了单词未设置为编辑器的问题 更新 openai-java-sdk 版本 支持显示查询错误信息 支持即席查询可视化 用户界面 修复查看SQL时使用ESC导致页面异常的问题 数据集 修复虚拟列无法构建 修复临时查询不传递列类型的问题 支持根据表达式生成别名 更换头像 可视化 添加玫瑰图 MongoDB 支持多数据源 文件系统 支持 aliyun oss 将 fs 存储实验功能标记为正式功能 推荐一套全平台数据库管理工具,建议...
- 下一篇
BeetlSQL 3.30.7 发布,性能再优化
BeetlSQL 研发自 2015 年,核心和生态扩展全部自研。目标是提供开发高效,维护高效,运行高效的数据访问框架,它适用范围广,定制性强,入门快。 阅读文档源码和例子在线体验多库使用性能测试插件支持 本次调整: sql-accelerator 不支持泛型字段 · Issue #I9PPBH 【轻量级 PR】:注释错误 · Pull Request !164 sql-accelerator 性能优化,selectById和selectAll内置方法优化,性能提升30% sql-jmh 新增ORM工具DBVisitor 的性能测试数据 最新测试结果,Score越大越好: BeetlSQL (国产) MyBatis-Plus (国产) JPA(Spring Data) JDBC (基准) Wood (国产) MyBatis-Flex (国产) EasyQuery (国产) DBVisitor (国产) Benchmark Mode Cnt Score Error Units Beetl.addEntity thrpt 5 131.153 ± 36.755 ops/ms Beet...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- CentOS7,8上快速安装Gitea,搭建Git服务器
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- SpringBoot2全家桶,快速入门学习开发网站教程
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- CentOS8编译安装MySQL8.0.19
- CentOS7,CentOS8安装Elasticsearch6.8.6