数据采集 ETL & 流批一体化框架 bboss v7.0.7 发布
数据采集 ETL & 流批一体化框架 bboss v7.0.7 发布 --- 高效、稳定、快速、安全
bboss 是一个基于开源协议 Apache License 发布的开源项目,由开源团队 bboss 运维,主要由以下三部分构成:
- Elasticsearch Highlevel Java Restclient , 一个高性能高兼容性的 Elasticsearch/Opensearch java 客户端框架
- 数据采集同步 ETL ,一个基于 java 语言实现数据采集作业的强大 ETL 工具,提供丰富的输入插件和输出插件,可以基于插件规范轻松扩展新的输入插件和输出插件
- 流批一体化计算框架,提供灵活的数据指标统计计算流批一体化处理功能的简易框架,可以结合数据采集同步 ETL 工具,实现数据流处理和批处理计算,亦可以独立使用;计算结果可以保存到各种关系数据库、分布式数据仓库 Elasticsearch、Clickhouse 等,特别适用于数据体量和规模不大的企业级数据分析计算场景,具有成本低、见效快、易运维等特点,助力企业降本增效。
项目源码地址参考:源码下载和构建
v7.0.7 功能改进
- 文件采集插件改进:增加word、pdf、图片、视频等类型文件采集功能
- 文件输出插件改进:增加文件输入插件数据写入空闲时间阈值配置
- 优化完成文件清理机制:在扫描新文件过程中检测完成文件并清理
- 作业停止机制优化:异常情况停止时清理队列中的数据
- http proxy微服务框架改进:httpproxy增加一组httpGetforObjectWithParams/httpGetforStringWithParams/httpGetforStringWithParamsHeaders/httpPostforStringWithHeader方法
- 优化http proxy rpc api方法结构,消除多态方法冲突问题
- 增加一组sendJsonBodyfortypeobject方法,支持非标准容器类行和元素类型rpc服务调用
-
数据库输入插件改进:增加enableLocalDate控制开关,是否启用Localdate和LocalDateTime类型,true 启用 false 不启用,默认为false;如果不启用则将Localdate和LocalDateTime类型的值统一转换为Date类型处理
-
增量状态管理改进:设置已完成记录增量状态过期清理机制,设置采集完毕文件状态记录有效期,过期后迁移到历史表,同时清理内存中的记录,添加相关案例: fileInputConfig.setCleanCompleteFiles(true);//删除已完成文件
fileInputConfig.setFileLiveTime(30 * 1000L);//已采集完成文件存活时间,超过这个时间的文件就会根据CleanCompleteFiles标记,进行清理操作,单位:毫秒
fileInputConfig.setRegistLiveTime(60 * 1000L);//已完成文件状态记录有效期,单位:毫秒
fileInputConfig.setScanOldRegistRecordInterval(30 * 1000L);//扫描过期已完成文件状态记录时间间隔,默认为1天,单位:毫秒
-
增加ObjectHolder类,保持对象,用来在作业各组件之间传递其保持的对象
导入和使用bboss
bboss 版本最新版本号从以下文档章节【1.1 在工程中导入 bboss maven 坐标】获取:
https://esdoc.bbossgroups.com/#/db-es-tool
bboss ETL 插件使用指南
https://esdoc.bbossgroups.com/#/datatran-plugins
ETL 实战视频:Elasticsearch 导出 Excel 文件,按记录数切割 Excel 文件,解决单个文件导出数量过大问题
bboss 详细介绍文档
https://esdoc.bbossgroups.com/#/README
bboss 介绍视频

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
智能制造一体化 v3.10.9 发布,项目管理 更新
智能制造一体化管理系统[SpringBoot2 - 快速开发平台],适用于制造业、建筑业、汽车行业、互联网、教育、政府机关等机构的管理。包含文件在线操作、工作日志、多班次考勤、CRM、ERP 进销存、项目管理、EHR、拖拽式生成问卷、日程、笔记、工作计划、行政办公、薪资模块、动态表单、知识库、公告模块、企业论坛、云售后模块、生产模块、系统模块化同步模块等多种复杂业务功能。 有一些小伙伴很好奇最近更新的内容和智能制造有什么关系? 答:目前 Skyeye 整体在做重构,优先从底层的一些功能开始,所以现在大家看到的和智能制造的联系不是很大,也希望大家能够理解,一个大型的智能制造对底层的依赖性也是非常高的。 智能制造一体化 v3.10.9 发布,更新内容如下: 供应商 模块:供应商新增合同管理、联系人管理、团队管控 项目模块:项目管理托管到表单布局,任务管理托管到表单布局 组件模块:新增往来单位合同选择组件 解决若干问题,重要问题为:数据字典加载数据不全。 Skyeye 具备低代码、快捷开发、可视化设计、微服务等特点,方便客户二次开发,极大的提高了开发效率。 erp:https://gitee...
- 下一篇
RXThinkCMF 敏捷开发框架 ThinkPhp8+Layui版本 v1.0.0 发布
v1.0.0 更新内容:1、搭建基于 ThinkPHP8 的项目架构;2、新增角色、菜单、节点等权限架构体系;3、新增基础用户、角色、菜单等基础模块;4、新增字典、配置等基础数据模块;5、新增广告、友链、站点等业务模块;6、新增网站配置等基础数据维护模块; 项目介绍 一款基于ThinkPHP8、Layui、MySQL等技术栈研发的敏捷开发框架,拥有整套完善的RBAC权限架构体系,以用户、角色、菜单为维度设计了一套按钮节点级别的颗粒度权限控制,官方打造了一套组件化、插件化系统核心组件,包括但不限于单图、多图上传组件、图片裁剪组件、下拉选择组件、富文本组件、单选框组件、复选框组件、日期组件、开关组件、穿梭组件、行政区划组件等,在需要使用的模块表单直接引入组件即可,实现了轻量化、敏捷化、高可用的开发模式,简化了开发方式、提高了研发效率,降低了维护成本,目前官方发行版已集成了用户、角色、菜单、职级、岗位、部门、日志、字典、配置、广告、友链、CMS文章、行政区划、通知公告、网站设置等基础模块;此外软件框架基于官方定制化模板引擎研发并集成了代码生成器,实现了一键生成CURD整个模块的增、删、改、查...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- MySQL8.0.19开启GTID主从同步CentOS8
- CentOS8安装Docker,最新的服务器搭配容器使用
- Linux系统CentOS6、CentOS7手动修改IP地址
- 2048小游戏-低调大师作品
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- CentOS8编译安装MySQL8.0.19
- CentOS6,CentOS7官方镜像安装Oracle11G
- CentOS7,8上快速安装Gitea,搭建Git服务器