数据采集 & 流批一体计算工具 bboss v6.8.2 发布
数据采集ETL&流批一体化计算工具 bboss v6.8.2 发布。
bboss-datatran由 bboss 开源的数据采集同步ETL工具,提供数据采集、数据清洗转换处理入库以及流批一体化数据指标统计计算处理功能。
v6.8.2功能改进
FTP文件输入/输出插件改进:ftp/sftp协议增加socketTimeout配置,sftp协议增加connectionTimeout配置
FTP输出插件改进:增加生成文件异常上传FTP机制,默认同步发送。数据量比较多,同时切割文件的情况下,启用异步发送文件,会显著提升数据采集同步性能
数据采集重大功能扩展:增加指标计算输出插件,提供流批一体指标统计计算功能,支持两种模式的指标计算:
1) 在采集和处理数据时,同时对数据进行大数据指标统计聚合计算,最终将加工后的数据和指标计算结果进行持久化处理
2)只对采集的数据进行指标计算,最终将指标计算结果进行持久化处理
可以将聚合计算结果保存的各种指标数据库:Eleasticsearch/Mongodb/HBase/Clickhouse/Doris/DB(Oracle、Mysql、postgresql、sqlserver等主流关系数据库)
工具可以灵活定制具备各种功能的数据采集统计作业
1) 只采集和处理数据作业
2) 采集和处理数据、指标统计计算混合作业
3) 采集数据只做指标统计计算作业
流批一体化指标计算特点
1) 支持时间维度和非时间维度指标计算
2) 时间维度指标计算:支持指定统计时间窗口,单位到分钟级别
3) 一个指标支持多个维度和多个度量字段计算,多个维度字段值构造成指标的唯一指标key,支持有限基数key和无限基数key指标计算
4) 一个作业可以支持多种类型的指标,每种类型指标支持多个指标计算
5)支持准实时指标统计计算和离线指标统计计算
6)可以从不同的数据输入来源获取需要统计的指标数据,亦可以将指标计算结果保存到各种不同的目标数据源
数据增量采集特点
增量数据采集,默认基于sqlite数据库管理增量采集状态,可以配置到其他关系数据库管理增量采集状态,提供对多种不同数据来源增量采集机制:
1) 基于数字字段增量采集:各种关系数据库、Elasticsearch、MongoDB、Clickhouse等
2) 基于时间字段增量采集:各种关系数据库、Elasticsearch、MongoDB、Clickhouse、HBase等,基于时间增量还可以设置一个截止时间偏移量,比如采集到当前时间前十秒的增量数据,避免漏数据
3) 基于文件内容位置偏移量:文本文件、日志文件基于采集位置偏移量做增量
4) 基于ftp文件增量采集:基于文件级别,下载采集完的文件就不会再采集
数据采集&流批一体化处理使用指南
https://esdoc.bbossgroups.com/#/etl-metrics

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
复杂场景下图数据库的 OLTP 与 OLAP 融合实践
在一些图计算的场景下,我们会遇到同时需要处理 OLTP 和 OLAP 的问题。而本文就给了一个 OLTP 与 OLAP 融合实践的指导思路,希望给你带来一点启发。 Dag Controller 介绍 Dag Controller 是 NebulaGraph 企业版的图系统,经过反复测试无误后已经发布,它主要解决的是 OLTP 和 OLAP 的融合问题,以及复杂场景下的图计算问题。 欢迎大家来详细了解下:https://docs.nebula-graph.com.cn/3.2.1/graph-computing/0.deploy-controller-analytics/。 下面,我对 Dag Controller 做个简单分享,欢迎大家留言一起探讨。 相信大家对 OLTP 和 OLAP 都不陌生,我这里再简单介绍下:OLTP 是一种快速响应、实时在线的一种数据处理方式。与之对应的 OLAP,是一种离线的、复杂场景的数据计算方式。 对 NebulaGraph 来说,OLTP 有多种多样的查询语句,如:GO、MATCH 等。OLAP 有各种各样的图算法,如:PageRank、Louvian...
- 下一篇
PublicCMS 202302 发布,增加可视化维护、Java17 版本
PublicCMS是采用2022年主流技术开发的开源JAVACMS系统。由天津黑核科技有限公司开发,架构科学,轻松支撑上千万数据、千万PV;支持可视化编辑,多维扩展,全文搜索,全站静态化,SSI,动态页面局部静态化,URL规则完全自定义等为您快速建站,建设大规模站点提供强大驱动,也是企业级项目产品原型的良好选择。 本次发布分为V4.0,V5两个版本,其中V4.0最低要求Java8,V5最低要求Java17,CMS功能完全相同;可根据需要下载不同的版本 202302新增功能预览 网站内容快捷维护 页面可视化布局 模板批量搜索替换 程序功能修改: 增加页面可视化修改功能 增加TinyMCE编辑器 增加颜色类型扩展字段 百度编辑器增加视频封面图功能、增加选择已上传视频功能 页面片段增加元数据扩展字段 内容正文增加历史记录保存、增加内容富文本修改对比功能 增加快捷维护功能 增加命名空间指令风格 增加模板搜索批量替换功能 增加普通文件列表批量上传 邮件指令增加附件名附件路径参数 增加脚本执行指令 增加初始化安装时管理员账号密码设置 内容删除功能完善 增加搜索指令扩展字段精确筛选、排除关键词 增...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- Linux系统CentOS6、CentOS7手动修改IP地址
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- SpringBoot2全家桶,快速入门学习开发网站教程
- MySQL8.0.19开启GTID主从同步CentOS8
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- Docker安装Oracle12C,快速搭建Oracle学习环境
- CentOS7安装Docker,走上虚拟化容器引擎之路
- Docker快速安装Oracle11G,搭建oracle11g学习环境