数据采集 ETL 工具 Elasticsearch-datatran v6.3.6 发布
数据采集ETL工具 Elasticsearch-datatran v6.3.6 发布,本版本提供大家期待已久的记录切割功能和ftp文件下载采集功能。
Elasticsearch-datatran 由 bboss 开源的数据采集同步ETL工具,提供数据采集、数据处理清洗和数据入库功能。支持在Elasticsearch、关系数据库(mysql,oracle,db2,sqlserver、达梦等)、Mongodb、HBase、Hive、Kafka、文本文件、SFTP/FTP多种数据源之间进行海量数据同步;支持本地/ftp日志文件实时增量采集到kafka/elasticsearch/database。
Elasticsearch版本兼容性:支持各种Elasticsearch版本(1.x,2.x,5.x,6.x,7.x,+)之间相互数据迁移
v6.3.6 变更记录
- 数据同步改进:增加记录切割功能,可以将指定的字段拆分为多条新记录,新产生的记录会自动继承原记录其他字段数据,亦可以指定覆盖原记录字段值
-
数据同步功能:扩展filelog插件,增加对ftp日志文件下载采集支持,支持实时监听下载ftp目录下生成的日志文件,将ftp文件中的数据采集写入elasticsearch、数据库、推送kafka、写入新的日志文件,参考案例: FtpLog2ESETLScheduleDemo.java FtpLog2ESDemo
-
数据同步功能:支持备份采集完毕日志文件功能,可以指定备份文件保存时长,定期清理超过时长文件
-
数据同步功能:提供自定义处理采集数据功能,可以自行将采集的数据按照自己的要求进行处理到目的地,支持数据来源包括:database,elasticsearch,kafka,mongodb,hbase,file,ftp等,想把采集的数据保存到什么地方,有自己实现CustomOutPut接口处理即可
FileLog2DummyExportBuilder importBuilder = new FileLog2DummyExportBuilder(); //自己处理数据 importBuilder.setCustomOutPut(new CustomOutPut() { @Override public void handleData(TaskContext taskContext, List<CommonRecord> datas) { //You can do any thing here for datas for(CommonRecord record:datas){ Map<String,Object> data = record.getDatas(); logger.info(SimpleStringUtil.object2json(data)); } } });
自定义处理采集数据功能典型的应用场景就是对接大数据流处理,直接将采集的数据交给一些流处理框架,譬如与我们内部自己开发的大数据流处理框架对接,效果简直不要不要的,哈哈。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
酷瓜云课堂 v1.4.6 发布,开课搞知识付费,免费商用
更新内容 完善首页文章缓存的获取条件 完善热门专题的获取条件 优化课程章节列表逻辑 更新教学中心我的课程获取逻辑 修正后台点播和面授类型课时列表宽度未100%铺满问题 完善添加积分礼品的逻辑 修正编辑课程类型礼品时编辑器初始化js报错 修正非root用户后台添加用户时报错 修正微信等第三方登录code被重用问题 手机端访问web端地址自动跳转到手机端 增加锁定用户逻辑(会自动登出锁定用户) 增加虚假课程订阅数(用于营销效果) 项目介绍 酷瓜云课堂,依托腾讯云基础服务架构,采用 C 扩展框架 Phalcon 开发,GPL-2.0 开源协议,致力开源网课系统,开源网校系统,开源知识付费系统。 系统功能 实现了点播、直播、专栏、面授、会员、群组、积分、秒杀等,100% 真开源在线教育解决方案,可以免费商用。 托管仓库 gitee 仓库 github 仓库 意见反馈 在线反馈(推荐) 官方论坛(推荐)
- 下一篇
Elasticsearch Rest Client bboss v6.3.6 发布
The best Elasticsearch HighlevelRest Client API-----bbossv6.3.6 发布。 bboss elasticsearch 是一套基 于query dsl 语法操作和访问分布式搜索引擎 elasticsearch 的 o/r mapping 高性能java开发库,底层基于 es restful api。 主要功能特色 ORM和DSL二者兼顾,类mybatis方式操作ElasticSearch,提供丰富的开发API和开发Demo 采用XML文件配置和管理检索dsl脚本,简洁而直观;只需编写好dsl,放入xml配置文件,通过bboss api完成相应的检索查询操作即可;提供丰富的逻辑判断语法,在dsl脚本中可以使用变量、脚本片段、foreach循环、逻辑判断、注释;基于可扩展DSL配置管理机制可以非常方便地实现数据库、redis等方式管理dsl;配置管理的dsl语句支持在线修改、自动热加载,支持在线控制将运行时dsl打印到日志文件功能,开发和调试非常方便 提供Elasticsearch集群节点自动负载均衡和容灾恢复机制,Elasticse...
相关文章
文章评论
共有0条评论来说两句吧...