用DolphinScheduler轻松实现Flume数据采集任务自动化!
转载自天地风雷水火山泽
目的
因为我们的数仓数据源是Kafka,离线数仓需要用Flume采集Kafka中的数据到HDFS中。 在实际项目中,我们不可能一直在Xshell中启动Flume任务,一是因为项目的Flume任务很多,二是一旦Xshell页面关闭Flume任务就会停止,这样非常不方便,因此必须在后台启动Flume任务。 所以经过测试后,我发现海豚调度器也可以启动Flume任务。
海豚调度Flume任务配置
(一)Flume在Linux中的路径
(二)Flume任务文件在Linux中的位置以及任务文件名
(三)在海豚中配置运行脚本
#!/bin/bash source /etc/profile /usr/local/hurys/dc_env/flume/flume190/bin/flume-ng agent -n a1 -f /usr/local/hurys/dc_env/flume/flume190/conf/statistics.properties
注意:/usr/local/hurys/dc_env/flume/flume190/为Flume在Linux中的安装,根据自己安装路径进行调整 (四)海豚任务配置好后就可以启动海豚任务
(五)在HDFS对应文件夹中验证是否采集到数据 可以看到,Flume采集Kafka数据成功写入到HDFS中,成功实现用Apache DolphinScheduler执行Flume任务的目的!
原文链接: https://blog.csdn.net/tiantang2renjian/article/details/136399112
本文由 白鲸开源科技 提供发布支持!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
12 个监控指标确保 API 策略成功
原文作者:Andrew Stiefel of F5 原文链接:12 个监控指标确保 API 策略成功 转载来源:NGINX 开源社区 NGINX 唯一中文官方社区 ,尽在nginx.org.cn 随着公司采用API 优先的设计实践来构建现代应用,衡量这些 API 的运行性能和价值成为当务之急。构建一个可明确定义 API 指标并将其与关键绩效指标 (KPI) 挂钩的框架是确保 API 策略成功的最重要步骤之一。 通常情况下,KPI 与具体目标紧密相关。它们有着明确的时间框架,并与 API 策略需要交付的成果相匹配。相比之下,API 指标是重要的数据点。并非所有指标都是 KPI,但每个 KPI 都基于指标。 那么您应该如何着手呢?首先,您需要从一开始就明确 API 策略的目标,然后再选择与该目标匹配的指标。切记每个团队需要根据对自身的重要性和对业务的必要性衡量并跟踪不同的指标。 概括地说,公司可跟踪三大类 API 指标,并且不同类别的指标反映不同的问题: 运维指标——API 是否提供您所需的稳定性、可靠性和性能? 采纳指标——开发人员是否采纳使用您的 API? 产品指标——API 正如何支...
- 下一篇
深入剖析JVM的OOM | 内存溢出如何影响JVM运行及应对策略
深入剖析JVM的OOM | 内存溢出如何影响JVM运行及应对策略 在Java开发的世界中,开发者们经常与各种异常打交道,其中OOM(OutOfMemoryError)异常尤为引人关注。 OOM异常是导致JVM报错以及出现异常的常见原因之一,了解OOM异常的产生原因和处理方法对于Java开发者来说至关重要,通过合理的内存管理和优化技术,我们可以降低OOM异常的发生概率,提高程序的稳定性和性能。 首先,我们来深入了解OOM异常,是Java虚拟机在尝试分配内存但无法满足请求时抛出的一种严重错误。 OOM,即“内存溢出错误”,JVM在面临内存资源不足时的一种自我保护机制。了解和识别导致内存溢出的具体原因,对于优化Java应用程序的性能和稳定性至关重要。 开发者应当关注内存管理的最佳实践,以避免这些常见的内存溢出场景。它通常发生在以下几种情况: 最常见的是堆内存耗尽。随着对象的持续创建,如果它们因为某些原因(例如内存泄漏)而无法被垃圾收集器有效回收,那么堆内存最终会被消耗殆尽。这种情况往往是因为代码中存在内存管理不当的问题。 元空间或方法区内存也可能耗尽。当系统加载大量的类和方法时,这部分内存资...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- SpringBoot2全家桶,快速入门学习开发网站教程
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- 2048小游戏-低调大师作品
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- CentOS7,8上快速安装Gitea,搭建Git服务器
- CentOS6,CentOS7官方镜像安装Oracle11G
- CentOS关闭SELinux安全模块