用DolphinScheduler轻松实现Flume数据采集任务自动化！-低调大师

用DolphinScheduler轻松实现Flume数据采集任务自动化！

2024-04-24 402

转载自天地风雷水火山泽

目的

因为我们的数仓数据源是Kafka，离线数仓需要用Flume采集Kafka中的数据到HDFS中。在实际项目中，我们不可能一直在Xshell中启动Flume任务，一是因为项目的Flume任务很多，二是一旦Xshell页面关闭Flume任务就会停止，这样非常不方便，因此必须在后台启动Flume任务。所以经过测试后，我发现海豚调度器也可以启动Flume任务。

海豚调度Flume任务配置

（一）Flume在Linux中的路径

（二）Flume任务文件在Linux中的位置以及任务文件名

（三）在海豚中配置运行脚本

#!/bin/bash
source /etc/profile

/usr/local/hurys/dc_env/flume/flume190/bin/flume-ng agent -n a1 -f /usr/local/hurys/dc_env/flume/flume190/conf/statistics.properties

注意：/usr/local/hurys/dc_env/flume/flume190/为Flume在Linux中的安装，根据自己安装路径进行调整（四）海豚任务配置好后就可以启动海豚任务

（五）在HDFS对应文件夹中验证是否采集到数据可以看到，Flume采集Kafka数据成功写入到HDFS中，成功实现用Apache DolphinScheduler执行Flume任务的目的！
原文链接： https://blog.csdn.net/tiantang2renjian/article/details/136399112

本文由白鲸开源科技提供发布支持！

微信关注我们

原文链接：https://my.oschina.net/dailidong/blog/11054634

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

12 个监控指标确保 API 策略成功

原文作者：Andrew Stiefel of F5 原文链接：12 个监控指标确保 API 策略成功转载来源：NGINX 开源社区 NGINX 唯一中文官方社区，尽在nginx.org.cn 随着公司采用API 优先的设计实践来构建现代应用，衡量这些 API 的运行性能和价值成为当务之急。构建一个可明确定义 API 指标并将其与关键绩效指标 (KPI) 挂钩的框架是确保 API 策略成功的最重要步骤之一。通常情况下，KPI 与具体目标紧密相关。它们有着明确的时间框架，并与 API 策略需要交付的成果相匹配。相比之下，API 指标是重要的数据点。并非所有指标都是 KPI，但每个 KPI 都基于指标。那么您应该如何着手呢？首先，您需要从一开始就明确 API 策略的目标，然后再选择与该目标匹配的指标。切记每个团队需要根据对自身的重要性和对业务的必要性衡量并跟踪不同的指标。概括地说，公司可跟踪三大类 API 指标，并且不同类别的指标反映不同的问题：运维指标——API 是否提供您所需的稳定性、可靠性和性能？采纳指标——开发人员是否采纳使用您的 API？产品指标——API 正如何支...

2024-04-24

339

深入剖析JVM的OOM | 内存溢出如何影响JVM运行及应对策略在Java开发的世界中，开发者们经常与各种异常打交道，其中OOM（OutOfMemoryError）异常尤为引人关注。 OOM异常是导致JVM报错以及出现异常的常见原因之一，了解OOM异常的产生原因和处理方法对于Java开发者来说至关重要，通过合理的内存管理和优化技术，我们可以降低OOM异常的发生概率，提高程序的稳定性和性能。首先，我们来深入了解OOM异常，是Java虚拟机在尝试分配内存但无法满足请求时抛出的一种严重错误。 OOM，即“内存溢出错误”，JVM在面临内存资源不足时的一种自我保护机制。了解和识别导致内存溢出的具体原因，对于优化Java应用程序的性能和稳定性至关重要。开发者应当关注内存管理的最佳实践，以避免这些常见的内存溢出场景。它通常发生在以下几种情况：最常见的是堆内存耗尽。随着对象的持续创建，如果它们因为某些原因（例如内存泄漏）而无法被垃圾收集器有效回收，那么堆内存最终会被消耗殆尽。这种情况往往是因为代码中存在内存管理不当的问题。元空间或方法区内存也可能耗尽。当系统加载大量的类和方法时，这部分内存资...

2024-04-24

360

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。