Flume 使用学习小结
概述
在做埋点数据离线存储到odps中,用到了Flume。一边使用,一边学习了下Flume。其中感受到Flume确实易伸缩、易扩展。其中的组件都可以根据自己的业务特点方便的自定义使用。
Flume可进行大量日志数据采集、聚合和并转移到存储中,并提供数据在流转中的事务机制;
可适用场景:日志--->Flume--->实时计算(如MQ+Storm) 、日志--->Flume--->离线计算(如ODPS、HDFS、HBase)、日志--->Flume--->ElasticSearch等。
Flume架构
Flume主要分为 Source、Channel、Sink三个组件,他们包含在一个Agent中,一个Agent相当于一个独立的application。数据从源头经过Agent的这几个组件最后到达目的地。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
《深入理解Spark:核心思想与源码分析》2次印刷修订内容清单
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/beliefer/article/details/51657146 前言 自从《深入理解Spark:核心思想与源码分析》一书出版以来,陆续收到很多读者的反馈,笔者为此在第1版第2次印刷之前做了一些勘误。为便于购买了老版本书籍的读者查漏补缺,现将勘误内容整理如下。 勘误内容 1、第20页第11行 “中间输出和结果存储在HDFS”改为了“中间输出和结果存储在磁盘”(如图1所示); 图1 2、第20页第12行 “读写HDFS造成”改为了“读写磁盘造成”(如图1所示); 3、第22页第14行 “要选择Java作为”改为了“要选择Scala作为”(如图2所示); 图2 4、第64页 代码清单3-41标题中的“ExecutorLIRLClassLoader的实现”改为了“ExecutorURLClassLoader的实现”(如图3所示); 图3 5、第123页 图4-8 在判断“失败达到最大次数?”与“开始复制”之间加有向箭头,表示当复制失败未达到最大次数还有继续进行复制(如图4所示); 图4 6、第...
- 下一篇
开源大数据周刊-第9期
阿里云E-Mapreduce动态 E-Mapreduce团队1.3.2版本(已经发布): Master HA功能 1.3.3版本 (即将发布) 商业化 1.4版本(正在研发): 用户执行计划及集群运行状态自定义报警 集群整体运行情况的仪表盘 集群的一些专家建议,例如:扩容提醒 集群一键重启 资讯 菜鸟“闹”江湖:物流+大数据,能把广东、江苏GDP都节省出来?中国物流去向何方?菜鸟网络认为,通过推动物流业向智慧转型,未来目标是要把中国社会物流总成本占GDP的比重降低到5%,这将是物流新模式对社会的重大贡献,相当于每年可以节省出广东省和江苏省的GDP总和 大数据,未来已来前日,在成都的一次大数据会上,各位顶级专家都不约而同地提到了大数据还远未成熟的观点。我也很赞同这个观点,大数据在今天,依然属于前沿科学,它在很多行业和细分领域,都还很不成熟。然而,这并不代表
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS7设置SWAP分区,小内存服务器的救世主
- Red5直播服务器,属于Java语言的直播服务器
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- Hadoop3单机部署,实现最简伪集群
- CentOS7,CentOS8安装Elasticsearch6.8.6
- 2048小游戏-低调大师作品