01. Spark Streaming实时流处理学习——初识实时流处理
1. 初识实时流处理
1.1. 业务现状分析
统计主站每个(指定)课程访问的客户、地域信息分布
地域:ip转换
客户端:useragent获取
如上两个操作:采用离线(Spark/MapReduce)的方式进行统计
实现步骤
课程编号、IP信息、useragent
进行相应的统计分析操作:MapReduce/Spark
项目架构
日志收集:Flume
离线分析:MapReduce/Spark
统计结果图形化展示
问题
1小时级别
10分钟
5分钟
1分钟
秒级别
基于Hadoop的实现方案
存在的问题?
如何解决????===> 实时流处理框架
1.2. 业务现状分析
实时流处理产生背景
时效性高
数据量大
实时流处理概述
实时计算
流式计算
实时流式计算
离线计算与实时计算对比
- 数据来源
离线:HDFS 历史数据 数据量比较大
实时:消息队列(Kafka),实时新增/修改记录过来的某一笔数据
- 处理过程
离线:MapReduce:map + reduce
实时:Spark(DStream/SS)
- 处理速度
离线:慢
实时:快速
- 进程
离线:启动+销毁
实时:7*24
实时流处理框架对比
- Apache Storm
- Apache Spark Streaming
微批处理框架 - IBM Stream
- Yahoo! S4
- Linkin Kafka
- Flink
实时流处理架构与技术选型
实时流处理在企业中的应用
-
电信行业
短信发布用户流量使用情况,通话计费等场景(需要实时,流式处理)。 流量陷阱监控软件,实时流式监控流氓流量盗取软件。
-
电商行业
电商平台中的实时推荐系统,根据用户目前正在访问的资料,实时推荐相关产品链接,或者推广方案。
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Spark Streaming实时流处理学习
目录 1.初识实时流处理 2.分布式日志收集框架Flume 3.分布式发布订阅消息系统Kafka 4.实战环境搭建 5.Spark Streaming入门 6.Spark Streaming核心概念与编程 7.Spark Streaming进阶与案例实战 8.Spark Streaming整合Flume 9.Spark Streaming整合Kafka 10.Spark Streaming整合Flume&Kafka打造通用流处理基础 11.Spark Streaming项目实战 12.可视化实战
- 下一篇
02. Spark Streaming实时流处理学习——分布式日志收集框架Flume
2. 分布式日志收集框架Flume 2.1 业务现状分析 如上图,大量的系统和各种服务的日志数据持续生成。用户有了很好的商业创意想要充分利用这些系统日志信息。比如用户行为分析,轨迹跟踪等等。如何将日志上传到Hadoop集群上?对比方案存在什么问题,以及有什么优势? 方案1: 容错,负载均衡,高延时等问题如何消除? 方案2: Flume框架 2.2 Flume概述 flume官网 http://flume.apache.orgFlume is a distributed, reliable, and available service for efficiently collecting(收集), aggregating(聚合), and moving(移动)large amounts of log data. It has a simple and flexible architecture based on streaming data flows. It is robust and fault tolerant with tunable reliability mechanisms...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Mario游戏-低调大师作品
- CentOS关闭SELinux安全模块
- CentOS7,CentOS8安装Elasticsearch6.8.6
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- Docker安装Oracle12C,快速搭建Oracle学习环境
- Red5直播服务器,属于Java语言的直播服务器
- CentOS8编译安装MySQL8.0.19
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- CentOS6,CentOS7官方镜像安装Oracle11G