浅谈Flink
浅谈Flink
Apache Flink 是一个面向数据流处理和批量数据处理的分布式的开源计算框架,能够支持流处理和批处理两种应用类型。有着低延迟、Exactly-once 保证,而批处理需要支持高吞吐、高效处理的特点。
Flink 完全支持流处理,也就是说作为流处理看待时,输入数据流是无界的;批处理被作为一种特殊的流处理,只是它的输入数据流被定义为有界的。这与 Spark streaming 不同,Spark streaming 是将流处理视为无限个有界的批处理(microbatch)。
Flink 特点
有状态计算的 Exactly-once 语义。状态是指 flink 能够维护数据在时序上的聚类和聚合,同时它的 checkpoint 机制可以方便快速的做出失败重试;
支持带有事件时间(event time)语义的流处理和窗口处理。事件时间的语义使流计算的结果更加精确,尤其在事件到达无序或者延迟的情况下;
支持高度灵活的窗口(window)操作。支持基于 time、count、session,以及 data-driven 的窗口操作,能很好的对现实环境中的创建的数据进行建模;
轻量的容错处理(fault tolerance)。它使得系统既能保持高的吞吐率又能保证 exactly-once 的一致性。通过轻量的 state snapshots 实现;
支持高吞吐、低延迟、高性能的流处理;
支持 savepoints 机制(一般手动触发),可以将应用的运行状态保存下来;在升级应用或者处理历史数据上,能够做到无状态丢失和最小停机时间;
支持大规模的集群模式,支持 yarn、Mesos。可运行在成千上万的节点上;
支持具有 Backpressure 功能的持续流模型;
Flink 在 JVM 内部实现了自己的内存管理,包括完善的内存架构和 OOM error prevention;
支持迭代计算;
支持程序自动优化:避免特定情况下 Shuffle、排序等昂贵操作,中间结果进行缓存。
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Apache Druid 0.18 发布
Apahce Druid简介 Druid 是一个分布式的、支持实时多维 OLAP 分析的数据处理系统。它既支持高速的数据实时摄入处理,也支持实时且灵活的多维数据分析查询。因此 Druid 最常用的场景就是大数据背景下、灵活快速的多维 OLAP 分析。 另外,Druid 还有一个关键的特点:它支持根据时间戳对数据进行预聚合摄入和聚合分析,因此也有用户经常在有时序数据处理分析的场景中用到它。 本次重点更新 Join support Druid开始支持Join 查询。Join是数据库重要特性之一,加入Join后,查询方式将更加简单。 内联查询 topN | (join datasource) / \ (table datasource) groupBy 查询通道和优先级 新增配置 druid.server.http.maxSubqueryRows 配置控制在Broker内存中实现的最大行数。 support for Java 11 可以在Java 11上运行。 更新信息:https://github.com/apache/druid/releases/tag/druid-0.18...
- 下一篇
才言:中台战略下,企业组织如何顺应商业变迁 | 数智加速度02课回顾
DT时代的浪潮席卷而来,「数智化转型」显然已不只是信息化部门或业务部门能独立承担的「一个项目」。企业需要从战略层面站定立场,建立决心,与之相配合的,则是一个组织架构和技术架构的变革升级。 4月15日,业界首个数据中台项目实践者才言,在数据中台建设实战系列课程「数智加速度」第二课中带来分享——《企业数智化转型的商业模式调整与组织变革》,从组织与商业模式视角破解难题。 才言,奇点云首席战略官,「数据交换区」专利操盘手,曾主导建立过阿里云「数加」的23个工作室。 在这一课中,才言以自己的十余年数据实践经历总结了「在线」、「数据大」、「机器分类人」、「服务业分工精细」、「平台经济崛起」五大浪潮,分析了浪潮之下企业如何站定数智化转型战略、重塑商业模式,并对随之而来的组织结构变革调整等问题进行了讨论。 下文为分享节选: 01 数据对于企业组织而言,有什么意义? 在企业组织至今160余年的历史长河中,从传统时代到今天我们的智能时代,数据对于组织来说是什么意义,起到了什么作用? 可以发现在科学管理时代,计划和执行开始分离。同时,计划与执行之间的沟壑也在产生巨大的浪费,这种浪费在电气时代与信息时代逐步由...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- CentOS8编译安装MySQL8.0.19
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- CentOS7,CentOS8安装Elasticsearch6.8.6
- MySQL8.0.19开启GTID主从同步CentOS8
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- Windows10,CentOS7,CentOS8安装Nodejs环境