Apache Flink 漫谈系列(04) - State

2018-11-10 934

实际问题

在流计算场景中，数据会源源不断的流入Apache Flink系统，每条数据进入Apache Flink系统都会触发计算。如果我们想进行一个Count聚合计算，那么每次触发计算是将历史上所有流入的数据重新新计算一次，还是每次计算都是在上一次计算结果之上进行增量计算呢？答案是肯定的，Apache Flink是基于上一次的计算结果进行增量计算的。那么问题来了: "上一次的计算结果保存在哪里，保存在内存可以吗？"，答案是否定的，如果保存在内存，在由于网络，硬件等原因造成某个计算节点失败的情况下，上一次计算结果会丢失，在节点恢复的时候，就需要将历史上所有数据（可能十几天，上百天的数据）重新计算一次，所以为了避免这种灾难性的问题发生，Apache Flink 会利用State存储计算结果。本篇将会为大家介绍Apache Flink S

微信关注我们

原文链接：https://yq.aliyun.com/articles/667562

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

0001-CDH网络要求(Lenovo参考架构)

1.组网配置建议的Cloudera组网配置如下图，主要包含数据网络和管理网络。2.数据网络数据网络是用于数据访问的节点之间的私有集群数据互连，比如在集群内的节点之间移动数据，或者将数据导入到CDH集群。CDH集群通常会连接到企业内部的数据网络。需要2个TOR交换机：一个是用作带外管理，一个是用于CDH的数据网络。节点的带外管理至少需要一个1GbE交换机。数据网络的交换机一般为10GbE，具体取决于工作负载。推荐的1GbE交换机是Lenovo RackSwitch G8052。10Gb以太网交换机可以提供额外的I/O带宽，以获得更好的性能。推荐的10GbE交换机是Lenovo System NetworkingRackSwitch 8272。每个节点的两个Broadcom 10GbE端口可以绑定后连接到G8272交换机，从而提高性能或配置HA。数据网络可以配置为使用VLAN。注：无论是工作节点还是管理节点，Cloudera都不支持multi-homing。 3.硬件管理网络硬件管理网络是用于带外硬件管理的1 GbE网络。通过System x3650 M5服务器中的集成管理模...

2018-11-09

801

实际问题很多大数据计算产品，都对用户提供了SQL API，比如Hive, Spark, Flink等，那么SQL作为传统关系数据库的查询语言，是应用在批查询场景的。Hive和Spark本质上都是Batch的计算模式(在《Apache Flink 漫谈系列 - 概述》我们介绍过Spark是Micro Batching模式)，提供SQL API很容易被人理解，但是Flink是纯流（Native Streaming）的计算模式, 流与批在数据集和计算过程上有很大的区别，如下：批查询场景的特点 - 有限数据集，一次查询返回一个计算结果就结束查询流查询场景的特点 - 无限数据集，一次查询不断修正计算结果，查询永远不结束我们发现批与流的查询场景在数据集合和计算过程上都有很大的不同，那么基于Native Streaming模式的Apache F

2018-11-10

1034

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。

Apache Flink 漫谈系列(04) - State

实际问题

0001-CDH网络要求(Lenovo参考架构)

Apache Flink 漫谈系列(06) - 流表对偶(duality)性

相关文章

发表评论

资源下载

Mario

Rocky Linux

Sublime Text

WebStorm

欢迎您来访！