Streaming System 第三章：Watermarks

2018-12-26 1039

简介

本章主要介绍鲁棒的处理乱序数据的核心概念，这些概念的运用使流处理系统超越批处理系统的关键所在。
本章我们从流计算系统的底层机制深入来探讨一下watermark。学习这些机制有助于我们更好理解和使用watermark。我们将讨论watermark如何生成，传播和影响输出结果的时间戳。我们还将解释，watermark如何保证结果的正确性。

本文由《Streaming System》一书第三章的提炼翻译而来，译者才疏学浅，如有错误，欢迎指正。转载请注明出处，侵权必究。

定义

对任何一个持续输入和输出数据的管道来说，我们希望知道如何判断事件时间窗口的结束。窗口结束之后，不会再有这个窗口的数据到来。
判断事件事件窗口结束的第一种方式是，按照处理事件来判断。但是真实世界中，处理事件一定比事件时间晚，并且由于各种原因导致的数据乱序问题，会导致数据进入

微信关注我们

原文链接：https://yq.aliyun.com/articles/682873

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

免费带你体验阿里巴巴旗舰大数据计算产品MaxCompute

什么是MaxCompute？众所周知，MaxCompute是阿里云推出的承载EB级的数据存储能力，百PB级的单日计算能力，公共云覆盖国内外十几个国家和地区，专有云包含城市大脑在内部署超过100+套的阿里巴巴的统一计算平台。官方地址：https://www.aliyun.com/product/odps MaxCompute是真正为大数据而生的企业级云计算产品，其核心是一项基础服务(PaaS)，用于对海量数据进行高性能的分析处理，数据规模越大，计算性能越卓越，在大规模批量计算下性能远超Hadoop Hive，甚至超越了Spark、Impala；单纯从技术上来看，MaxCompute提供了一个在云端的SQL、MapReduce、Graph服务，提供对海量数据的批量计算能力；另外，MaxCompute是基于Serverless架构实现的

2018-12-26

693

Flink入坑指南系列文章，从实际例子入手，一步步引导用户零基础入门实时计算/Flink，并成长为使用Flink的高阶用户。本文属个人原创，仅做技术交流之用，笔者才疏学浅，如有错误，欢迎指正。转载请注明出处，侵权必究。 Flink是什么这是个很玄妙的问题。在以下网站上做了很专业的介绍。 Flink官网：https://flink.apache.org/ Flink中文官网：https://flink-china.org/ 如果你是大数据从业人士，简单理解，在功能上：flink>storm=jstorm=spark streaming。玩过大数据的同学对这些系统应该都不陌生。作为流计算领域的后起之秀，flink架构设计先进，ms级延时，支持Exactly once语义等，逐渐受到广大工程师的青睐，有越来越多的公司开始入坑Flink。如

2018-12-26

744

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Streaming System 第三章：Watermarks

简介