《Storm企业级应用:实战、运维和调优》——3.10 数据流模型
本节书摘来自华章计算机《Storm企业级应用:实战、运维和调优》一书中的第3章,第3.10节,作者:马延辉 陈书美 雷葆华著, 更多章节内容可以访问云栖社区“华章计算机”公众号查看。
3.10 数据流模型
数据流模型是由数据流、数据处理任务、数据节点、数据处理任务实例等构成的一种数据模型。本节将介绍的数据流模型如图3-18所示。
分布式流处理系统由多个数据处理节点(node)组成,每个数据处理节点上运行有多个数据任务实例,每个数据任务实例属于一个数据任务定义。任务实例是在任务定义的基础上,添加了输入流过滤条件和强制输出周期属性后,可实际推送到数据处理节点上运行的逻辑实体;数据任务定义包含输入数据流、数据处理逻辑和输出数据流属性。
3.10.1 数据流模型简介
首先介绍数据流模型中的一些重要概念。
1.?数据流
数据流是时间分布和数量上无限的一系