Flink实战(四) - DataSet API编程
1 你将学到
◆ DataSet API开发概述
◆ 计数器
◆ DataSource
◆ 分布式缓存
◆ Transformation
◆ Sink
2 Data Set API 简介
Flink中的DataSet程序是实现数据集转换(例如,过滤,映射,连接,分组)的常规程序.
最初从某些Source源创建数据集(例如,通过读取文件或从本地集合创建)
结果通过sink返回,接收器可以例如将数据写入(分布式)文件或标准输出(例如命令行终端)
Flink程序可以在各种环境中运行,单机运行或嵌入其他程序中
执行可以在本地JVM中执行,也可以在集群机器上执行.
- 有关Flink API基本概念的介绍,请参阅本系列的上一篇
为了创建自己的Flink DataSet程序,鼓励从Flink程序的解剖开始,逐步添加自己的转换!
