[转载] Spark Structed Streaming执行过程
本文转自:https://www.jianshu.com/p/dcfc0b6ae0ea 本站转载已经过作者授权。任何形式的转载都请联系原作者(薛定谔的猫Plus)获得授权并注明出处。 在Struct Streaming中增加了支持sql处理流数据,在sql包中单独处理,其中StreamExecution是下面提到两处流处理的基类,这个流查询在数据源有新数据到达时会生成一个QueryExecution来执行并将结果输出到指定的Sink(处理后数据存放地)中。 MicroBatchExecution 该部分是小批量处理,默认使用ProcessingTimeExecutor这个trigger定时出发,使用的是系统时钟. case class ProcessingTimeExecutor(processingTime: ProcessingTime

