Flink SQL 功能解密系列 —— 解决热点问题的大杀器MiniBatch
阿里巴巴实时计算团队-墨简 在Blink的流式任务中,State相关的操作通常都会成为整个任务的性能瓶颈。实时计算部-查询和优化团队开发了MiniBatch功能,大幅降低了State操作的开销,在今年的双11中,几乎所有适用的任务都启用了MiniBatch功能。 MiniBatch的一个典型场景-无限流上的GroupBy 在Blink-SQL中,通常会使用无限流的GroupBy来完成去重或者聚合计算,一个简单的例子如下 SELECT a, count(b) FROM dual GROUP BY a 标准实现的计算方式 MiniBatch实现的计算方式 StateBackend的Batch操作 从上图可知,开启MiniBatch之后要求State能支持Batch读写,目前默认的RocksDBStateBackend暂时不支持,Batch的读写实际是
