Structured Streaming VS Flink-低调大师

Structured Streaming VS Flink

2019-01-19 1100

Flink是标准的实时处理引擎，而且Spark的两个模块Spark Streaming和Structured Streaming都是基于微批处理的，不过现在Spark Streaming已经非常稳定基本都没有更新了，然后重点移到spark sql和structured Streaming了。

Flink作为一个很好用的实时处理框架，也支持批处理，不仅提供了API的形式，也可以写sql文本。这篇文章主要是帮着大家对于Structured Streaming和Flink的主要不同点。

1. 运行模型

Structured Streaming 的task运行也是依赖driver 和 executor，当然driver和excutor也还依赖于集群管理器Standalone或者yarn等。可以用下面一张图概括：

Flink的Task依赖jobma

微信关注我们

原文链接：https://yq.aliyun.com/articles/688213

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Adaptive Execution如何让Spark SQL更高效更好用？

本文转发自技术世界，原文链接　http://www.jasongj.com/spark/adaptive_execution/ 1 背景 Spark SQL / Catalyst 和 CBO 的优化，从查询本身与目标数据的特点的角度尽可能保证了最终生成的执行计划的高效性。但是执行计划一旦生成，便不可更改，即使执行过程中发现后续执行计划可以进一步优化，也只能按原计划执行； CBO 基于统计信息生成最优执行计划，需要提前生成统计信息，成本较大，且不适合数据更新频繁的场景； CBO 基于基础表的统计信息与操作对数据的影响推测中间结果的信息，只是估算，不够精确。本文介绍的 Adaptive Execution 将可以根据执行过程中的中间数据优化后续执行，从而提高整体执行效率。核心在于两点：执行计划可动态调整调整的依据是中间结果的精确统计信息 2

2019-01-19

813

开源 ES 实例健康状态首先，先介绍下开源 Elasticsearch 的三种健康状态：绿色、黄色和红色。在分片层面，绿色：所有的主分片和副本分片都已分配。你的集群是 100% 可用的。黄色：所有主分片都已经分配，但至少有一个副本分片未被分配。此时，搜索结果是正确、完整的，不会有数据丢失。但高可用性已经被弱化，有丢失数据的风险。应尽快介入处理。红色：集群中至少有一个主分片（以及它的所有副本）未被分配，意味着搜索时将缺少数据，至返回部分数据；同时，要写入该分片的请求会返回异常。这时候您可能会问：“如果集群中有的索引是绿色，有的是黄色，这时候该怎么决定集群的健康度呢？” 集群的健康状态由最差的索引决定，索引的健康状态由最差的分片决定。阿里云 ES 实例的健康状态本文主要从磁盘占用达到高水位问题来谈谈 ES 集群健康状态。大家都知道，阿里云 ES 在一定前提下，重启时是可以持续提供服务的。前提是： 1.阿里云ES实例健康度必须确保是绿色状态 2.至少包含1个副本注意：不排除节点在重启期间，对应CPU和内存使用率会存在临时突增，服务可能会出现抖动，正常情况下过一段时间后会...

2019-01-19

1015

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。