Adaptive Execution如何让Spark SQL更高效更好用？-低调大师

Adaptive Execution如何让Spark SQL更高效更好用？

2019-01-19 813

本文转发自技术世界，原文链接　http://www.jasongj.com/spark/adaptive_execution/

1 背景

Spark SQL / Catalyst 和 CBO 的优化，从查询本身与目标数据的特点的角度尽可能保证了最终生成的执行计划的高效性。但是

执行计划一旦生成，便不可更改，即使执行过程中发现后续执行计划可以进一步优化，也只能按原计划执行；
CBO 基于统计信息生成最优执行计划，需要提前生成统计信息，成本较大，且不适合数据更新频繁的场景；
CBO 基于基础表的统计信息与操作对数据的影响推测中间结果的信息，只是估算，不够精确。

本文介绍的 Adaptive Execution 将可以根据执行过程中的中间数据优化后续执行，从而提高整体执行效率。核心在于两点：

执行计划可动态调整
调整的依据是中间结果的精确统计信息

2

微信关注我们

原文链接：https://yq.aliyun.com/articles/688212

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

HBase+Spark技术双周刊第四期

直播往期回顾——视频回看及PPT下载 Solr增强HBase检索能力基础介绍及场景在本期视频中，阿里高级开发工程师天斯介绍了Solr如何增强HBase检索能力，并通过示例帮助大家快速上手HBase+Solr查询应用。 HBase钉钉群直播预告 1月22日 Phoenix 全局索引原理与实践张赟 1月29日 Spark on rds/MongoDB/HBase/Redis/OSS多数据源云覆阿里云栖开发者沙龙——线下活动【1月18日下午1:30】阿里云栖开发者沙龙北京专场—互联网下半场的角逐：玩转轻资产的大数据服务【1月19日下午1:30】阿里云栖开发者沙龙合肥专场：高并发企业级应用架构实践分享推荐专家沐远——阿里云数据库技术专家沐远，专注大数据分布式计算数据库领域，研发Spark及自主研发内存计算，目前为广大公有云用户

2019-01-18

742

Flink是标准的实时处理引擎，而且Spark的两个模块Spark Streaming和Structured Streaming都是基于微批处理的，不过现在Spark Streaming已经非常稳定基本都没有更新了，然后重点移到spark sql和structured Streaming了。 Flink作为一个很好用的实时处理框架，也支持批处理，不仅提供了API的形式，也可以写sql文本。这篇文章主要是帮着大家对于Structured Streaming和Flink的主要不同点。 1.运行模型 Structured Streaming 的task运行也是依赖driver 和 executor，当然driver和excutor也还依赖于集群管理器Standalone或者yarn等。可以用下面一张图概括： Flink的Task依赖jobma

2019-01-19

1099

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。