Spark-SparkSQL深入学习系列四（转自OopsOutOfMemory）-低调大师

Spark-SparkSQL深入学习系列四（转自OopsOutOfMemory）

2016-05-10 528

前几篇文章介绍了Spark SQL的Catalyst的核心运行流程、SqlParser，和Analyzer，本来打算直接写Optimizer的，但是发现忘记介绍TreeNode这个Catalyst的核心概念，介绍这个可以更好的理解Optimizer是如何对Analyzed Logical Plan进行优化的生成Optimized Logical Plan，本文就将TreeNode基本架构进行解释。

一、TreeNode类型

TreeNode Library是Catalyst的核心类库，语法树的构建都是由一个个TreeNode组成。TreeNode本身是一个BaseType <: TreeNode[BaseType] 的类型，并且实现了Product这个trait，这样可以存放异构的元素了。
TreeNode有三种形态： BinaryNode 、 UnaryNode 、 Leaf Node .
在Catalyst里，这些Node都是继承自Logical Plan，可以说每一个TreeNode节点就是一个Logical Plan(包含Expression）（直接继承自TreeNode）

主要继承关系类图如下：

1、BinaryNode

二元节点，即有左右孩子的二叉节点

[java]view plain copy 
   
 [[TreeNode]] that has two children, [[left]] and [[right]].   
 trait BinaryNode[BaseType <: TreeNode[BaseType]] {   
   def left: BaseType   
   def right: BaseType   
   def children = Seq(left, right)   
 }   
 abstract class BinaryNode extends LogicalPlan with trees.BinaryNode[LogicalPlan] {   
   self: Product =>   
 }   

节点定义比较简单，左孩子，右孩子都是BaseType。 children是一个Seq（left, right）

下面列出主要继承二元节点的类，可以当查询手册用：）

这里提示下平常常用的二元节点：Join和Union

2、UnaryNode

一元节点，即只有一个孩子节点

[java]view plain copy 
   
  A [[TreeNode]] with a single [[child]].   
 trait UnaryNode[BaseType <: TreeNode[BaseType]] {   
   def child: BaseType   
   def children = child :: Nil   
 }   
 abstract class UnaryNode extends LogicalPlan with trees.UnaryNode[LogicalPlan] {   
   self: Product =>   
 }   

下面列出主要继承一元节点的类，可以当查询手册用：）

常用的二元节点有，Project，Subquery，Filter，Limit ...等

3、Leaf Node

叶子节点，没有孩子节点的节点。

[java]view plain copy 
   
 A [[TreeNode]] with no children.   
 trait LeafNode[BaseType <: TreeNode[BaseType]] {   
   def children = Nil   
 }   
 abstract class LeafNode extends LogicalPlan with trees.LeafNode[LogicalPlan] {   
   self: Product =>   
   // Leaf nodes by definition cannot reference any input attributes.   
   override def references = Set.empty   
 }   

下面列出主要继承叶子节点的类，可以当查询手册用：）

提示常用的叶子节点： Command类系列，一些Funtion函数，以及Unresolved Relation...etc.

二、TreeNode 核心方法

简单介绍一个TreeNode这个类的属性和方法

currentId
一颗树里的TreeNode有个唯一的id，类型是Java.util.concurrent.atomic.AtomicLong原子类型。

[java]view plain copy 
   
 private val currentId = new java.util.concurrent.atomic.AtomicLong   
 protected def nextId() = currentId.getAndIncrement()   

sameInstance
判断2个实例是否是同一个的时候，只需要判断TreeNode的id。

[java]view plain copy 
   
 def sameInstance(other: TreeNode[_]): Boolean = {   
   this.id == other.id   
 }   

fastEquals ，更常用的一个快捷的判定方法，没有重写Object.Equals，这样防止scala编译器生成case class equals 方法

[java]view plain copy 
   
 def fastEquals(other: TreeNode[_]): Boolean = {   
    sameInstance(other) || this == other   
  }   

map，flatMap，collect都是递归的对子节点进行应用PartialFunction，其它方法还有很多，篇幅有限这里不一一描述了。

2.1、核心方法 transform 方法

transform该方法接受一个PartialFunction，就是就是前一篇文章Analyzer里提到的Batch里面的Rule。
是会将Rule迭代应用到该节点的所有子节点，最后返回这个节点的副本（一个和当前节点不同的节点，后面会介绍，其实就是利用反射来返回一个修改后的节点）。
如果rule没有对一个节点进行PartialFunction的操作，就返回这个节点本身。

来看一个例子：

[java]view plain copy 
   
 object GlobalAggregates extends Rule[LogicalPlan] {   
   def apply(plan: LogicalPlan): LogicalPlan = plan transform {   //apply方法这里调用了logical plan（TreeNode） 的transform方法来应用一个PartialFunction。   
     case Project(projectList, child) if containsAggregates(projectList) =>   
       Aggregate(Nil, projectList, child)   
   }   
   def containsAggregates(exprs: Seq[Expression]): Boolean = {   
     exprs.foreach(_.foreach {   
       case agg: AggregateExpression => return true   
       case _ =>   
     })   
     false   
   }   
 }   

这个方法真正的调用是transformChildrenDown，这里提到了用先序遍历来对子节点进行递归的Rule应用。
如果在对当前节点应用rule成功，修改后的节点afterRule，来对其children节点进行rule的应用。

transformDown方法：

[java]view plain copy 
   
 /**  
 * Returns a copy of this node where `rule` has been recursively applied to it and all of its  
 * children (pre-order). When `rule` does not apply to a given node it is left unchanged.  
 * @param rule the function used to transform this nodes children  
 */   
 ef transformDown(rule: PartialFunction[BaseType, BaseType]): BaseType = {   
  val afterRule = rule.applyOrElse(this, identity[BaseType])   
  // Check if unchanged and then possibly return old copy to avoid gc churn.   
  if (this fastEquals afterRule) {   
    transformChildrenDown(rule)  //修改前节点this.transformChildrenDown(rule)   
  } else {   
    afterRule.transformChildrenDown(rule) //修改后节点进行transformChildrenDown   
  }   

最重要的方法transformChildrenDown:
对children节点进行递归的调用PartialFunction，利用最终返回的newArgs来生成一个新的节点，这里调用了makeCopy()来生成节点。

transformChildrenDown方法：

[java]view plain copy 
   
  /**  
  * Returns a copy of this node where `rule` has been recursively applied to all the children of  
  * this node.  When `rule` does not apply to a given node it is left unchanged.  
  * @param rule the function used to transform this nodes children  
  */   
 def transformChildrenDown(rule: PartialFunction[BaseType, BaseType]): this.type = {   
   var changed = false   
   val newArgs = productIterator.map {   
     case arg: TreeNode[_] if children contains arg =>   
       val newChild = arg.asInstanceOf[BaseType].transformDown(rule) //递归子节点应用rule   
       if (!(newChild fastEquals arg)) {   
         changed = true   
         newChild   
       } else {   
         arg   
       }   
     case Some(arg: TreeNode[_]) if children contains arg =>   
       val newChild = arg.asInstanceOf[BaseType].transformDown(rule)   
       if (!(newChild fastEquals arg)) {   
         changed = true   
         Some(newChild)   
       } else {   
         Some(arg)   
       }   
     case m: Map[_,_] => m   
     case args: Traversable[_] => args.map {   
       case arg: TreeNode[_] if children contains arg =>   
         val newChild = arg.asInstanceOf[BaseType].transformDown(rule)   
         if (!(newChild fastEquals arg)) {   
           changed = true   
           newChild   
         } else {   
           arg   
         }   
       case other => other   
     }   
     case nonChild: AnyRef => nonChild   
     case null => null   
   }.toArray   
   if (changed) makeCopy(newArgs) else this //根据作用结果返回的newArgs数组，反射生成新的节点副本。   
 }   

makeCopy方法，反射生成节点副本

[java]view plain copy 
   
 /**  
   * Creates a copy of this type of tree node after a transformation.  
   * Must be overridden by child classes that have constructor arguments  
   * that are not present in the productIterator.  
   * @param newArgs the new product arguments.  
   */   
  def makeCopy(newArgs: Array[AnyRef]): this.type = attachTree(this, "makeCopy") {   
    try {   
      val defaultCtor = getClass.getConstructors.head  //反射获取默认构造函数的第一个   
      if (otherCopyArgs.isEmpty) {   
        defaultCtor.newInstance(newArgs: _*).asInstanceOf[this.type] //反射生成当前节点类型的节点   
      } else {   
        defaultCtor.newInstance((newArgs ++ otherCopyArgs).toArray: _*).asInstanceOf[this.type] //如果还有其它参数，++   
      }   
    } catch {   
      case e: java.lang.IllegalArgumentException =>   
        throw new TreeNodeException(   
          this, s"Failed to copy node.  Is otherCopyArgs specified correctly for $nodeName? "   
            + s"Exception message: ${e.getMessage}.")   
    }   
  }   

三、TreeNode实例

现在准备从一段sql来出发，画一下这个spark sql的整体树的transformation。

SELECT * FROM (SELECT * FROM src) a join (select * from src)b on a.key=b.key

首先，我们先执行一下，在控制台里看一下生成的计划：

[java]view plain copy 
    
 <span style="font-size:12px;">sbt/sbt hive/console   
 Using /usr/java/default as default JAVA_HOME.   
 Note, this will be overridden by -java-home if it is set.   
 [info] Loading project definition from /app/hadoop/shengli/spark/project/project   
 [info] Loading project definition from /app/hadoop/shengli/spark/project   
 [info] Set current project to root (in build file:/app/hadoop/shengli/spark/)   
 [info] Starting scala interpreter...   
 [info]    
 import org.apache.spark.sql.catalyst.analysis._   
 import org.apache.spark.sql.catalyst.dsl._   
 import org.apache.spark.sql.catalyst.errors._   
 import org.apache.spark.sql.catalyst.expressions._   
 import org.apache.spark.sql.catalyst.plans.logical._   
 import org.apache.spark.sql.catalyst.rules._   
 import org.apache.spark.sql.catalyst.types._   
 import org.apache.spark.sql.catalyst.util._   
 import org.apache.spark.sql.execution   
 import org.apache.spark.sql.hive._   
 import org.apache.spark.sql.hive.test.TestHive._   
 import org.apache.spark.sql.parquet.ParquetTestData   
      
 scala> val query = sql("SELECT * FROM (SELECT * FROM src) a join (select * from src)b on a.key=b.key")</span>   

3.1、UnResolve Logical Plan

第一步生成UnResolve Logical Plan 如下：

[java]view plain copy 
    
 scala> query.queryExecution.logical   
 res0: org.apache.spark.sql.catalyst.plans.logical.LogicalPlan =    
 Project [*]   
  Join Inner, Some(('a.key = 'b.key))   
   Subquery a   
    Project [*]   
     UnresolvedRelation None, src, None   
   Subquery b   
    Project [*]   
     UnresolvedRelation None, src, None   

如果画成树是这样的，仅个人理解：

我将一开始介绍的三种Node分别用绿色UnaryNode，红色Binary Node 和蓝色 LeafNode 来表示。

3.2、Analyzed Logical Plan

Analyzer会将允用Batch的Rules来对Unresolved Logical Plan Tree 进行rule应用，这里用来EliminateAnalysisOperators将Subquery给消除掉，Batch("Resolution将Atrribute和Relation给Resolve了，Analyzed Logical Plan Tree如下图:

3.3、Optimized Plan

我把Catalyst里的Optimizer戏称为Spark SQL的优化大师，因为整个Spark SQL的优化都是在这里进行的，后面会有文章来讲解Optimizer。

在这里，优化的不明显，因为SQL本身不复杂

[java]view plain copy 
    
 scala> query.queryExecution.optimizedPlan   
 res3: org.apache.spark.sql.catalyst.plans.logical.LogicalPlan =    
 Project [key#0,value#1,key#2,value#3]   
  Join Inner, Some((key#0 = key#2))   
   MetastoreRelation default, src, None   
   MetastoreRelation default, src, None   

生成的树如下图：

3.4、executedPlan

最后一步是最终生成的物理执行计划，里面涉及到了Hive的TableScan，涉及到了HashJoin操作，还涉及到了Exchange，Exchange涉及到了Shuffle和Partition操作。

[java]view plain copy 
    
 scala> query.queryExecution.executedPlan   
 res4: org.apache.spark.sql.execution.SparkPlan =    
 Project [key#0:0,value#1:1,key#2:2,value#3:3]   
  HashJoin [key#0], [key#2], BuildRight   
   Exchange (HashPartitioning [key#0:0], 150)   
    HiveTableScan [key#0,value#1], (MetastoreRelation default, src, None), None   
   Exchange (HashPartitioning [key#2:0], 150)   
    HiveTableScan [key#2,value#3], (MetastoreRelation default, src, None), None   

生成的物理执行树如图：

四、总结：

本文介绍了Spark SQL的Catalyst框架核心TreeNode类库，绘制了TreeNode继承关系的类图，了解了TreeNode这个类在Catalyst所起到的作用。语法树中的Logical Plan均派生自TreeNode，并且Logical Plan派生出TreeNode的三种形态，即Binary Node， Unary Node, Leaft Node。正式这几种节点，组成了Spark SQl的Catalyst的语法树。
TreeNode的transform方法是核心的方法，它接受一个rule，会对当前节点的孩子节点进行递归的调用rule，最后会返回一个TreeNode的copy，这种操作就是transformation，贯穿了Spark SQL执行的几个核心阶段，如Analyze，Optimize阶段。
最后用一个实际的例子，展示出来Spark SQL的执行树生成流程。

我目前的理解就是这些，如果分析不到位的地方，请大家多多指正。

——EOF——

原创文章，转载请注明：

转载自：OopsOutOfMemory盛利的Blog，作者： OopsOutOfMemory

本文链接地址：http://blog.csdn.net/oopsoom/article/details/38084079

注：本文基于署名-非商业性使用-禁止演绎 2.5 中国大陆(CC BY-NC-ND 2.5 CN)协议，欢迎转载、转发和评论，但是请保留本文作者署名和文章链接。如若需要用于商业目的或者与授权方面的协商，请联系我。

微信关注我们

原文链接：https://yq.aliyun.com/articles/232679

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Spark-SparkSQL深入学习系列一（转自OopsOutOfMemory）

/**Spark SQL源码分析系列文章*/ 自从去年SparkSubmit 2013 Michael Armbrust分享了他的Catalyst，到至今1年多了,Spark SQL的贡献者从几人到了几十人，而且发展速度异常迅猛，究其原因，个人认为有以下2点： 1、整合：将SQL类型的查询语言整合到 Spark 的核心RDD概念里。这样可以应用于多种任务，流处理，批处理，包括机器学习里都可以引入Sql。 2、效率：因为Shark受到hive的编程模型限制，无法再继续优化来适应Spark模型里。前一段时间测试过Shark，并且对Spark SQL也进行了一些测试，但是还是忍不住对Spark SQL一探究竟，就从源代码的角度来看一下Spark SQL的核心执行流程吧。一、引子先来看一段简单的Spark SQL程序： [java] view plain copy 1.valsqlContext=neworg.apache.spark.sql.SQLContext(sc) 2.importsqlContext._ 3.caseclassPerson(name:String...

2016-05-11

822

Spark-SparkSQL深入学习系列五（转自OopsOutOfMemory）

/**Spark SQL源码分析系列文章*/ 前几篇文章介绍了SparkSQL的Catalyst的核心运行流程、SqlParser，和Analyzer以及核心类库TreeNode，本文将详细讲解Spark SQL的Optimizer的优化思想以及Optimizer在Catalyst里的表现方式，并加上自己的实践，对Optimizer有一个直观的认识。 Optimizer的主要职责是将Analyzer给Resolved的Logical Plan根据不同的优化策略Batch，来对语法树进行优化，优化逻辑计划节点(Logical Plan)以及表达式(Expression)，也是转换成物理执行计划的前置。如下图：一、Optimizer Optimizer这个类是在catalyst里的optimizer包下的唯一一个类，Optimizer的工作方式其实类似Analyzer，因为它们都继承自RuleExecutor[LogicalPlan]，都是执行一系列的Batch操作： Optimizer里的batches包含了3类优化策略：1、Combine Limits 合并Limits2...

2016-05-11

691

发表评论

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。