您现在的位置是:首页 > 文章详情

Spark中的资源调度

日期:2018-12-20点击:401

Spark中涉及的资源调度可以分为4层:

  • YARN对不同SparkApplication(SparkContext)的调度
  • 同一个SparkAppliction内不同资源池(pool)之间的调度
  • 同一个SparkAppliction内同一个资源池(pool)内不同TaskSetManager的调度
  • 同一个SparkAppliction内同一个资源池(pool)内同一个TaskSetManager内的Task调度

11

前置

为啥需要资源调度

当用户提交作业,Spark内部的执行流程如下图:

Spark

Spark上层的SQL/Streaming等最终都会生成RDD到底层SparkCore执行。如上图所示当RDD执行一个action类型的算子(如collect)会触发一个Job的提交到DAGSchedulerDAGScheduler会将Job拆成Stage(根据s

原文链接:https://yq.aliyun.com/articles/680995
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章