Yarn源码分析之MRAppMaster：作业运行方式Local、Uber、Non-Uber-低调大师

Yarn源码分析之MRAppMaster：作业运行方式Local、Uber、Non-Uber

2016-04-29 856

基于作业大小因素，MRAppMaster提供了三种作业运行方式：本地Local模式、Uber模式、Non-Uber模式。其中，

1、本地Local模式：通常用于调试；

2、Uber模式：为降低小作业延迟而设计的一种模式，所有任务，不管是Map Task，还是Reduce Task，均在同一个Container中顺序执行，这个Container其实也是MRAppMaster所在Container；

3、Non-Uber模式：对于运行时间较长的大作业，先为Map Task申请资源，当Map Task运行完成数目达到一定比例后再为Reduce Task申请资源。

在Yarn中，作业运行的资源，统一被抽象为容器Container，在MRAppMaster中关于作业运行时需要的资源的分配与加载代码中，容器分配申请服务、容器分配完成后加载服务中，都有关于Uber模式和Non-Uber模式的处理，如下：

1、容器分配申请路由服务

容器分配申请路由服务ContainerAllocatorRouter继承自AbstractService，是Hadoop中一个典型的服务，其正常提供服务需要经历初始化init、启动start等过程，而在服务启动的serviceStart()方法中，存在以下关于Uber模式和Non-Uber模式的处理：

      // 如果Job在Uber模式下运行，启动构造容器分配器LocalContainerAllocator实例
      if (job.isUber()) {
        MRApps.setupDistributedCacheLocal(getConfig());
        this.containerAllocator = new LocalContainerAllocator(
            this.clientService, this.context, nmHost, nmPort, nmHttpPort
            , containerID);
      } else {
    	  
    	// 否则构造RM容器分配器RMContainerAllocator实例
        this.containerAllocator = new RMContainerAllocator(
            this.clientService, this.context);
      }

可见，如果Job在Uber模式下运行，启动构造容器分配器LocalContainerAllocator实例，否则构造RM容器分配器RMContainerAllocator实例。而LocalContainerAllocator代表的是本地容器分配器，其构造过程中传入的containerID为MRAppMaster的成员变量containerID，什么意思呢？不就正好说明LocalContainerAllocator所使用的容器，也就是Uber模式下所使用的容器，就是MRAppMaster所在Container，与上面所介绍的Uber模式正好一致，而Non-Uber模式下则需要使用Yarn的RMContainerAllocator，通过与ResourceManager进行通信来申请容器的分配，总的原则就是：先为Map Task申请资源，当Map Task运行完成数目达到一定比例后再为Reduce Task申请资源。

2、容器加载路由服务

容器加载路由服务ContainerLauncherRouter同样继承自AbstractService，也是Hadoop中一个典型的服务，我们同样看下服务启动serviceStart()方法，如下：

      // 如果Job在Uber模式下运行，启动构造本地容器加载器LocalContainerLauncher实例
      if (job.isUber()) {
        this.containerLauncher = new LocalContainerLauncher(context,
            (TaskUmbilicalProtocol) taskAttemptListener);
      } else {
    	// 否则，构造容器加载器ContainerLauncherImpl实例
        this.containerLauncher = new ContainerLauncherImpl(context);
      }

也是针对Uber模式和Non-Uber模式分别处理，如果Job在Uber模式下运行，启动构造本地容器加载器LocalContainerLauncher实例；否则，构造容器加载器ContainerLauncherImpl实例。

另外，由于Uber模式下不管是Map Task，还是Reduce Task，均在同一个Container中顺序执行，所以MapReduce的推测执行机制对于Uber模式是不适用的，故在MRAppMaster服务启动的serviceStart()方法中，对于Uber模式，会禁用推测执行机制，相关代码如下：

      if (job.isUber()) {
    	// Uber模式下禁用推测执行机制，即Disable Speculation
        speculatorEventDispatcher.disableSpeculation();
        LOG.info("MRAppMaster uberizing job " + job.getID()
            + " in local container (\"uber-AM\") on node "
            + nmHost + ":" + nmPort + ".");
      } else {
        // send init to speculator only for non-uber jobs. 
        // This won't yet start as dispatcher isn't started yet.
    	// Non-Uber模式下发送SpeculatorEvent事件，初始化speculator
        dispatcher.getEventHandler().handle(
            new SpeculatorEvent(job.getID(), clock.getTime()));
        LOG.info("MRAppMaster launching normal, non-uberized, multi-container "
            + "job " + job.getID() + ".");
      }

可以看到，Uber模式下禁用推测执行机制，即Disable Speculation，Non-Uber模式下发送SpeculatorEvent事件，初始化speculator，因此，对于Uber模式，会禁用推测执行机制。

在作业的抽象实现JobImpl中，会针对Uber模式进行一些特定参数设置，如下：

    if (isUber) {
      LOG.info("Uberizing job " + jobId + ": " + numMapTasks + "m+"
          + numReduceTasks + "r tasks (" + dataInputLength
          + " input bytes) will run sequentially on single node.");

      // make sure reduces are scheduled only after all map are completed
      // mapreduce.job.reduce.slowstart.completedmaps参数设置为1，
      // 即全部Map任务完成后才会为Reduce任务分配资源
      conf.setFloat(MRJobConfig.COMPLETED_MAPS_FOR_REDUCE_SLOWSTART,
                        1.0f);
      // uber-subtask attempts all get launched on same node; if one fails,
      // probably should retry elsewhere, i.e., move entire uber-AM:  ergo,
      // limit attempts to 1 (or at most 2?  probably not...)
      // 参数mapreduce.map.maxattempts、mapreduce.reduce.maxattempts设置为1，即Map、Reduce任务的最大尝试次数均为1
      conf.setInt(MRJobConfig.MAP_MAX_ATTEMPTS, 1);
      conf.setInt(MRJobConfig.REDUCE_MAX_ATTEMPTS, 1);

      // disable speculation
      // 参数mapreduce.map.speculative、mapreduce.reduce.speculative设置为false，即禁用Map、Reduce任务的推测执行机制
      conf.setBoolean(MRJobConfig.MAP_SPECULATIVE, false);
      conf.setBoolean(MRJobConfig.REDUCE_SPECULATIVE, false);
    }

主要包括：

1、mapreduce.job.reduce.slowstart.completedmaps参数设置为1，即全部Map任务完成后才会为Reduce任务分配资源；

2、参数mapreduce.map.maxattempts、mapreduce.reduce.maxattempts设置为1，即Map、Reduce任务的最大尝试次数均为1；

3、参数mapreduce.map.speculative、mapreduce.reduce.speculative设置为false，即禁用Map、Reduce任务的推测执行机制；

微信关注我们

原文链接：https://yq.aliyun.com/articles/245612

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Spark实践-日志查询

环境 win 7 jdk 1.7.0_79 (Oracle Corporation) scala version 2.10.5 spark 1.6.1 详细配置： Spark Properties spark.app.id local-1461891171126 spark.app.name JavaLogQuery spark.driver.host 10.170.26.123 spark.driver.port 34998 spark.executor.id driver spark.externalBlockStore.folderName spark-5242ec5b-3653-42e4-9ba2-da3ef515a1d5 spark.master local[1] spark.scheduler.mode FIFO 任务完成对如下日志的查询： "10.10.10.10 - \"FRED\" [18/Jan/2013:17:56:07 +1100] \"GET http://images.com/2013/Generic.jpg " + "HTTP/1.1\" 304 315...

2016-04-28

789

mapreduce.job.reduce.slowstart.completedmaps是MapReduce编程模型中的一个参数，这个参数的含义是，当Map Task完成的比例达到该值后才会为Reduce Task申请资源，默认是0.05，其在接口MRJobConfig中表示如下： // 当Map Task完成的比例达到该值后才会为Reduce Task申请资源，默认是0.05 public static final String COMPLETED_MAPS_FOR_REDUCE_SLOWSTART = "mapreduce.job.reduce.slowstart.completedmaps"; 那么这个参数在Yarn中是如何使用的呢？本文我们将解答这个问题。既然这个参数的含义是当Map Task完成的比例达到该值后才会为Reduce Task申请资源，那么在Yarn中关于资源分配申请服务的RMContainerAllocator中，自然会用到它。在服务初始化的serviceInit()方法中，有如下代码： // reduceSlowStart取参数mapreduc...

2016-04-29

619

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。