MapReduce深度分析(二)

2016-04-20 710

MapReduce深度分析(二)

五、JobTracker分析

　　JobTracker是hadoop的重要的后台守护进程之一，主要的功能是管理任务调度、管理TaskTracker、监控作业执行、运行作业容错机制等。

　　首先启动interTrackerServer，将端口配置为mapred.job.tracker绑定的地址和端口。interTrackerServer提供两种用途：

　　　　接收和处理TaskTracker的heartbeat请求，必须实现InterTrackerProtocol接口及协议。

　　　　接收和处理JobClient请求，submitJob、killJob等，必须实现JobSubmissionProtocol接口及协议。

　　其次启动一个infoServer，运行StatusHttpServer，提供web服务。

　　最后，启动5个JobTracker子线程，各子线程功能如下：

ExpireLaunchingTasks：用于停止那些未在超时内报告进度的Task
ExpireTrackers：用于停止那些可能已经当掉的TaskTracker
RetireJobs：用于清除那些已经完成很长时间还存在队列里的作业
JobInitThread：用于初始化用户作业
TaskCommitQueue：用于调度Task的那些所有与FileSystem操作相关的处理，并记录Task的状态信息。

JobTracker的启动分析：

　　主要有两个函数startTracker和offerService()函数。

　　1、JobTracker.startTracker()

　　　　这个函数在启动时被调用主要有两个步骤：

　　　　　　步骤1、构造JobTracker对象result，启动两个RPC服务，并等待JobTracker退出安全模式，如果构造出错，睡眠1秒

　　　　　　步骤2、调用静态方法JobEndNotifier.startNotifier()创建一个线程，从延迟队列JobEndNotifier.queue中取出一个JobEndStatusInfo对象，然后通过sendNotification()调用httpNotification()构造一个HttpClient对象执行相应的http请求。

　　2、JobTracker.offerService()

　　　　负责创建启动5个重要的线程及其回收线程资源。

六、TaskTracker分析

　　TaskTracker的主要任务是执行JobTracker分发的任务。

TaskTracker启动分析：

　　TaskTracker.TaskTracker()-->TaskTracker.run()

　　askTracker.TaskTracker()用于构造TaskTracker类的对象，在上述代码中调用了TaskTracker(conf)含参构造函数，首先为TaskTracker设置JobTracker地址，然后配置启动一个StatusHttpServer对象，将服务绑定到作业配置项tasktracker.http.prot中指定的地址和端口，提供web服务，用于向用户提供web界面查询任务执行情况的服务。最后调用initialize()完成TaskTracker初始化。

　　TaskTracker.run()是TaskTracker的主线程核心函数，调用TaskTracker.offerService()链接JobTracker并开始提供服务。如果出现网络故障，需等待5s，然后重试，根据异常类型可能还需先调用TaskTracker.close完成清理，将所有任务置为失败，关闭RPC server，将TaskTracker.running置为false，清理本地的Map计算输出，关闭取Map计算结果的线程mapEventsFetcher等，清理完成后调用initialize()重新初始化。

TaskTracker核心子线程：

　　MapEventsFetcher线程、taskCleanup线程、TaskRunner线程。

七、心跳机制实现分析

　　在hadoop的master启动的时候会开启一个IPC Server以等待Slave的心跳数据包，Slave启动时会主动链接master，并周期性的每个3s向master发送一个心跳包。slave通过这个心跳包将自己的状态告诉master，然后master在通过心跳包的返回值向slave节点传送执行指令，整个过程就是hadoop的心跳检测机制。

八、作业创建分析

　　作业的创建主要由JobClient类负责完成。JobClient也是用户作业和JobTracker交互的重要接口，可以用来提交作业、跟踪作业的状态、访问子任务的报告、日志等，获取mapreduce集群状态信息等。

　　JobClient在创建作业时执行的主要操作包括：检查输入/输出的有效性，计算作业的Splits，复制作业的jar包和配置文件到HDFS的mapred系统目录，最后提交作业给JobTracker并跟踪作业执行状态。整个作业的创建都在JobClient.runJob()函数中执行。

　　创建流程：

　　　　步骤1、首先根据传入的JobConf参数构造JobClient对象，在JobClient的构造函数中会调用JobClient的init方法，通过其连接到JobTracker。

　　　　步骤2、调用JobClient.submitJob()向JobTracker提交作业，根据返回的RunningJob接口每隔1s检查一次作业的状态，如果执行完毕退出跟踪，如果出错，杀死该作业。

　　初始化：

　　　　步骤1、从配置文件读取mapred.job.tracker，判断是否为本地执行的任务，初始化JobClient的JobSubmitClient。

　　　　步骤2、如果是本地任务，调用LocalJobRunner来初始化。

　　　　步骤3、如果非本地任务，使用RPC机制来构造一个JobSubmissionProtocol接口的代理，即调用JobTracker.getAddress(conf)获得JobTracker地址，再通过JobClient参数调用createProxy方法初始化JobSubmitClient。

　　作业提交：

　　　　提交是通过在JobClient.runJob()函数中调用JobClient.submitJob()函数完成的。最终通过调用JobClient.submitJobInternal()函数提交到作业JobTracker，则该函数返回NetworkedJob的RunningJob对象用于跟踪作业。主要的执行流程如下：

　　　　步骤1、通过jobSubmitClient.getNewJobId()获取作业名。

　　　　步骤2、获得作业提交目录submitJobDit，并设置参数mapreduce.job.dir的值。

　　　　步骤3、获取Job的分布式缓存路径。

　　　　步骤4、获取作业配置文件目录，获取Reduce数目，以及本机Ip地址，并根据Reduce数目是否为零来检查输入/输出设置。

　　　　步骤5、为用户作业创建Split输入分区。

　　　　步骤6、将JobConf的mapred.job.split.file项配置为job.split在HDFS上的绝对路径，根据splits[]数组大小设置Map任务数。

　　　　步骤7、得到作业队列名并设置ACL队列管理信息。

　　　　步骤8、将JobConf的内容写到HDFS的/${maprede.system.dir}/${jobid}/job.xml中。

　　　　步骤9、最后通过jobSubmitClient.submitJob()将名为JobId的作业提交给JobTracker。返回status变量是JobStatus对象，用于跟踪作业状态。

九、作业执行分析

　　在完成作业创建过程后再JobClient.submitJob()函数中通过JobSubmissionProtocol协议调用JobTracker.submitJob()函数提交作业到JobTracker，在submitJob()函数中主要负责用户的用户作业的初始化、构造JobInProgress对象，并初始化任务列表等，而任务的真正执行实际是由TaskTracker完成的。

JobTracker初始化

　　在submitJob()函数被调用之后，JobTracker就会接收到新的job请求，然后创建一个JobInProgress对象并通过它来来管理和调度任务。JobInProgress在创建的时候会初始化一系列与任务有关的参数。

　　1、JobTracker.submitJob()

　　　　submitJob()是JobTracker初始化的主函数。主要流程如下：

　　　　　　步骤1、得到用户组信息，返回作业状态，新建jobInfo。

　　　　　　步骤2、创建JobInProgress对象，不锁定JobTracker。

　　　　　　步骤3、核对队列是否处于running状态，并检查作业访问权限。

　　　　　　步骤4、检查作业是否因为无效的内存需求而不能运行。

　　　　　　步骤5、通过调用addJob(jobID，job)函数提交作业。该函数会返回JobStatus对象用于跟踪作业的运行状态。

　　2、JobInProgress.JobInProgress()

　　　　这个函数在JobTracker.submitJob()初始化作业中构造JobInProgress对象时调用执行。

　　　　　　步骤1、创建并初始化用于向JobClient汇报作业执行状态的JobStatus对象。

　　　　　　步骤2、设置用户名信息以及该JobInProgress对象的启动时间。

　　　　　　步骤3、在joobTrackerbTracker本地文件系统的${mapred.local.dir}/目录下创建${jobid}.jar，${jobid}.xml和${job.id}目录，并在该目录下创建job.xml文件。

　　　　　　步骤4、从作业配置JobConf中读取作业优先级、队列信息，Map任务数，Reduce任务数等。

　　　　　　步骤5、创建taskCompletionEvents列表。该列表用于JobTracker上跟踪该作业完成事件，初始化大小为Map任务数+Reduce任务数+10

　　　　　　步骤6、构建jobACLs，用于对用户作业进行ACL权限控制。

　　　　　　步骤7、设置Map、Reduce，以及每个Tracker上任务可以容忍失败的百分比。

　　　　　　步骤8、检查每个reduce的估计输入大小是否小于reduce大小的限制值，最后注册作业。

TaskTracker.startNewTask()

　　初始化完成之后，通过该函数启动一个新的任务。在心跳机制检测中，如果JobTracker返回了LaunchTaskAction指令，则TaskTracker在offerService中会调用TaskTracker.startNewTask()函数来处理新任务，即开始执行一个新的计算任务。

TaskTracker.localizeJob()

　　该函数在TaskTracker.startNewTask()中调用，主要负责计算任务初始化(本地化)并启动计算任务。

TaskRunner.run()

　　最终执行TaskRunner.run函数，TaskTracker最终调用TaskTracker.TaskInProgress.launchTask()创建计算线程来执行。

当神已无能为力，那便是魔渡众生

微信关注我们

原文链接：https://yq.aliyun.com/articles/496771

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Hadoop2.6.0配置参数查看小工具

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/beliefer/article/details/51145397 前言使用Hadoop进行离线分析或者数据挖掘的工程师，经常会需要对Hadoop集群或者mapreduce作业进行性能调优。也许你知道通过浏览器访问http://master:18088/conf来查看配置信息，如下图所示：但是当Linux工程师们只面对命令行时，如何查看呢？而且如果运维工程师根据集群状况及运行历史使用shell、Python、ruby等脚本写些运维代码，甚至动态调整集群参数时，该怎么办呢？性能调优的前提是需要能准确知道目前针对Hadoop集群或者mapreduce作业配置的参数。在MySQL中可以通过以下命令查询参数值： SHOW VARIABLES LIKE 'some_parameter'也可以使用以下命令查询参数值： SELECT @@session.some_parameter SELECT @@global.some_parameter或者直接查询information_schema.GLOB...

2016-04-21

549

hadoop中自带的org.apache.hadoop.io包中有广泛的writable类可供选择，它们形成下图所示的层次结构： java基本类型的Writable封装器 Writable类对java基本类型提供封装，short和char除外，所有的封装包含get()和set()两个方法用于读取或设置封装的值 java基本类型的Writable类 java原生类型除char类型以外，所有的原生类型都有对应的Writable类，并且通过get和set方法可以他们的值。IntWritable和 LongWritable还有对应的变长VIntWritable和VLongWritable类。固定长度还是变长的选用类似与数据库中的char或者 vchar，在这里就不赘述了。 Text类型 Text类型使用变长int型存储长度，所以Text类型的最大存储为2G. Text类型采用标准的utf-8编码，所以与其他文本工具可以非常好的交互，但要注意的是，这样的话就和java的String类型差别就很多了。检索的不同 Text的chatAt返回的是一个整型，及utf-8编码后的数字，而不是象Stri...

2016-04-21

675

资源下载

更多资源

优质分享App

近一个月的开发和优化，本站点的第一个app全新上线。该app采用极致压缩，本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。