（转）【hadoop代码笔记】Hadoop作业提交中EagerTaskInitializationListener的作用 -

fs20041242

浏览: 219490 次
性别:
来自: 深圳

最近访客更多访客>>

涓滴之水

zaz770977934

qnlpkuge

jjkj

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

（转）【hadoop代码笔记】Hadoop作业提交中EagerTaskInitializationListener的作用

博客分类：

hadoop

在整理FairScheduler实现的task调度逻辑时，注意到EagerTaskInitializationListener类。差不多应该是job提交相关的逻辑代码中最简单清楚的一个了。

todo：标红文字表示要加前向链接，待相关文字草稿提交后。

一、概述

继承自JobInProgressListener，实现了jobAdded，jobRemoved，jobUpdated方法。哦，不能说实现，应该说继承，JobInProgressListener居然是个抽象类，看着怎么这样的listener也应该是个interface。

在该listener被注册后，就响应jobAdded，jobRemoved，jobUpdated动作。在 EagerTaskInitializationListener中，响应这三种动作来维护内部的一个job列表（List<JobInProgress> jobInitQueue），并启动线程对job列表中的job异步的进行初始化。

二、主要代码逻辑

在job被添加到JobTracker时，注册的Lister会响应该方法。即当有作业提交到JobTracker时，该方法会把JIP加到jobInitQueue列表中，并且根据作业优先级和启动时间来调整其顺序。
jobInitManagerThread会一直产看jobInitManagerThread列表中的job，逐一取出来初始化其task。

三、主要成员

1   private JobInitManager jobInitManager = new JobInitManager(); //一个job初始化线程，关注job队列jobInitQueue，取出进行初始化
2   private Thread jobInitManagerThread; // JobInitManager线程
3   private List<JobInProgress> jobInitQueue = new ArrayList<JobInProgress>(); //响应lister的几种方法，维护的job队列
4   private ExecutorService threadPool; //一个线程池，里面的一个线程取一个job进行初始化
5   private int numThreads; //线程池的线程数，可配置

四、主要方法

1. EagerTaskInitializationListener的jobAdded方法：

首先关注的代码片段是该listener的jobAdded方法，前面说过，在FairScheduler的start方法中（taskTrackerManager.addJobInProgressListener(eagerInitListener)）会把 EagerTaskInitializationListener注册到JobTracker，在jobTracker中加入job的时候（addJob被调用），触发其上所有的jobListener的jobAdded方法。

在EagerTaskInitializationListener中，jobAdded只是简单的把job加入到一个 List<JobInProgress>类型的 jobInitQueue中。并不直接对其进行初始化，对其中的job的处理由另外线程来做。

@Override
  public void jobAdded(JobInProgress job) {
    synchronized (jobInitQueue) {
      jobInitQueue.add(job);
      resortInitQueue();
      jobInitQueue.notifyAll();
    }

  }

2. JobInitManager类：

一个线程，对jobInitQueue上保存的每个Job启动一个线程来执行初始化工作。在其run方法中会一直检查jobInitQueue是否有作业，有则拿出来从线程池中取一个线程处理。

JobInitManager

3. InitJob

一个线程类定义，真正处理每一个job的初始化。其实调用的是job的初始化方法(JobInProgress initTasks)

static class InitJob implements Runnable {
    private JobInProgress job;
    public InitJob(JobInProgress job) {
      this.job = job;
    }
    
    public void run() 
   {
      job.initTasks();            
    }
  }

完。

分享到：

（转）【Hadoop代码笔记】Hadoop作业提交之 ... | （转）【Hadoop代码笔记】通过JobClient对 ...

2014-03-14 15:26
浏览 892
评论(0)
分类:开源软件
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

（转）【hadoop代码笔记】Hadoop作业提交中EagerTaskInitializationListener的作用

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

（转）【hadoop代码笔记】Hadoop作业提交中EagerTaskInitializationListener的作用

评论

发表评论

相关推荐

（转）【hadoop代码笔记】Mapreduce shuffle过程之Map输出过程

（转）【hadoop代码笔记】hadoop作业提交之汇总

（转）【Hadoop代码笔记】Hadoop作业提交之Child启动reduce任务

（转）【Hadoop代码笔记】Hadoop作业提交之Child启动map任务

（转）【Hadoop代码笔记】Hadoop作业提交之TaskTracker 启动task

（转）【Hadoop代码笔记】Hadoop作业提交之Job初始化

（转）【Hadoop代码笔记】Hadoop作业提交之TaskTracker获取Task

（转）【Hadoop代码笔记】Hadoop作业提交之JobTracker接收作业提交

（转）【Hadoop代码笔记】Hadoop作业提交之JobTracker等相关功能模块初始化

（转）【Hadoop代码笔记】通过JobClient对Jobtracker的调用详细了解Hadoop RPC

（转）【Hadoop代码笔记】Hadoop作业提交之客户端作业提交

最近访客更多访客>>