Hadoop源码解读-JobTracker处理HeartBeat

ancin

浏览: 53330 次
性别:

最近访客更多访客>>

jingshaq

JiaQ

zangyk

shiro的名字好

博主相关

博客

微博

相册

留言

关于我

文章分类

全部博客 (20)

社区版块

存档分类

hadoop java

JobTracker会接受TaskTracker的心跳，并处理。不多说，直接上源码

public synchronized HeartbeatResponse heartbeat(TaskTrackerStatus status, 
                                                  boolean restarted,
                                                  boolean initialContact,
                                                  boolean acceptNewTasks, 
                                                  short responseId)

1 首先检查heartbeat是否来自自己的host列表，否则抛出异常。
如果不再Host列表或者在排除Host列表中，退出心跳处理。

  return (inHostsList(status) && !inExcludedHostsList(status));

2 判断是否在黑名单、灰名单、默认名单，并从这些名单中删除
黑名单、灰名单主要是Hadoop的容错机制，在此不做过多解释，可以单写一篇文章。

  faultyTrackers.markTrackerHealthy(status.getHost());

3 根据trackerName获取上一个heartbeat response

   HeartbeatResponse prevHeartbeatResponse =
      trackerToHeartbeatResponseMap.get(trackerName);

4 如果上一个heartbeat 为null，让Tasktracker重新初始化如果是第一个 response 从recoveryMap中移除

 if (prevHeartbeatResponse == null) {
        // This is the first heartbeat from the old tracker to the newly 
        // started JobTracker
        if (hasRestarted()) {
          addRestartInfo = true;
          // inform the recovery manager about this tracker joining back
          recoveryManager.unMarkTracker(trackerName);
        } else {
          // Jobtracker might have restarted but no recovery is needed
          // otherwise this code should not be reached
          LOG.warn("Serious problem, cannot find record of 'previous' " +
                   "heartbeat for '" + trackerName + 
                   "'; reinitializing the tasktracker");
          return new HeartbeatResponse(responseId, 
              new TaskTrackerAction[] {new ReinitTrackerAction()});
        }

      }

如果重发的responseId，丢弃掉。

  if (prevHeartbeatResponse.getResponseId() != responseId) {
          LOG.info("Ignoring 'duplicate' heartbeat from '" + 
              trackerName + "'; resending the previous 'lost' response");
          return prevHeartbeatResponse;
        }

5 处理heartbeat 首先 updateTaskTrackerStatus 如果是被遗忘的tasktracker 加入队列中；更新任务状态；更新健康节点状态；

    private synchronized boolean processHeartbeat(
                                 TaskTrackerStatus trackerStatus, 
                                 boolean initialContact,
                                 long timeStamp) throws UnknownHostException {
   //主要集中在此不分析那么详细了
}

6 检查新Task是否执行，如果没有执行，加入执行队列

 
   if (recoveryManager.shouldSchedule() && acceptNewTasks && !isBlacklisted) {
      TaskTrackerStatus taskTrackerStatus = getTaskTrackerStatus(trackerName);
      if (taskTrackerStatus == null) {
        LOG.warn("Unknown task tracker polling; ignoring: " + trackerName);
      } else {
        List<Task> tasks = getSetupAndCleanupTasks(taskTrackerStatus);
        if (tasks == null ) {
          tasks = taskScheduler.assignTasks(taskTrackers.get(trackerName));
        }
//添加Task
        if (tasks != null) {
          for (Task task : tasks) {
            expireLaunchingTasks.addNewTask(task.getTaskID());
            if(LOG.isDebugEnabled()) {
              LOG.debug(trackerName + " -> LaunchTask: " + task.getTaskID());
            }
            actions.add(new LaunchTaskAction(task));
          }
        }
      }
    }

7 检查Task是否杀死

 List<TaskTrackerAction> killTasksList = getTasksToKill(trackerName);
    if (killTasksList != null) {
      actions.addAll(killTasksList);
    }

8 检查 task 是否cleanup

List<TaskTrackerAction> killJobsList = getJobsForCleanup(trackerName);
    if (killJobsList != null) {
      actions.addAll(killJobsList);
    }

9 检查task 的output是否可以save

 List<TaskTrackerAction> commitTasksList = getTasksToSave(status);
    if (commitTasksList != null) {
      actions.addAll(commitTasksList);
    }

10 计算下一次heartbeat的时间间隔

    int nextInterval = getNextHeartbeatInterval();
    response.setHeartbeatInterval(nextInterval);
    response.setActions(
                        actions.toArray(new TaskTrackerAction[actions.size()]));

11 更新heartbeatMap，并remove掉Marked已经处理掉的heartbeat

// 更新Map
  trackerToHeartbeatResponseMap.put(trackerName, response);

    //清除处理完成的心跳
    removeMarkedTasks(trackerName);

不对之处欢迎讨论。
=================参考====
hadoop源码。

分享到：

Nutch 应用笔记和solr配合 | Hadoop源码解读-Job初始化过程

2013-12-09 15:03
浏览 1207
评论(0)
分类:互联网
查看更多

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

计算机二级公共基础知识模拟试题及答案详解.pdf: 计算机二级公共基础知识模拟试题及答案详解.pdf

电子工程领域的语音发射机电路设计与实现: 内容概要：本文档详细介绍了语音发射机的设计与实现，涵盖了从硬件电路到具体元件的选择和连接方式。文档提供了详细的电路图，包括电源管理、信号处理、音频输入输出接口以及射频模块等关键部分。此外，还展示了各个引脚的功能定义及其与其他组件的连接关系，确保了系统的稳定性和高效性能。通过这份文档，读者可以全面了解语音发射机的工作原理和技术细节。适合人群：对电子工程感兴趣的初学者、从事嵌入式系统开发的技术人员以及需要深入了解语音发射机制的专业人士。使用场景及目标：适用于希望构建自己的语音发射设备的研究人员或爱好者，帮助他们掌握相关技术和实际操作技能。同时，也为教学机构提供了一个很好的案例研究材料。其他说明：文档不仅限于理论讲解，还包括具体的实施步骤，使读者能够动手实践并验证所学知识。

易语言注册机源码详解：单线程架构下的接码、滑块验证与IP代理实现: 内容概要：本文详细介绍了用易语言编写的单线程全功能注册机源码，涵盖了接码平台对接、滑块验证处理、IP代理管理以及料子导入等多个核心功能。文章首先展示了主框架的初始化配置和事件驱动逻辑，随后深入探讨了接码平台（如打码兔）的API调用及其返回数据的处理方法。对于滑块验证部分，作者分享了如何利用易语言的绘图功能模拟真实用户的操作轨迹，并提高了验证通过率。IP代理模块则实现了智能切换策略，确保代理的有效性和稳定性。此外，料子导入功能支持多种格式的数据解析和去重校验，防止脏数据污染。最后，文章提到了状态机设计用于控制注册流程的状态持久化。适合人群：有一定编程基础，尤其是熟悉易语言的开发者和技术爱好者。使用场景及目标：适用于希望深入了解易语言注册机开发的技术细节，掌握接码、滑块验证、IP代理等关键技术的应用场景。目标是帮助读者理解并优化现有注册机的功能，提高其稳定性和效率。其他说明：文中提到的部分技术和实现方式可能存在一定的风险，请谨慎使用。同时，建议读者在合法合规的前提下进行相关开发和测试。

计算机绘图实用教程第三章.pdf: 计算机绘图实用教程第三章.pdf

计算机辅助设计—AutoCAD 2018中文版基础教程各章CAD图纸及相关说明汇总.pdf: 计算机辅助设计—AutoCAD 2018中文版基础教程各章CAD图纸及相关说明汇总.pdf

计算机类电子书集合PDF: C++相关书籍，计算机相关书籍，linux相关及http等计算机学习、面试书籍。

计算机二级mysql数据库程序设计练习题(一).pdf: 计算机二级mysql数据库程序设计练习题(一).pdf

计算机发展史.pdf: 计算机发展史.pdf

计算机二级课件.pdf: 计算机二级课件.pdf

计算机概论第三讲：计算机组成.pdf: 计算机概论第三讲：计算机组成.pdf

端侧算力网络白皮书：6G时代终端算力资源高效利用与应用场景解析: 内容概要：本文档由中国移动通信集团终端有限公司、北京邮电大学、中国信息通信研究院和中国通信学会共同发布，旨在探讨端侧算力网络（TCAN）的概念、架构、关键技术及其应用场景。文中详细分析了终端的发展现状、基本特征和发展趋势，阐述了端侧算力网络的定义、体系架构、功能架构及其主要特征。端侧算力网络通过整合海量泛在异构终端的算力资源，实现分布式多级端侧算力资源的高效利用，提升网络整体资源利用率和服务质量。关键技术涵盖层次化端算力感知图模型、资源虚拟化、数据压缩、多粒度多层次算力调度、现场级AI推理和算力定价机制。此外，还探讨了端侧算力网络在智能家居、智能医疗、车联网、智慧教育和智慧农业等领域的潜在应用场景。适合人群：从事通信网络、物联网、边缘计算等领域研究和开发的专业人士，以及对6G网络和端侧算力网络感兴趣的学者和从业者。使用场景及目标：适用于希望深入了解端侧算力网络技术原理、架构设计和应用场景的读者。目标是帮助读者掌握端侧算力网络的核心技术，理解其在不同行业的应用潜力，推动端侧算力网络技术的商业化和产业化。其他说明：本文档不仅提供了端侧算力网络的技术细节，还对其隐私与安全进行了深入探讨

学习java的心得体会.docx: 学习java的心得体会.docx

计算机二级考试(南开100题齐全).pdf: 计算机二级考试(南开100题齐全).pdf

计算机二级C语言考试通关宝典：全面解析核心知识点与解题技巧: 内容概要：本文详细介绍了计算机二级C语言考试的内容和备考方法。首先概述了计算机二级考试的意义及其在计算机技能认证中的重要性，重点讲解了C语言的基础语法，包括程序结构、数据类型、运算符和表达式等。接着深入探讨了进阶知识，如函数、数组、指针、结构体和共用体的应用。最后分享了针对选择题、填空题和编程题的具体解题技巧，强调了复习方法和实战演练的重要性。适合人群：准备参加计算机二级C语言考试的学生和技术爱好者。使用场景及目标：①帮助考生系统地掌握C语言的核心知识点；②提供有效的解题策略，提高应试能力；③指导考生制定合理的复习计划，增强实战经验。其他说明：本文不仅涵盖了理论知识，还提供了大量实例代码和详细的解释，有助于读者更好地理解和应用所学内容。此外，文中提到的解题技巧和复习建议对实际编程也有很大帮助。

论文格式及要求.doc: 论文格式及要求.doc

三菱FX3U与台达变频器RS485通信程序设置及应用实例: 内容概要：本文详细介绍了如何使用三菱FX3U PLC及其485BD通信板与四台台达VFD-M系列变频器进行通信的设置与应用。主要内容涵盖硬件连接注意事项、通信参数配置、RS指令的应用、CRC校验算法的实现以及频率给定和状态读取的具体方法。文中提供了多个实用的编程示例，展示了如何通过梯形图和结构化文本编写通信程序，并讨论了常见的调试技巧和优化建议。此外，还提到了系统的扩展性和稳定性措施，如增加温度传感器通信功能和应对电磁干扰的方法。适合人群：从事工业自动化领域的工程师和技术人员，尤其是那些熟悉三菱PLC和台达变频器的使用者。使用场景及目标：适用于需要实现多台变频器联动控制的工业应用场景，旨在提高生产效率和系统可靠性。通过学习本文，读者可以掌握如何构建稳定的RS485通信网络，确保变频器之间的高效协同工作。其他说明：本文不仅提供了详细的理论指导，还包括了许多来自实际项目的经验教训，帮助读者避免常见错误并提升编程技能。

计算机服务规范.pdf: 计算机服务规范.pdf

Discuz-X3.2-TC-UTF8.zip: Discuz_X3.2_TC_UTF8.zip LNMP搭建安装包

2023年房地产行业研究报告：缓解竣工下行加速的两大改革.pdf: 2023年房地产行业研究报告：缓解竣工下行加速的两大改革

win32汇编环境,网络编程入门之十五: win32汇编环境,网络编程入门之十五

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论