`

Hadoop之JobTracker,TaskTracker,Scheduler

 
阅读更多
DataNode 和NameNode 是针对数据存放来而言的

JobTracker和TaskTracker是对于MapReduce执行而言的

一:JobTracker

JobTracker协作作业的运行:
负责调度分配每一个子任务task运行于TaskTracker上,如果发现有失败的task就重新分配其任务到其他节点。

一般情况应该把JobTracker部署在单独的机器上。JobTracker与TaskTracker把持心跳;

JobTracker失败:

1:JobTracker失败在所有的失败中是最严重的一种;

2:hadoop没有处理jobtracker失败的机制。--它是一个单点故障。

3:在未来的新版本中可能可以运行多个JobTracker。(hadoop2.0以后)

4:可以使用ZooKeeper来协作JobTracker。(以后会有zookeeper专题)

二:TaskTracker

TaskTracker运行作业划分后的任务
TaskTracker是运行在多个节点上的slaver服务。
TaskTracker主动与JobTracker通信,接收作业,并负责直接
执行每一个任务,为了减少网络带宽TaskTracker最好运行在HDFS的DataNode上


TaskTracker失败:

1:一个TaskTracker由于崩溃或运行过于缓慢而失败,它会向JobTracker发送“心跳”。

2:如果有未完成的作业,JobTracker会重新把这些任务分配到其他的TaskTracker上面运行。

3:即使TaskTracker没有失败也可以被JobTracker列入黑名单。

三:hadoop调度器 Hadoop Job Scheduler
Hadoop默认的调度器是基于队列的FIFO调度器:
    所有用户的作业都被提交到一个队列中,然后由JobTracker先按照作业的优先级高低,再按照作业提交时间的先后顺序选择将被执行的作业。

优点:调度算法简单明了,JobTracker工作负担轻。
缺点:忽略了不同作业的需求差异。

Fair Scheduler(公平调度器):

1:多个Pool,Job需要被提交到某个Pool中;

2:每个pool可以设置最小 task slot(猜测最小的job数),称为miniShare

3:FS会保证Pool的公平,Pool内部支持Priority(优先级)设置,支持资源抢占(优先级)


转自:http://www.cnblogs.com/zhanghuijunjava/archive/2013/04/23/3036497.html

分享到:
评论
发表评论

文章已被作者锁定,不允许评论。

相关推荐

    Hadoop任务调度器

    Hadoop任务调度器是Hadoop分布式计算框架中的核心组件之一,负责管理和分配集群资源,以实现任务的高效执行。Hadoop的作业调度过程可以划分为几个主要阶段,这些阶段涉及到从作业提交到任务分配的各个环节。下面详细...

    hadoop-3.1.3.tar.gz编译后的源码包

    对于MapReduce部分,你可以看到JobTracker和TaskTracker如何协调工作,以及Map和Reduce任务如何在节点间分发和执行。此外,YARN的源码可以帮助你理解资源分配策略,如CapacityScheduler或FIFO Scheduler是如何工作的...

    hadoop0.23.9离线api

    org.apache.hadoop.lib.service.scheduler org.apache.hadoop.lib.service.security org.apache.hadoop.lib.servlet org.apache.hadoop.lib.util org.apache.hadoop.lib.wsrs org.apache.hadoop.log org....

    Hadoop 中的调度

    JobTracker将作业分配给TaskTracker,而TaskTracker管理和执行作业。DataNode作为存储节点,承载分布式文件系统的一部分。随着集群规模的扩大,如Facebook的4000节点集群,调度优化对于提升整体性能和用户体验至关...

    Hadoop集群作业的调度算法

    Hadoop的MapReduce计算架构包括两个核心组件:JobTracker和TaskTracker。JobTracker是集群中的主节点,负责接收用户的作业请求,并根据集群的状态和作业的需求选择合适的TaskTracker来执行具体的Map或Reduce任务。...

    HADOOP权威指南 第3版 PDF电子书下载 带目录书签 完整版

    8. **Hadoop优化**:涵盖数据本地化、带宽优化、JobTracker和TaskTracker的调整,以及MapReduce作业的性能调优。 9. **Hadoop实战**:书中可能包含实际案例,如Web日志分析、推荐系统、机器学习任务等,演示如何在...

    Hadoop权威指南 第二版(中文版)

     2.2.1 数据模型的“旋风之旅”  2.2.2 实现  2.3 安装  2.3.1 测试驱动  2.4 客户机  2.4.1 Java  2.4.2 Avro,REST,以及Thrift  2.5 示例  2.5.1 模式  2.5.2 加载数据  2.5.3 Web查询  2.6 HBase和...

    Hadoop期末整理.pdf

    MapReduce是Hadoop的计算模型,主要由JobClient、JobTracker、TaskTracker和Task(MapTask、ReduceTask)组成。JobClient负责提交作业,JobTracker负责作业调度和监控,TaskTracker执行分配的任务。MapReduce将计算...

    hadoop2.7.5源码

    1. **HDFS(Hadoop Distributed File System)**:Hadoop的核心部分之一,是一个分布式文件系统,它将大文件分割成块,并在集群中的多个节点上存储这些数据块的副本。源码中包括了NameNode(元数据管理)、DataNode...

    Hadoop权威指南(中文版)2015上传.rar

    2.2.1 数据模型的"旋风之旅" 2.2.2 实现 2.3 安装 2.3.1 测试驱动 2.4 客户机 2.4.1 Java 2.4.2 Avro,REST,以及Thrift 2.5 示例 2.5.1 模式 2.5.2 加载数据 2.5.3 Web查询 2.6 HBase和RDBMS的比较 2.6.1 成功的...

    hadoop大数据就业面试题

    5. TaskTracker:执行 JobTracker 分配的任务。 6. ResourceManager:管理资源,调度任务。 7. NodeManager:管理节点,监控节点的状态。 8. JournalNode:提供日志服务,记录 HDFS 的操作日志。 9. ZooKeeper:提供...

    Hadoop 的配置指南

    Hadoop集群由管理节点(NameNode)、数据节点(DataNode)、任务跟踪器(JobTracker)和任务节点(TaskTracker)组成。以下是配置Hadoop的一些主要知识点: 1. 安装Java:Hadoop是用Java编写的,因此需要在所有节点...

    hadoop深入了解

    最后,IPC是Hadoop中不同进程间通信的重要手段,主要用于NameNode与DataNode、JobTracker与TaskTracker之间的交互。通过对源代码的分析,我们可以深入理解Hadoop内部的工作机制,比如数据传输的细节、错误处理策略...

    hadoop云计算平台作业调度算法的研究.ppt

    其次,论文对Hadoop作业调度流程进行了介绍,包括JobTracker、TaskTracker、TaskScheduler等。作业调度流程主要包括作业提交、任务分配、任务执行、任务监控等步骤。 最后,论文对论文主要研究内容进行了介绍,包括...

Global site tag (gtag.js) - Google Analytics