`
bit1129
  • 浏览: 1069580 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

【Hadoop十六】Capacity Scheduler

 
阅读更多

在Hadoop2.5.2中,默认的资源调度器默认使用的算法是计算能力调度器,配置文件位于/etc/hadoop/capacity-scheduler.xml,不做任何修改,它的配置文件内容如下,默认配置中显示了一些可用的配置参数以及这些配置参数的默认值,以及这些配置参数的含义

 

<configuration>

  <property>
    <name>yarn.scheduler.capacity.maximum-applications</name>
    <value>10000</value>
    <description>
      Maximum number of applications that can be pending and running.
      整个集群最多能运行多少个Application,包括已经运行以及正在等待运行的Application
    </description>
  </property>

  <property>
    <name>yarn.scheduler.capacity.maximum-am-resource-percent</name>
    <value>0.1</value>
    <description>
      Maximum percent of resources in the cluster which can be used to run 
      application masters i.e. controls number of concurrent running
      applications.
      整个集群可以用于运行Application Master的资源百分比,一个AM对应一个Application,通过这个参数可以控制同时运行
      的Application有多少。0.1是相对于谁的比例?
    </description>
  </property>

  <property>
    <name>yarn.scheduler.capacity.resource-calculator</name>
    <value>org.apache.hadoop.yarn.util.resource.DefaultResourceCalculator</value>
    <description>
      The ResourceCalculator implementation to be used to compare 
      Resources in the scheduler.
      The default i.e. DefaultResourceCalculator only uses Memory while
      DominantResourceCalculator uses dominant-resource to compare 
      multi-dimensional resources such as Memory, CPU etc.
    </description>
  </property>

  <property>
    <name>yarn.scheduler.capacity.root.queues</name>
    <value>default</value>
    <description>
      The queues at the this level (root is the root queue).
    </description>
  </property>

  <property>
    <name>yarn.scheduler.capacity.root.default.capacity</name>
    <value>100</value>
    <description>Default queue target capacity.</description>
  </property>

  <property>
    <name>yarn.scheduler.capacity.root.default.user-limit-factor</name>
    <value>1</value>
    <description>
      Default queue user limit a percentage from 0.0 to 1.0.
    </description>
  </property>

  <property>
    <name>yarn.scheduler.capacity.root.default.maximum-capacity</name>
    <value>100</value>
    <description>
      The maximum capacity of the default queue. 
    </description>
  </property>

  <property>
    <name>yarn.scheduler.capacity.root.default.state</name>
    <value>RUNNING</value>
    <description>
      The state of the default queue. State can be one of RUNNING or STOPPED.
    </description>
  </property>

  <property>
    <name>yarn.scheduler.capacity.root.default.acl_submit_applications</name>
    <value>*</value>
    <description>
      The ACL of who can submit jobs to the default queue.
    </description>
  </property>

  <property>
    <name>yarn.scheduler.capacity.root.default.acl_administer_queue</name>
    <value>*</value>
    <description>
      The ACL of who can administer jobs on the default queue.
    </description>
  </property>

  <property>
    <name>yarn.scheduler.capacity.node-locality-delay</name>
    <value>40</value>
    <description>
      Number of missed scheduling opportunities after which the CapacityScheduler 
      attempts to schedule rack-local containers. 
      Typically this should be set to number of nodes in the cluster, By default is setting 
      approximately number of nodes in one rack which is 40.
    </description>
  </property>

</configuration>

 

 在上面的配置中,root队列下定义了一个名称为default的队列。打开yarn集群管理界面,可以看到当前调度情况:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  • 大小: 62.2 KB
分享到:
评论

相关推荐

    配置Capacity Scheduler

    Capacity Scheduler是Apache Hadoop生态系统中的一个关键组件,它是一个多租户资源调度器,主要用于管理Hadoop MapReduce作业的执行。这个调度器的主要目标是公平地分配集群资源,确保各个应用程序能高效、公平地...

    hadoop capacity

    &lt;value&gt;org.apache.hadoop.mapred CapacityScheduler ``` ##### 5.2 设置队列 Capacity Scheduler通过队列来实现多租户的支持。队列可以按照组织、部门或者项目来划分。例如,可以设置两个队列`queue1`和`queue2...

    hadoop-0.21.0-capacity-scheduler.jar

    hadoop-0.21.0-capacity-scheduler.jar

    apache hadoop 2.7.2.chm

    Capacity Scheduler Fair Scheduler ResourceManager Restart ResourceManager HA Node Labels Web Application Proxy YARN Timeline Server Writing YARN Applications YARN Commands NodeManager Restart...

    hadoop 容量调度器

    容量调度器(Capacity Scheduler)作为Hadoop MapReduce的重要组件,旨在确保多用户、多任务公平共享集群资源。它通过设定不同的队列(queue)来实现对作业的调度策略,确保每个队列能按其分配的容量获得相应的计算...

    Hadoop权威指南中文版(第二版)+Hadoop in Action

    6. **YARN详解**:资源调度器(CapacityScheduler和FairScheduler)、ResourceManager、NodeManager和ApplicationMaster的角色和交互。 7. **Hadoop生态扩展**:Zookeeper(分布式协调服务)、Oozie(工作流调度...

    Hadoop的yarn详解

    CapacityScheduler是为大数据处理设计的,它允许资源分配基于容量的队列,而FairScheduler则提供了一种基于公平份额的资源分配策略,确保资源可以根据应用的实际需求得到合理分配。 YARN不仅仅支持离线计算框架,如...

    hadoop-3.1.3.tar.gz编译后的源码包

    此外,YARN的源码可以帮助你理解资源分配策略,如CapacityScheduler或FIFO Scheduler是如何工作的。 源码包还包含了构建脚本和测试用例,你可以通过这些来编译源码、运行测试,确保你理解的正确性。这也能帮助你...

    hadoop2.2.0

    4. 资源调度:YARN通过Capacity Scheduler和Fair Scheduler提供资源调度策略。Capacity Scheduler适用于多用户环境,保证每个队列的最小资源分配;Fair Scheduler则依据应用程序的需求公平分配资源,适合共享集群...

    Hadoop3.2.2.zip

    此外,Hadoop 3.2.2还支持新的资源调度器,如Fair Scheduler和Capacity Scheduler,可以根据实际需求选择合适的调度策略。 在Hadoop环境中,你可以使用HDFS命令行工具进行文件操作,如 `hadoop fs -put` 用于上传...

    MapReduce:Fair Scheduler PPT分享

    在Hadoop的早期版本中,默认的调度器是“Capacity Scheduler”,它侧重于保证队列的容量。然而,随着大数据应用的发展,用户对更公平的资源分配方式提出了需求,于是“Fair Scheduler”应运而生。Fair Scheduler的...

    hadoop-3.1.1编译

    - **Capacity Scheduler优化**:作为默认的资源调度器,Capacity Scheduler在3.1.1版本中进行了性能调优,提高了任务调度的效率和资源利用率。 - **Preemption机制**:增加了对运行任务的抢占功能,当系统资源紧张...

    hadoop3.x带snappy(可用于windows本地开发)

    2. **YARN改进**:优化了资源调度器,如增加了Capacity Scheduler的多队列公平共享,提升了集群资源利用率。 3. **更大数据块支持**:默认数据块大小从128MB提升到了1GB,适应了更大规模的数据处理需求。 4. **更...

    Hadoop 中的调度

    2. 容量调度(Capacity Scheduler):侧重于保证集群的稳定性和资源利用率。容量调度器将资源分配给预先定义的队列,每个队列有固定的容量保证,以满足不同部门或用户组的需求。队列内部可以采用FIFO策略或公平策略...

    hadoop2.6.0.rar

    YARN提供了更细粒度的资源分配,提高了集群利用率,并通过改进的资源调度器,如Capacity Scheduler和Fair Scheduler,保证了多用户环境下的公平性和响应时间。 在Ubuntu上搭建Hadoop集群,你需要进行以下步骤: 1. ...

    Hadoop技术答疑汇总

    - **知识点概述**:Hadoop的调度器负责任务的分配和执行,包括Capacity Scheduler、Fair Scheduler等多种类型。其中,Fair Scheduler旨在实现资源公平分配的同时考虑到了一定程度的负载均衡。 - **调度器机制**: -...

    capacity-scheduler.xml

    hadoop配置之一

    Hadoop任务调度器

    2. CapacityScheduler多用户调度器:允许设置多个队列,每个队列可以有最大容量限制。资源是按照队列优先级划分的,一个队列的任务可以使用其他队列的空闲资源,适合于多用户共享集群的场景。 3. FairScheduler多...

    基于Hadoop的调度算法研究与实现.docx

    为了提高Hadoop集群的性能,研究者们提出了多种调度算法,包括Capacity Scheduler、Fair Scheduler等。Capacity Scheduler允许用户根据预定义的队列设置资源容量,确保每个队列都能获得一定比例的资源;Fair ...

Global site tag (gtag.js) - Google Analytics