`
zhangxiong0301
  • 浏览: 359727 次
社区版块
存档分类
最新评论

HADOOP2 yarn相关参数

阅读更多

注意,配置这些参数前,应充分理解这几个参数的含义,以防止误配给集群带来的隐患。另外,这些参数均需要在yarn-site.xml中配置。

1.    ResourceManager相关配置参数

(1) yarn.resourcemanager.address

参数解释:ResourceManager 对客户端暴露的地址。客户端通过该地址向RM提交应用程序,杀死应用程序等。

默认值:${yarn.resourcemanager.hostname}:8032

(2) yarn.resourcemanager.scheduler.address

参数解释:ResourceManager 对ApplicationMaster暴露的访问地址。ApplicationMaster通过该地址向RM申请资源、释放资源等。

默认值:${yarn.resourcemanager.hostname}:8030

(3) yarn.resourcemanager.resource-tracker.address

参数解释:ResourceManager 对NodeManager暴露的地址.。NodeManager通过该地址向RM汇报心跳,领取任务等。

默认值:${yarn.resourcemanager.hostname}:8031

(4) yarn.resourcemanager.admin.address

参数解释:ResourceManager 对管理员暴露的访问地址。管理员通过该地址向RM发送管理命令等。

默认值:${yarn.resourcemanager.hostname}:8033

(5) yarn.resourcemanager.webapp.address

参数解释:ResourceManager对外web ui地址。用户可通过该地址在浏览器中查看集群各类信息。

默认值:${yarn.resourcemanager.hostname}:8088

(6) yarn.resourcemanager.scheduler.class

参数解释:启用的资源调度器主类。目前可用的有FIFO、Capacity Scheduler和Fair Scheduler。

默认值:

org.apache.hadoop.yarn.server.resourcemanager.scheduler.capacity.CapacityScheduler

(7) yarn.resourcemanager.resource-tracker.client.thread-count

参数解释:处理来自NodeManagerRPC请求的Handler数目

默认值:50

(8) yarn.resourcemanager.scheduler.client.thread-count

参数解释:处理来自ApplicationMasterRPC请求的Handler数目

默认值:50

(9) yarn.scheduler.minimum-allocation-mb/ yarn.scheduler.maximum-allocation-mb

参数解释:单个可申请的最小/最大内存资源量。比如设置为1024和3072,则运行MapRedce作业时,每个Task最少可申请1024MB内存,最多可申请3072MB内存。

默认值:1024/8192

(10) yarn.scheduler.minimum-allocation-vcores / yarn.scheduler.maximum-allocation-vcores

参数解释:单个可申请的最小/最大虚拟CPU个数。比如设置为1和4,则运行MapRedce作业时,每个Task最少可申请1个虚拟CPU,最多可申请4个虚拟CPU。什么是虚拟CPU,可阅读我的这篇文章:“YARN 资源调度器剖析”。

默认值:1/32

(11) yarn.resourcemanager.nodes.include-path /yarn.resourcemanager.nodes.exclude-path

参数解释:NodeManager黑白名单。如果发现若干个NodeManager存在问题,比如故障率很高,任务运行失败率高,则可以将之加入黑名单中。注意,这两个配置参数可以动态生效。(调用一个refresh命令即可)

默认值:“”

(12) yarn.resourcemanager.nodemanagers.heartbeat-interval-ms

参数解释:NodeManager心跳间隔

默认值:1000(毫秒)

2.    NodeManager相关配置参数

(1) yarn.nodemanager.resource.memory-mb

参数解释:NodeManager总的可用物理内存。注意,该参数是不可修改的,一旦设置,整个运行过程中不可动态修改。另外,该参数的默认值是8192MB,即使你的机器内存不够8192MB,YARN也会按照这些内存来使用(傻不傻?),因此,这个值通过一定要配置。不过,Apache已经正在尝试将该参数做成可动态修改的。

默认值:8192

(2) yarn.nodemanager.vmem-pmem-ratio

参数解释:每使用1MB物理内存,最多可用的虚拟内存数。

默认值:2.1

(3) yarn.nodemanager.resource.cpu-vcores

参数解释:NodeManager总的可用虚拟CPU个数

默认值:8

(4) yarn.nodemanager.local-dirs

参数解释:中间结果存放位置,类似于1.0中的mapred.local.dir。注意,这个参数通常会配置多个目录,已分摊磁盘IO负载。

默认值:${hadoop.tmp.dir}/nm-local-dir

(5) yarn.nodemanager.log-dirs

参数解释:日志存放地址(可配置多个目录)。

默认值:${yarn.log.dir}/userlogs

(6) yarn.nodemanager.log.retain-seconds

参数解释:NodeManager上日志最多存放时间(不启用日志聚集功能时有效)。

默认值:10800(3小时)

(7) yarn.nodemanager.aux-services

参数解释:NodeManager上运行的附属服务。需配置成mapreduce_shuffle,才可运行MapReduce程序

默认值:“”

分享到:
评论

相关推荐

    hadoop 2.9.0 yarn-default.xml 属性集

    在YARN中,yarn-site.xml文件是用于配置YARN服务的属性集,其中包含了YARN运行所依赖的各种参数及其默认值和作用描述。 以下是一些yarn-site.xml中定义的关键属性及其解释: 1. yarn.resourcemanager.hostname:此...

    HadoopYARN权威指南【中、英文版】

    《Hadoop YARN 权威指南》是一本深入解析Hadoop集群资源管理框架YARN的专业书籍,分为中文版和英文版。这本书对于理解和掌握Hadoop生态系统中的YARN至关重要,尤其对于大数据开发者、系统管理员和数据科学家来说,是...

    HadoopHA集群部署、YARNHA测试Job教学课件.pptx

    【Hadoop HA 集群部署与 YARN HA 测试Job 教学】 在大数据处理领域,Hadoop 是一个至关重要的分布式计算框架,它提供了高可用性(HA)的特性来确保服务的连续性和稳定性。Hadoop HA 主要指的是 HDFS(Hadoop ...

    hadoop yarn优化配置项生成工具

    在大数据处理领域,Hadoop YARN(Yet Another Resource Negotiator)是Apache Hadoop项目的核心组件之一,主要负责集群资源的管理和调度。YARN优化对于提升整个Hadoop集群的性能至关重要,尤其是在处理大规模数据...

    HadoopYARN权威指南

    YARN是Hadoop 2.x版本引入的新一代资源管理框架,其主要目标是将原本由MapReduce承担的数据处理和资源管理职责分离,以提高系统的资源利用率和整体性能。通过YARN,可以运行各种计算框架,如MapReduce、Spark、Tez等...

    hadoop2lib.tar.gz

    在实际开发过程中,Hadoop2lib还可能包含Hadoop相关的测试工具,如MiniDFSCluster和MiniMRCluster,它们允许开发者在本地环境模拟完整的Hadoop集群,便于快速验证和调试代码。此外,由于Hadoop是高度可扩展的,所以...

    第4章 Hadoop文件参数配置.pdf

    Hadoop 文件参数配置 Hadoop 文件参数配置是 Hadoop 集群的关键组件,负责存储和管理大规模数据。为了确保 Hadoop 集群的稳定运行,需要对 Hadoop 文件参数进行正确的配置。本章节将指导读者如何配置 Hadoop 文件...

    23、hadoop集群中yarn运行mapreduce的内存、CPU分配调度计算与优化

    在Hadoop集群中,YARN(Yet Another Resource Negotiator)作为资源管理器,负责调度MapReduce任务的内存和CPU资源。YARN支持基于内存和CPU的两种资源调度策略,以确保集群资源的有效利用。在非默认配置下,合理地...

    hadoop1.x与hadoop2.x配置异同

    - **核心配置文件**:Hadoop2.x增加了`yarn-site.xml`用于配置YARN,而在Hadoop1.x中没有这个文件。 - **资源管理**:Hadoop1.x使用JobTracker进行资源管理和任务调度,而Hadoop2.x使用YARN,这是一个更为灵活和可...

    hadoop中文版API.zip

    4. Hadoop配置:如何设置配置文件,调整参数以优化性能。 5. Hadoop命令行工具:如hdfs dfs、hadoop fs等命令的使用方法。 6. 安装和部署:指导用户如何安装和配置Hadoop环境。 7. 故障排查和监控:提供解决常见问题...

    Hadoop Yarn - Apache - Cloudera - APIs

    ### Hadoop YARN调优与Cloudera配置详解 #### 一、概述 在大数据处理领域,Apache Hadoop YARN(Yet Another Resource Negotiator)作为资源管理和任务调度的核心组件,对于提升集群性能至关重要。本文将根据提供...

    spark 集群环境开发部署(hadoop,yarn,zookeeper,alluxio,idea开发环境)

    - 配置`spark-defaults.conf`文件,设置YARN相关参数。 - 启动Hadoop YARN集群。 - 提交Spark应用到YARN。 #### 五、Zookeeper与Alluxio安装 **1. Zookeeper安装与配置** - **安装Zookeeper**: - 下载Zookeeper...

    Yarn 内存分配管理机制及相关参数配置.

    本篇将深入探讨YARN内存分配的管理机制以及相关参数配置。 首先,YARN内存管理涉及到三个主要角色:ResourceManager(RM)、ApplicationMaster(AM)和NodeManager(NM)。 1. ResourceManager(RM):RM是全局...

    hadoop2部署配置文件

    2. **yarn-env.sh**: 这是YARN框架的环境变量配置文件,用于设置YARN相关的Java参数,如ResourceManager、NodeManager等服务的内存限制和CPU核心数。通过修改此文件,可以优化YARN的性能和稳定性。 3. **mapred-env...

    Hadoop技术内幕:深入Yarn架构设计与实现原理

    《Hadoop技术内幕:深入Yarn架构设计与实现原理》这本书深入探讨了Hadoop生态系统中的核心组件YARN(Yet Another Resource Negotiator),它是Hadoop 2.x版本中的关键改进,旨在解决早期Hadoop MapReduce的资源管理...

    hadoop-windows下配置文件

    7. **环境变量设置**: 在Windows上配置Hadoop还需要正确设置系统环境变量,比如添加Hadoop安装路径到PATH变量,确保系统能找到Hadoop的相关可执行文件。 8. **启动和测试**: 完成配置后,用户需要启动Hadoop的服务...

    hadoop2.x集群搭建.txt(hdfs和yarn貌似正常,但mapreduce 提交job执行失败,请看我的另一个资源,另一个搭建是成功的)

    1. **配置错误**:检查`mapred-site.xml`和`yarn-site.xml`配置文件是否正确设置了MapReduce相关的参数。 2. **依赖缺失**:确认是否安装了所有必需的库文件和依赖。 3. **权限问题**:确保用户拥有足够的权限来执行...

Global site tag (gtag.js) - Google Analytics