`
小网客
  • 浏览: 1241628 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

Yarn下的YarnChild启动个数决定参数

 
阅读更多

Yarn下的mapper和reducer并发执行个数有什么决定的呢?

由调度的资源决定的,也就是说启动的YarnChild个数多少取决于资源的分配和free的资源量

参数说明:

conf/yarn-site.xml

yarn.nodemanager.resource.memory-mb

NodeManager总的可用物理内存,默认值是8192MB,一般情况下不要修改

yarn.nodemanager.vmem-pmem-ratio

每使用1MB物理内存,最多可用的虚拟内存数默认2.1

yarn.nodemanager.resource.cpu-vcores

参数解释:NodeManager总的可用虚拟CPU个数。默认值:8

conf/mapred-site.xml:

mapreduce.map.memory.mb

每个Map Task需要的内存量默认1024m

mapreduce.map.java.opts

map的最大累计内存如:-Xmx1024M

mapreduce.reduce.memory.mb

每个Reduce Task需要的内存量默认1024m

mapreduce.reduce.java.opts

所有reduce加起来的总和内存大小如:-Xmx1024M  

yarn.scheduler.minimum-allocation-mb

默认值:1024 

yarn.scheduler.maximum-allocation-mb

默认值:8192

 

拆分说明如下:

Container for task

memory:

单位:mb

默认值:1024

首选"mapreduce.map|reduce.memory.mb" 默认值:0

其次

获取-Xmx配置的heapsize

配置项首选 "mapreduce.map|reduce.java.opts"

其次 "mapred.child.java.opts" 默认值:-Xmx200m

xmx浮动

浮动比例:"mapreduce.xmx.overflow.memory.percent" 默认值:0.1

浮动量:"mapreduce.xmx.overflow.memory.mb" 默认值:128

综合:xmx = ceil(xmx * (1 + 0.1) + 128 * 1.0) 即默认200*1.1 + 128 = 348

cpu

单位:vcore

默认值:1

配置项:"mapreduce.map|reduce.cpu.vcores"

 

Container for appmaster

memory

单位:mb

默认值:1536

配置项:"yarn.app.mapreduce.am.resource.mb"

cpu

单位:vcore

默认值:1

配置项:"yarn.app.mapreduce.am.resource.cpu-vcores"

 

调度器控制

memory

单位:mb

申请最小值:"yarn.scheduler.minimum-allocation-mb" 默认值:1024

申请最大值:"yarn.scheduler.maximum-allocation-mb" 默认值:8192

cpu

单位:vcore

申请最小值:"yarn.scheduler.minimum-allocation-vcores" 默认值:1

申请最大值:"yarn.scheduler.maximum-allocation-vcores" 默认值:4

 

0
0
分享到:
评论

相关推荐

    Yarn 内存分配管理机制及相关参数配置.

    YARN(Yet Another Resource Negotiator)是Apache Hadoop的一个核心组件,主要负责集群资源的管理和调度。在YARN中,内存分配管理是一个关键环节,它直接影响到应用性能和集群资源的有效利用。本篇将深入探讨YARN...

    Hadoop大数据平台构建、YARN配置、启动与验证教学课件.pptx

    在`yarn-site.xml`配置文件中,我们需要设置以下几个关键参数: 1. `<name>yarn.nodemanager.aux-services</name>`:这个属性定义了nodemanager需要支持的辅助服务,这里是`mapreduce.shuffle`,它是MapReduce作业...

    Spark实验:On Yarn模式安装部署(带答案)1

    在这个实验中,我们将详细探讨如何在Yarn模式下安装和部署Spark集群。 首先,我们需要准备实验环境,这里包括三台虚拟机,操作系统为CentOS 7.5,Hadoop版本为2.7.3,Spark版本为2.1.1。这些版本的兼容性对于实验的...

    05.yarn集群安装启动.mp4

    05.yarn集群安装启动.mp4

    Hadoop的yarn详解

    当一个应用程序提交给YARN后,ResourceManager将为该应用程序启动一个ApplicationMaster实例,然后ApplicationMaster会向ResourceManager申请资源。一旦资源被分配给ApplicationMaster,它就会启动相应的任务容器...

    yarn 1.6 WIN安装文件

    - 创建新项目:在项目目录下,运行`yarn init`,这会创建一个`package.json`文件来管理项目依赖。 - 安装依赖:使用`yarn add [package]`命令安装新的npm包,例如`yarn add express`将安装Express框架。 - 更新...

    yarn-1.22.4.msi和yarn-1.22.5.msi

    这两个文件,"yarn-1.22.4.msi" 和 "yarn-1.22.5.msi",是Yarn的特定版本安装程序,适用于Windows操作系统,因为它们的扩展名是".msi",这是Microsoft Installer的文件格式。 Yarn 1.22.4和1.22.5是稳定版本,每个...

    yarn 前端打包工具指定配置文件

    在前端开发领域,`Yarn` 是一个非常流行的依赖管理工具,它被广泛用于替代 `npm` 进行包的安装和管理。`Yarn` 提供了更快的速度、更可靠的重复性和更好的安全性。在某些情况下,我们可能需要对前端项目进行特定的...

    yarn.lock yarn install 安装失败,使用官方下载的yarn.lock文件

    npm install -g yarn yarn install 安装失败,使用官方下载的yarn.lock文件

    最新yarn-1.22.5的windows的msi安装版本

    3. **工作区支持**:Yarn 1.x 引入了工作区功能,方便管理多模块项目,可以在一个根目录下管理多个独立的代码库。 4. **缓存管理**:Yarn 的缓存机制能有效减少网络延迟,重复安装包时会直接从本地缓存中读取,提高...

    yarn基本运作流程

    3. **ApplicationMaster (AM)**:每个应用程序的主进程,在YARN上运行一个特定的应用程序时启动,负责与ResourceManager协商资源,并与NodeManager通信来执行和监控任务。 4. **Container**:由NodeManager启动的...

    YARN Essentials.PDF

    - **容器配置:** 可以通过配置文件来设置容器的最大内存、CPU 核心数等参数。 **2. 调度策略配置:** - **FIFO 调度器配置:** 设置默认的调度策略为 FIFO。 - **容量调度器配置:** 定义队列及其优先级、最大资源...

    YARN学习书籍及注解

    【标题】"YARN学习书籍及注解"涵盖了Hadoop YARN的相关知识,这是一个重要的分布式资源管理系统,用于处理大数据计算。YARN(Yet Another Resource Negotiator)是Hadoop生态系统中的核心组件之一,它负责管理和调度...

    yarn1.22.4与1.22.5最新安装包windows

    在本文中,我们将深入探讨Yarn 1.22.4和1.22.5这两个版本在Windows环境下的安装过程及其特点。 首先,Yarn 1.22.4和1.22.5都是针对提高性能和稳定性而发布的更新。尽管这两个版本之间的变化可能不大,但它们通常会...

    yarn-1.22.0.msi

    只需在根目录下创建一个`workspaces`字段的`package.json`,列出所有子项目,Yarn就会自动处理这些子项目的依赖。 此外,Yarn提供了`yarn upgrade`、`yarn remove`、`yarn info`等命令,用于升级依赖、移除依赖和...

    hadoop 2.9.0 yarn-default.xml 属性集

    12. yarn.resourcemanager.amlauncher.thread-count:此属性为应用程序启动器设置线程数,默认值为10。 13. yarn.resourcemanager.nodemanager-connect-retries:此属性设置节点管理器连接失败时的最大重试次数,...

    Yarn的操作.pdf

    例如,我们可以设置num-executors参数来指定Executor的数量,设置executor-cores参数来指定每个Executor的核心数,设置executor-memory参数来指定每个Executor的内存大小。 Spark任务的并行度 Spark任务的并行度是...

    yarn.tar.gz

    【标题】"yarn.tar.gz" 是一个归档文件,它使用了gzip压缩算法来减小文件大小。在IT行业中,这种格式常用于分发软件、源代码或数据集,以便于下载和存储。"tar"是Linux和Unix系统中的一个工具,用于将多个文件和目录...

Global site tag (gtag.js) - Google Analytics