（转）hadoop yarn 内存相关配置 -

zhangxiong0301

浏览: 362927 次

最近访客更多访客>>

brosnan2800

rl724

itgege

fhtwins

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

（转）hadoop yarn 内存相关配置

博客分类：

HADOOP

yarn 内存

1.YARN中处理能力的基本单元是什么？
2.什么是保留内存？
3.4到8G Container建议多少M？

在Hadoop2.0中, YARN负责管理MapReduce中的资源(内存, CPU等)并且将其打包成Container. 这样可以精简MapReduce, 使之专注于其擅长的数据处理任务, 将无需考虑资源调度. YARN会管理集群中所有机器的可用计算资源. 基于这些资源YARN会调度应用(比如MapReduce)发来的资源请求, 然后YARN会通过分配Container来给每个应用提供处理能力, Container是YARN中处理能力的基本单元, 是对内存, CPU等的封装.

在Hadoop集群中，平衡内存（RAM）、处理器（CPU核心）和磁盘的使用是至关重要的，合理规划以免某一项引起瓶颈制约。一般的建议是，一块磁盘和一个CPU核心上配置两个Container会达到集群利用率的最佳平衡。

从可用的硬件资源角度看，要调整群集每个节点Yarn和MapReduce的内存配置到合适的数据，应注意以下几个重要的元素：

RAM (总内存大小)
CORES (CPU核心数)
DISKS (磁盘数)

Yarn和MapReduce的总的可用内存应考虑到保留的内存。保留的内存是由系统进程和其他Hadoop进程（如Hbase）所需要的内存。
保留内存=保留系统内存+保留HBase内存（如果HBase是在同一个节点）
使用下表确定每个节点的保留的内存：

建议保留的内存

每个节点的内存总量	建议保留系统内存	建议保留HBase的内存
4 GB	1 GB	1 GB
8 GB	2 GB	1 GB
16 GB	2 GB	2 GB
24 GB	4 GB	4 GB
48 GB	6 GB	8 GB
64 GB	8 GB	8 GB
72 GB	8 GB	8 GB
96 GB	12 GB	16 GB
128 GB	24 GB	24 GB
256 GB	32 GB	32 GB
512 GB	64 GB	64 GB

下面的计算是确定每个节点的Container允许的最大数量。
#Container数量=min (2*CORES, 1.8*DISKS, (可用内存)/最低Container的大小)
最低Container的大小这个值是依赖于可用的RAM数量——在较小的存储节点，最小的Container的大小也应较小。下面的表列出了推荐值：

每个节点的总内存	建议的最低Container的大小
小于 4 GB	256 MB
4 GB 到 8 GB	512 MB
8 GB 到 24 GB	1024 MB
24 GB 以上	2048 MB

最后计算的每个Container的内存大小是：

每个Container的内存大小 = max(最小Container内存大小, (总可用内存) /Container数))

根据计算，YARN 和 MapReduce 配置如下：

配置文件	配置项	设置值
yarn-site.xml	yarn.nodemanager.resource.memory-mb	= Container数量 * 每个Container的内存大小
yarn-site.xml	yarn.scheduler.minimum-allocation-mb	= 每个Container的内存大小
yarn-site.xml	yarn.scheduler.maximum-allocation-mb	= Container数量 * 每个Container的内存大小
mapred-site.xml	mapreduce.map.memory.mb	= 每个Container的内存大小
mapred-site.xml	mapreduce.reduce.memory.mb	= 2 * 每个Container的内存大小
mapred-site.xml	mapreduce.map.java.opts	= 0.8 * 每个Container的内存大小
mapred-site.xml	mapreduce.reduce.java.opts	= 0.8 * 2 * 每个Container的内存大小
yarn-site.xml (check)	yarn.app.mapreduce.am.resource.mb	= 2 * 每个Container的内存大小
yarn-site.xml (check)	yarn.app.mapreduce.am.command-opts	= 0.8 * 2 * 每个Container的内存大小

提醒: 安装完成后, yarn-site.xml 和 mapred-site.xml 的配置文件在安装目录的 /etc/hadoop/文件夹下.

例如：
集群的节点有 12 CPU cores, 48 GB RAM, and 12 磁盘.
预留内存= 6 GB 系统预留 + 8 GB HBase预留
最小Container内存大小 = 2 GB

如果不安装 HBase:
#Container数 = min (2*12, 1.8* 12, (48-6)/2) = min (24, 21.6, 21) = 21
每个Container的内存大小 = max (2, (48-6)/21) = max (2, 2) = 2

Configuration	Value Calculation
yarn.nodemanager.resource.memory-mb	= 21 * 2 = 42*1024 MB
yarn.scheduler.minimum-allocation-mb	= 2*1024 MB
yarn.scheduler.maximum-allocation-mb	= 21 * 2 = 42*1024 MB
mapreduce.map.memory.mb	= 2*1024 MB
mapreduce.reduce.memory.mb	= 2 * 2 = 4*1024 MB
mapreduce.map.java.opts	= 0.8 * 2 = 1.6*1024 MB
mapreduce.reduce.java.opts	= 0.8 * 2 * 2 = 3.2*1024 MB
yarn.app.mapreduce.am.resource.mb	= 2 * 2 = 4*1024 MB
yarn.app.mapreduce.am.command-opts	= 0.8 * 2 * 2 = 3.2*1024 MB

如果安装 Hbase：
#Container数 = min (2*12, 1.8* 12, (48-6-8)/2) = min (24, 21.6, 17) = 17
每个Container的内存大小 = max (2, (48-6-8)/17) = max (2, 2) = 2

配置项	配置大小
yarn.nodemanager.resource.memory-mb	= 17 * 2 = 34*1024 MB
yarn.scheduler.minimum-allocation-mb	= 2*1024 MB
yarn.scheduler.maximum-allocation-mb	= 17 * 2 = 34*1024 MB
mapreduce.map.memory.mb	= 2*1024 MB
mapreduce.reduce.memory.mb	= 2 * 2 = 4*1024 MB
mapreduce.map.java.opts	= 0.8 * 2 = 1.6*1024 MB
mapreduce.reduce.java.opts	= 0.8 * 2 * 2 = 3.2*1024 MB
yarn.app.mapreduce.am.resource.mb	= 2 * 2 = 4*1024 MB
yarn.app.mapreduce.am.command-opts	= 0.8 * 2 * 2 = 3.2*1024 MB

分享到：

YARN的一些常见错误 | vmstat

2015-06-11 09:09
浏览 1485
评论(0)
分类:开源软件
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

（转）hadoop yarn 内存相关配置

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

（转）hadoop yarn 内存相关配置

评论

发表评论

相关推荐

HADOOP中mapreduce开启压缩功能

HIVE跑mapjoin时所有任务失败--问题分析及解决

hadoop、hbase节点下线

HADOOP中设置map个数

hadoop安全机制

CDH对hadoop的一些配置指南，包括THP

MAP运行过程

MAP/REDUCE TASK作业状态转移图

YARN常见问题

转载--淘宝hadoop升级遇到的问题

mapreduce数据流配置

HADOOP2 yarn相关参数

HADOOP2 mapreduce配置（转）

YARN的一些常见错误

(转) hadoop2安装LZO

（转）提高mapreduce性能的几点建议-cloudera

（转）YARN内存配置

（转）HADOOP2.6基于标签的调度

HADOOP平台优化综述（转自董的博客）

hadoop ha 启停命令

最近访客更多访客>>