`
han_zw
  • 浏览: 174175 次
  • 性别: Icon_minigender_1
  • 来自: 天津
社区版块
存档分类
最新评论

hadoop 2.7.2 yarn中文文档——ResourceManger Restart

 
阅读更多
综述
ResourceManager是管理资源和调度YARN中运行的application的中心机构。因此,它在Apache YARN 集群中存在潜在的单点故障。本文档给出有关ResourceManager Restart特性的概述,该特性强化ResourceManager可以跨越重启操作继续运转,另外让ResourceManager的停机时间对终端用户不可见。
ResourceManager Restart特性分成两个阶段:
  • ResourceManager Restart阶段1(Non-work-preserving RM restart):RM在插件化的 state-store中持久化application/attempt状态以及其他证书信息。在重启过程中RM会从state-store中重载这些信息,并且重新启动之前Running的application。用户不需要重新提交这些application。
  • ResourceManager Restart 阶段 2 (Work-preserving RM restart):聚焦在通过结合重启过程中来自NodeManager的容器状态和来自ApplicationMaster的容器请求重新构建ResourceManager的运行状态。与阶段1的关键不同是之前运行中的应用程序在RM重启中不会被kill,所以application不会因为RM的中断丢失它的工作内容。
 
特性
  • 阶段1:Non-work-preserving RM restart
到Hadoop 2.4.0发布为止,只有ResourceManager Restart 阶段1是实现完成的,下面对此进行描述.
整体思路是在client提交application,以及application完成时保存application最终状态(完成状态,如failed, killed, finished)和排错信息,RM会在插件化的 state-store 持久化application的元数据(如ApplicationSubmissionContext)。此外,RM也会存储证书信息,如在安全环境下工作需要的security keys, tokens 。RM任何时间关闭,只要必需的信息(如application 元数据和其在安全环境下运行所需的证书)在 state-store中可用,那么当重启时,RM能从state-store获取application元数据并且重新提交application。如果applications在RM关闭前已经完成(如failed, killed, finished),RM不会重新提交application。
NodeManagers和Clients在RM的宕机时间内保持轮询RM状态直到RM恢复。当RM重新启动之后,它会通过心跳发送 re-sync命令到所有的NodeManagers和ApplicationMasters。到Hadoop2.4.0发布为止,NodeMansger和ApplicationMaster处理这个命令的行为是:NMs会杀死它管理的所有容器,然后重新注册到RM。在RM看来,这些重新注册上来的NodeManager就相当于新加入的NMs。AMs(如MapReduce AM)在收到re-sync命令之后会关闭。在RM重启并从state-store加载所有application的元数据、证书,在内存中重新组装这些信息之后,它将会为每个未完成的application创建一个新的的attempt (如ApplicationMaster)并且像普通application一样重新触发该application。如上所述,之前running的application的中间工作内容会丢失,因为它们被RM在重启过程中通过re-sync 命令杀死了。
 
  • 阶段2:Work-preserving RM restart
到hadoop2.6.0发布,进一步增强了RM start功能来解决如何RM重启可以不杀死任何在集群中运行的applications。
超越了阶段1已经完成的基础性工作,即持久化和重新加载、恢复application状态元数据,阶段2主要聚焦在重新构建完整的集群运行时状态,主要就是RM内部的中心调度器保持跟踪所有容器的生命周期,application的上下文和资源请求,队列的资源使用情况等。这种方式下,RM不再需要像在阶段1中那样杀死AM并重新运行。Application能够简单的与RM re-sync,并继续它的剩下的工作。
RM利用NMs发送的容器状态信息恢复自身的运行状态。在与RM re-syncs时NM不会杀死容器。在重新注册之后,NM继续管理容器,以及发送容器状态到RM。RM利用这些容器的信息重新构建容器实例和相关Application的调度状态。同时,AM需要重新发送未完成的资源请求到RM,因为在RM停机时,可能会丢失未得到满足的请求。Application利用它的AMRMClient 库与RM通信,不用担心AM 在re-sync时重新发送资源请求,因为它是通过工具库自身自动完成。
 
配置
本部分描述启用 RM Restart特性的配置。
启用RM Restart
Property Description
yarn.resourcemanager.recovery.enabled true
为持久化RM状态配置state-store
Property Description
yarn.resourcemanager.store.class 用于存储application/attempt状态和证书的state-store 类名。可用的state-store实现包括:
org.apache.hadoop.yarn.server.resourcemanager. recovery.ZKRMStateStore,一个基于zookeeper的实现;
org.apache.hadoop.yarn.server.resourcemanager. recovery.FileSystemRMStateStore,基于hadoop文件系统的state-store实现,类似于HDFS和本地FS;
org.apache.hadoop.yarn.server.resourcemanager. recovery.LeveldbRMStateStore,一个基于LevelDB的state-store实现。默认值是org.apache.hadoop.yarn.server.resourcemanager. recovery.FileSystemRMStateStore。
 
如何选择state-store实现
  • ZooKeeper based state-store:用户可以自由选择任一存储建立RM restart,但是必须使用基于zookeeper的state-store来支持RM HA。原因是只有该实现可以避免多RMs时的脑裂问题。
  • FileSystem based state-store: 基于HDFS和本地FS的state-store,不支持RM的HA机制。
  • LevelDB based state-store:基于LevelDB比基于HDFS和Zookeeper的state-store更加轻量级。LevelDB更好的支持原子操作,每次状态更新时需要更少的IO操作,以及在文件系统中非常少的文件总数。不支持RM HA。
基于Hadoop文件系统的state-store实现的配置
支持HDFS和本地FS的state-store实现. 文件系统的类型用URL的schema来判断。如hdfs://localhost:9000/rmstore表明勇hdfs作为存储,file:///tmp/yarn/rmstore 表明勇本地FS存储. 如果在URL中没有schema(hdfs:// 或者file://)指定,存储的类型通过 core-site.xml文件中定义的fs.defaultFS来判定。
  • 配置RM状态在Hadoop 文件系统中保存的URI
Property Description
yarn.resourcemanager.fs.state-store.uri 指定RM状态将被保存在文件系统的位置,如hdfs://localhost:9000/rmstore。默认值是${hadoop.tmp.dir}/yarn/system/rmstore。如果文件系统name未指定,将会使用*conf/core-site.xml中fs.default.name的定义。
 
  • state-store客户端连接Hadoop文件系统的重试策略
Property Description
yarn.resourcemanager.fs.state-store.retry-policy-spec

hadoop文件系统客户端重试策略设置。hadoop文件系统客户端重试一直是启用的。

指定sleep-time 和 number-of-retries对,如(t0, n0), (t1, n1), …,首先的n0次重试平均sleep t0毫秒,接来下的n1次重试平均sleep t1毫秒,以此类推。默认值是(2000, 500)。

 
基于zookeeper的state-store实现配置
  • 配置RM状态存储的Zookeeper服务器地址和根目录
Property Description
yarn.resourcemanager.zk-address 逗号分隔的host:port对。zookeeper server(如“127.0.0.1:3000, 127.0.0.1:3001, 127.0.0.1:3002”)用来存储RM的状态.
yarn.resourcemanager.zk-state-store.parent-path RM状态存储的根znode的完整路径。默认值是/rmstore.
 
  • 配置state-store 连接zookeeper server的重试策略
Property Description
yarn.resourcemanager.zk-num-retries 如果连接断开,RM尝试连接Zookeeper server的次数。默认值是500.
yarn.resourcemanager.zk-retry-interval-ms 重试连接Zookeeper server的间隔毫秒数。默认是2秒。
yarn.resourcemanager.zk-timeout-ms Zookeeper会话超时时间,单位毫秒。这个配置用于Zookeeper server判断何时会话过期。当server在指定的会话超时内不能感知到client。默认值是10秒。
 
  • 配置设置Zookeeper znode权限的ACLs
Property Description
yarn.resourcemanager.zk-acl 用来设置Zookeeper znode权限的ACLs。默认值是 world:anyone:rwcda
基于LevelDB的State-Store实现的配置项
Property Description
yarn.resourcemanager.leveldb-state-store.path

RM状态存储的本地路径,默认值是

${hadoop.tmp.dir}/yarn/system /rmstore

work-preserving 方式的RM recovery配置项
Property Description
yarn.resourcemanager.work-preserving-recovery.scheduling-wait-ms 设置RM在 work-preserving recovery场景下分配新容器前的等待时间。这个周期让RM在为application分配新容器前,有机会去安心的与集群中的NMs进行同步。
备注
在work-preserving recovery启用的情况下,RM重启后ContainerId 字符串格式会改变。曾经这种格式:Container_{clusterTimestamp}_{appId}_{attemptId}_{containerId},例如Container_1410901177871_0001_01_000005。现在变更为 Container_e{epoch}_{clusterTimestamp}_{appId}_{attemptId}_{containerId},例如Container_e17_1410901177871_0001_01_000005。这里新增的epoch数字是一个单调递增的整数,从0开始每次重启增长1.如果epoch 数字是0,它将会被忽略,containerId 字符串保留之前的格式。
 
配置样例
以下是一个基于Zookeeper的state-store启用 RM work-preserving restart的最小的集合。
<property>
   <description>Enable RM to recover state after starting. If true, then
   yarn.resourcemanager.store.class must be specified</description>
   <name>yarn.resourcemanager.recovery.enabled</name>
   <value>true</value>
 </property>

 <property>
   <description>The class to use as the persistent store.</description>
   <name>yarn.resourcemanager.store.class</name>
   <value>org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore</value>
 </property>

 <property>
   <description>Comma separated list of Host:Port pairs. Each corresponds to a ZooKeeper server
   (e.g. "127.0.0.1:3000,127.0.0.1:3001,127.0.0.1:3002") to be used by the RM for storing RM state.
   This must be supplied when using org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore
   as the value for yarn.resourcemanager.store.class</description>
   <name>yarn.resourcemanager.zk-address</name>
   <value>127.0.0.1:2181</value>
 </property>
 
分享到:
评论

相关推荐

    基于微信小程序的在线办公小程序答辩PPT.pptx

    基于微信小程序的在线办公小程序答辩PPT.pptx

    机器学习(预测模型):2000年至2015年期间193个国家的预期寿命和相关健康因素的数据

    这个数据集来自世界卫生组织(WHO),包含了2000年至2015年期间193个国家的预期寿命和相关健康因素的数据。它提供了一个全面的视角,用于分析影响全球人口预期寿命的多种因素。数据集涵盖了从婴儿死亡率、GDP、BMI到免疫接种覆盖率等多个维度,为研究者提供了丰富的信息来探索和预测预期寿命。 该数据集的特点在于其跨国家的比较性,使得研究者能够识别出不同国家之间预期寿命的差异,并分析这些差异背后的原因。数据集包含22个特征列和2938行数据,涉及的变量被分为几个大类:免疫相关因素、死亡因素、经济因素和社会因素。这些数据不仅有助于了解全球健康趋势,还可以辅助制定公共卫生政策和社会福利计划。 数据集的处理包括对缺失值的处理、数据类型转换以及去重等步骤,以确保数据的准确性和可靠性。研究者可以使用这个数据集来探索如教育、健康习惯、生活方式等因素如何影响人们的寿命,以及不同国家的经济发展水平如何与预期寿命相关联。此外,数据集还可以用于预测模型的构建,通过回归分析等统计方法来预测预期寿命。 总的来说,这个数据集是研究全球健康和预期寿命变化的宝贵资源,它不仅提供了历史数据,还为未来的研究和政策制

    基于微信小程序的“健康早知道”微信小程序答辩PPT.pptx

    基于微信小程序的“健康早知道”微信小程序答辩PPT.pptx

    基于微信小程序的电影交流平台答辩PPT.pptx

    基于微信小程序的电影交流平台答辩PPT.pptx

    计算机字符编码GB18030.PDF

    计算机字符编码GB18030

    Hive 操作基础(进阶版)多级分区数据文件2

    Hive 操作基础(进阶版)多级分区数据文件2

    基于java的贫困生管理系统答辩PPT.pptx

    基于java的贫困生管理系统答辩PPT.pptx

    pandas-2.1.4-cp312-cp312-win_amd64.zip

    pandas whl安装包,对应各个python版本和系统(具体看资源名字),找准自己对应的下载即可! 下载后解压出来是已.whl为后缀的安装包,进入终端,直接pip install pandas-xxx.whl即可,非常方便。 再也不用担心pip联网下载网络超时,各种安装不成功的问题。

    TA_Lib轮子无需编译-TA_Lib-0.4.18-cp38-cp38-win32.whl.zip

    TA_lib库(whl轮子),直接pip install安装即可,下载即用,非常方便,各个python版本对应的都有。 使用方法: 1、下载下来解压; 2、确保有python环境,命令行进入终端,cd到whl存放的目录,直接输入pip install TA_lib-xxxx.whl就可以安装,等待安装成功,即可使用! 优点:无需C++环境编译,下载即用,方便

    课设毕设基于SpringBoot+Vue的瑜伽体验课预约系统源码可运行.zip

    本压缩包资源说明,你现在往下拉可以看到压缩包内容目录 我是批量上传的基于SpringBoot+Vue的项目,所以描述都一样;有源码有数据库脚本,系统都是测试过可运行的,看文件名即可区分项目~ |Java|SpringBoot|Vue|前后端分离| 开发语言:Java 框架:SpringBoot,Vue JDK版本:JDK1.8 数据库:MySQL 5.7+(推荐5.7,8.0也可以) 数据库工具:Navicat 开发软件: idea/eclipse(推荐idea) Maven包:Maven3.3.9+ 系统环境:Windows/Mac

    tornado-6.2b2.tar.gz

    tornado-6.2b2.tar.gz

    javawe论坛项目 原生技术

    javawe论坛项目 原生技术

    tornado-6.2b1-cp310-cp310-macosx_10_9_universal2.whl

    tornado-6.2b1-cp310-cp310-macosx_10_9_universal2.whl

    基于司机信用评价的货运管理系统(springboot+vue+mysql+说明文档).zip

    随着物流行业的快速发展,货运管理变得愈发重要。为了提高货运效率,确保货物安全,我们开发了这款基于司机信用评价的货运管理系统。 该系统主要包含了货物信息管理、订单评价管理、货主管理等多个功能模块。在货物信息管理模块中,用户可以查看和管理货物的详细信息,包括货物名称、规格、装车状态、运输状态以及卸货状态等,方便用户随时掌握货物的动态。 订单评价管理模块是该系统的核心之一,它允许货主对司机的服务进行评价,系统会根据评价数据对司机进行信用评分。这一功能不仅有助于提升司机的服务质量,还能为货主提供更加可靠的货运选择。 此外,货主管理模块提供了货主信息的录入、修改和查询等功能,方便用户管理自己的货主资料。系统界面简洁明了,以蓝色为主色调,设计现代且专业,为用户提供了良好的使用体验。 通过该系统,用户可以轻松实现货物信息的查看和管理,对司机的服务进行评价,提高货运效率和服务质量。同时,系统也为司机提供了一个展示自我、提升信用的平台,有助于推动物流行业的健康发展。

    毕业生交流学习平台 SSM毕业设计 附带论文.zip

    毕业生交流学习平台 SSM毕业设计 附带论文 启动教程:https://www.bilibili.com/video/BV1GK1iYyE2B

    基于java的广场舞团答辩PPT.pptx

    基于java的广场舞团答辩PPT.pptx

    基于java的基于SSM的校园音乐平台答辩PPT.pptx

    基于java的基于SSM的校园音乐平台答辩PPT.pptx

    安装包JIRATimeSLA

    Jira插件安装包

    【java毕业设计】基于图像识别与分类的中国蛇类识别系统源码(springboot+vue+mysql+说明文档).zip

    项目经过测试均可完美运行! 环境说明: 开发语言:java jdk:jdk1.8 数据库:mysql 5.7+ 数据库工具:Navicat11+ 管理工具:maven 开发工具:idea/eclipse

    tornado-6.2b2-cp37-abi3-win_amd64.whl

    tornado-6.2b2-cp37-abi3-win_amd64.whl

Global site tag (gtag.js) - Google Analytics