`
eric_weitm
  • 浏览: 243533 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

yarn 概述

 
阅读更多

yarn 概述

hdfs上面的资源管理和计算框架

 

一、角色划分

http://www.cnblogs.com/chushiyaoyue/p/5784871.html

ResourceManager rm; 总控 = 调度器 + 应用程序管理器

NodeManager nm;具体节点

ApplicationMaster am; 应用

Container是一个动态资源分配单位,它将内存、CPU、磁盘、网络等资源封装在一起,从而限定每个任务使用的资源量。

 

 

二、yarn job的调度过程

1、提交,其中包括ApplicationMaster程序、启动ApplicationMaster的命令、用户程序等。

2、ResourceManager为该应用程序分配第一个Container,并与对应的Node-Manager通信,要求它在这个Container中启动应用程序的ApplicationMaster。

3、ApplicationMaster首先向ResourceManager注册,这样用户可以直接通过ResourceManager查看应用程序的运行状态,然后它将为各个任务申请资源,并监控它的运行状态,直到运行结束,即重复步骤4~7。

4、ApplicationMaster采用轮询的方式通过RPC协议向ResourceManager申请和领取资源

5、一旦ApplicationMaster申请到资源后,便与对应的NodeManager通信,要求它启动任务。

6、NodeManager为任务设置好运行环境(包括环境变量、JAR包、二进制程序等)后,将任务启动命令写到一个脚本中,并通过运行该脚本启动任务。

7、各个任务通过某个RPC协议向ApplicationMaster汇报自己的状态和进度,以让ApplicationMaster随时掌握各个任务的运行状态,从而可以在任务失败时重新启动任务。在应用程序运行过程中,用户可随时通过RPC向ApplicationMaster查询应用程序的当前运行状态。

8、应用程序运行完成后,ApplicationMaster向ResourceManager注销并关闭自己。

 

三、总结

ResourceManager和NodeManager(NM)组成了基本的数据计算框架。application相当于map-reduce job或者DAG jobs。ApplicationMaster对应的是一个应用程序,也就是一个map-reduce job

和map reduce相比,是把资源管理和作业调度进行了解耦(只提供资源管理)

分享到:
评论

相关推荐

    董西成:Hadoop YARN程序设计与应用案例

    ### YARN概述 YARN,即Yet Another Resource Negotiator,是Hadoop 2.x引入的一个重要组件,它的核心目标是解决Hadoop 1.x版本中的可扩展性问题,将资源管理和作业调度/监控分离开来,极大地提高了系统的灵活性和...

    yarn架构与讲解

    #### 一、YARN概述 YARN(Yet Another Resource Negotiator)是Apache Hadoop项目中的一个子项目,旨在为应用程序提供统一的资源管理和调度功能。YARN不仅支持MapReduce框架,还支持其他计算框架如Spark、Flink等,...

    YARN Application Development.

    #### 一、YARN 概述与应用开发背景 YARN(Yet Another Resource Negotiator)是 Hadoop 生态系统中的一个关键组件,它为大规模分布式应用程序提供资源管理和调度的功能。相较于传统的 MapReduce 架构,YARN 能够更...

    Yarn资源调用demo案例

    一、YARN概述 YARN是Hadoop生态系统中的核心组件之一,主要任务是处理数据处理作业的资源分配和调度。与早期版本的Hadoop相比,YARN将JobTracker的功能拆分为ResourceManager(RM)和ApplicationMaster(AM),实现...

    Hadoop技术内幕:深入Yarn架构设计与实现原理

    一、YARN概述 YARN的核心理念是将数据计算和资源管理分离,使得Hadoop不再仅仅局限于MapReduce一种计算模型。它将集群资源管理和应用程序管理两个职责分开,由Resource Manager(RM)负责全局资源调度,而...

    Hadoop技术内幕:深入解析YARN架构设计与实现原理.pdf Hadoop技术内幕:深入解析YARN架构设计与实现原理.pdf

    1. **YARN概述**:YARN的核心理念是将集群资源管理和应用程序的执行分离,资源管理由ResourceManager(RM)负责,应用程序执行则交给ApplicationMaster(AM)。这种分离使得系统能够支持多种计算框架,如MapReduce、...

    HadoopYARN权威指南

    一、YARN概述 YARN是Hadoop 2.x版本引入的新一代资源管理框架,其主要目标是将原本由MapReduce承担的数据处理和资源管理职责分离,以提高系统的资源利用率和整体性能。通过YARN,可以运行各种计算框架,如MapReduce...

    Yarn知名培训私密资料

    【YARN概述】 YARN(Yet Another Resource Negotiator)是Apache Hadoop中用于资源管理和作业调度的核心组件。在Hadoop 2.x版本中引入,YARN的目标是解决原MapReduce框架(MRv1)的不足,提高集群资源的利用率和...

    09. Yarn以及Hadoop优化.docx

    【Yarn概述】 Yarn,全称Yet Another Resource Negotiator,是Apache Hadoop项目中的一个核心组件,主要负责管理分布式计算集群的资源调度。它为各种计算框架(如MapReduce)提供了一个统一的资源管理和调度平台,...

    YARN应用开发与核心源码剖析.pdf

    YARN概述 Hadoop YARN(Yet Another Resource Negotiator)是Hadoop生态系统中的一种新型资源管理框架,它为上层应用提供了一个统一的资源管理和调度平台。YARN的引入极大地提高了集群的利用率,实现了资源的有效...

    高级软件人才培训专家-Hadoop课程资料-3-第三章 - MapReduce & YARN入门

    #### 知识点三:YARN概述 - **背景介绍**:随着Hadoop应用的扩展,原有的JobTracker机制在处理大量并发任务时出现性能瓶颈。因此,Apache Hadoop引入了YARN(Yet Another Resource Negotiator)作为新的资源管理器...

    Yarn的业界解决方案和未来方向.docx

    #### 0x01 Yarn概述 Yarn(Yet Another Resource Negotiator),作为Apache Hadoop项目中的一个子项目,主要负责集群资源的管理和调度。它通过以下三个核心组件实现其功能: 1. **ResourceManager (RM)**:管理...

    YARN框架概述与集群部署.pdf

    ### YARN框架概述与集群部署知识点详解 #### 一、YARN框架的产生与发展 **1.1 YARN产生和发展简史** ##### 1.1.1 Hadoop演进阶段 - **Ad Hoc集群阶段**(阶段0): 在这一阶段,Hadoop集群主要用于临时搭建,通常...

    Yarn获取Application列表编码

    Yarn 获取 Application 列表编码概述 Yarn 获取 Application 列表编码是指通过 Yarn 客户端 API 获取当前 Hadoop 集群中的应用程序列表,并获取每个应用程序的详细信息。该操作通常用于监控和管理 Hadoop 集群中的...

    大数据技术Hadoop3.x 2021年

    14_Hadoop_入门_YARN概述.mp4 16_Hadoop_入门_HDFS&YARN&MR关系.mp4 17_Hadoop_入门_大数据技术生态体系.mp4 18_Hadoop_入门_VMware安装.mp4 20_Hadoop_入门_IP和主机名称配置.mp4 21_Hadoop_入门_Xshell远程访问...

    手把手教你搭建 5 节点 Hadoop 分布式集群(HA).pdf

    YARN 概述 YARN(Yet Another Resource Negotiator)是 Hadoop 的资源管理和任务调度系统,负责管理和调度数据处理任务。YARN 架构主要由以下几部分组成: * ResourceManager:负责管理集群的资源,调度数据处理...

Global site tag (gtag.js) - Google Analytics