yarn 概述
hdfs上面的资源管理和计算框架
一、角色划分
http://www.cnblogs.com/chushiyaoyue/p/5784871.html
ResourceManager rm; 总控 = 调度器 + 应用程序管理器
NodeManager nm;具体节点
ApplicationMaster am; 应用
Container是一个动态资源分配单位,它将内存、CPU、磁盘、网络等资源封装在一起,从而限定每个任务使用的资源量。
二、yarn job的调度过程
1、提交,其中包括ApplicationMaster程序、启动ApplicationMaster的命令、用户程序等。
2、ResourceManager为该应用程序分配第一个Container,并与对应的Node-Manager通信,要求它在这个Container中启动应用程序的ApplicationMaster。
3、ApplicationMaster首先向ResourceManager注册,这样用户可以直接通过ResourceManager查看应用程序的运行状态,然后它将为各个任务申请资源,并监控它的运行状态,直到运行结束,即重复步骤4~7。
4、ApplicationMaster采用轮询的方式通过RPC协议向ResourceManager申请和领取资源
5、一旦ApplicationMaster申请到资源后,便与对应的NodeManager通信,要求它启动任务。
6、NodeManager为任务设置好运行环境(包括环境变量、JAR包、二进制程序等)后,将任务启动命令写到一个脚本中,并通过运行该脚本启动任务。
7、各个任务通过某个RPC协议向ApplicationMaster汇报自己的状态和进度,以让ApplicationMaster随时掌握各个任务的运行状态,从而可以在任务失败时重新启动任务。在应用程序运行过程中,用户可随时通过RPC向ApplicationMaster查询应用程序的当前运行状态。
8、应用程序运行完成后,ApplicationMaster向ResourceManager注销并关闭自己。
三、总结
ResourceManager和NodeManager(NM)组成了基本的数据计算框架。application相当于map-reduce job或者DAG jobs。ApplicationMaster对应的是一个应用程序,也就是一个map-reduce job
和map reduce相比,是把资源管理和作业调度进行了解耦(只提供资源管理)
相关推荐
### YARN概述 YARN,即Yet Another Resource Negotiator,是Hadoop 2.x引入的一个重要组件,它的核心目标是解决Hadoop 1.x版本中的可扩展性问题,将资源管理和作业调度/监控分离开来,极大地提高了系统的灵活性和...
#### 一、YARN概述 YARN(Yet Another Resource Negotiator)是Apache Hadoop项目中的一个子项目,旨在为应用程序提供统一的资源管理和调度功能。YARN不仅支持MapReduce框架,还支持其他计算框架如Spark、Flink等,...
#### 一、YARN 概述与应用开发背景 YARN(Yet Another Resource Negotiator)是 Hadoop 生态系统中的一个关键组件,它为大规模分布式应用程序提供资源管理和调度的功能。相较于传统的 MapReduce 架构,YARN 能够更...
一、YARN概述 YARN是Hadoop生态系统中的核心组件之一,主要任务是处理数据处理作业的资源分配和调度。与早期版本的Hadoop相比,YARN将JobTracker的功能拆分为ResourceManager(RM)和ApplicationMaster(AM),实现...
一、YARN概述 YARN的核心理念是将数据计算和资源管理分离,使得Hadoop不再仅仅局限于MapReduce一种计算模型。它将集群资源管理和应用程序管理两个职责分开,由Resource Manager(RM)负责全局资源调度,而...
1. **YARN概述**:YARN的核心理念是将集群资源管理和应用程序的执行分离,资源管理由ResourceManager(RM)负责,应用程序执行则交给ApplicationMaster(AM)。这种分离使得系统能够支持多种计算框架,如MapReduce、...
一、YARN概述 YARN是Hadoop 2.x版本引入的新一代资源管理框架,其主要目标是将原本由MapReduce承担的数据处理和资源管理职责分离,以提高系统的资源利用率和整体性能。通过YARN,可以运行各种计算框架,如MapReduce...
【YARN概述】 YARN(Yet Another Resource Negotiator)是Apache Hadoop中用于资源管理和作业调度的核心组件。在Hadoop 2.x版本中引入,YARN的目标是解决原MapReduce框架(MRv1)的不足,提高集群资源的利用率和...
【Yarn概述】 Yarn,全称Yet Another Resource Negotiator,是Apache Hadoop项目中的一个核心组件,主要负责管理分布式计算集群的资源调度。它为各种计算框架(如MapReduce)提供了一个统一的资源管理和调度平台,...
YARN概述 Hadoop YARN(Yet Another Resource Negotiator)是Hadoop生态系统中的一种新型资源管理框架,它为上层应用提供了一个统一的资源管理和调度平台。YARN的引入极大地提高了集群的利用率,实现了资源的有效...
#### 知识点三:YARN概述 - **背景介绍**:随着Hadoop应用的扩展,原有的JobTracker机制在处理大量并发任务时出现性能瓶颈。因此,Apache Hadoop引入了YARN(Yet Another Resource Negotiator)作为新的资源管理器...
#### 0x01 Yarn概述 Yarn(Yet Another Resource Negotiator),作为Apache Hadoop项目中的一个子项目,主要负责集群资源的管理和调度。它通过以下三个核心组件实现其功能: 1. **ResourceManager (RM)**:管理...
### YARN框架概述与集群部署知识点详解 #### 一、YARN框架的产生与发展 **1.1 YARN产生和发展简史** ##### 1.1.1 Hadoop演进阶段 - **Ad Hoc集群阶段**(阶段0): 在这一阶段,Hadoop集群主要用于临时搭建,通常...
Yarn 获取 Application 列表编码概述 Yarn 获取 Application 列表编码是指通过 Yarn 客户端 API 获取当前 Hadoop 集群中的应用程序列表,并获取每个应用程序的详细信息。该操作通常用于监控和管理 Hadoop 集群中的...
14_Hadoop_入门_YARN概述.mp4 16_Hadoop_入门_HDFS&YARN&MR关系.mp4 17_Hadoop_入门_大数据技术生态体系.mp4 18_Hadoop_入门_VMware安装.mp4 20_Hadoop_入门_IP和主机名称配置.mp4 21_Hadoop_入门_Xshell远程访问...
YARN 概述 YARN(Yet Another Resource Negotiator)是 Hadoop 的资源管理和任务调度系统,负责管理和调度数据处理任务。YARN 架构主要由以下几部分组成: * ResourceManager:负责管理集群的资源,调度数据处理...