YARN角色
1.RM ResourceManager
a)调度器:分配container给应用程序
b)应用程序管理器:管理应用程序(程序提交,与调度器交互启动AM,监控AM等)
2.ApplicationMaster:管理每个应用程序,与RM交互要container,与NM交互运行task
3.NodeManager:运行应用程序AM的task,与RM交互汇报Container资源情况
4.Container:封装多维度资源
YARN通信
从以上角色中可以看出有着多个通信:
Client-RS:向RM提交应用程序
Admin-RS:向RM更新配置文件
AM-RM:要求RM启动,停机自己,申请资源
AM-NM:要求NM启动,停止Container中的任务,获取Container信息
NM-RM:向RM注册Container,定时汇报Container
YARN工作流程
1.Client向RM提交应用程序
2.RM分配一个Container,返回NM命令,在此Container中启动AM
3.AM向RM注册,向RM申请资源,为各个任务(任务与AM的关系)申请资源,并监控各个任务
4.AM向RM申请资源
5.AM向NM通知启动任务
6.NM打jar包等准备工作,写到脚本中,启动任务
7.各个任务RPC到AM汇报状态
8.AM的各个任务重复执行4-7,AM向RM注销自己
相关推荐
【Hadoop YARN基本架构】 Hadoop YARN(Yet Another Resource Negotiator)是Apache Hadoop项目中的一个核心组件,它的设计目标是解决早期Hadoop 1.x版本中MapReduce(MRv1)存在的问题,包括扩展性限制、单点故障...
在Hadoop YARN的基本架构中,核心组件包括ResourceManager(RM)、NodeManager(NM)和ApplicationMaster(AM)。ResourceManager是集群的中心控制器,负责接收客户端请求,启动和监控ApplicationMaster,监控...
### YARN基本运作流程 #### 一、概述 Apache Hadoop YARN(Yet Another Resource Negotiator)是一个通用的资源管理和调度框架,它为Hadoop带来了更强大的可扩展性和灵活性。YARN不仅支持MapReduce,还能运行其他...
本资料"YARN的基本架构共9页.pdf.zip"将深入探讨YARN的架构、工作原理以及其在大数据生态系统中的作用。 首先,YARN的出现是为了解决早期Hadoop MapReduce模型中的单点故障和资源利用率低下的问题。在Hadoop 1.x中...
《Hadoop技术内幕深入解析YARN架构设计与实现原理》这本书由董西成撰写,是了解和掌握YARN(Yet Another Resource Negotiator)的核心参考资料。YARN是Hadoop生态系统中的关键组件,它作为数据处理框架的资源管理器...
通过阅读这本书,读者不仅可以了解YARN的基本工作原理,还能掌握如何优化YARN配置以适应不同业务场景,提升大数据处理效率。对于想要深入理解和使用Hadoop YARN的IT专业人士来说,这是一份宝贵的参考资料。
《深入理解Hadoop技术:YARN的基本架构》 在大数据处理领域,Hadoop是一个不可或缺的名字,它是Apache软件基金会开发的一个开源分布式计算框架。Hadoop技术的核心在于其强大的数据存储和处理能力,而其中的YARN...
YARN的基本思想是将数据处理和资源管理分开,将原本MapReduce中的JobTracker职责分解为两个独立的角色:Resource Manager(RM)和Application Master(AM)。RM全局负责集群的资源分配和监控,而AM则专注于每个应用...
《Hadoop技术内幕:深入解析YARN架构设计与实现原理》是一本专注于Hadoop生态系统中资源管理和调度核心组件——YARN(Yet Another Resource Negotiator)的专著。这本书全面介绍了YARN的架构、设计思想以及实际操作...
在本书中,作者深入解析了YARN的设计理念与基本架构,并对YARN的核心设计、计算框架及高级主题进行了详细的探讨。在准备篇中,作者指导如何搭建学习环境、获取和阅读Hadoop源代码,以及如何编译和调试源代码。在核心...
4. Container:YARN中的基本资源单元,包含了运行应用程序任务所需的计算和存储资源。 三、YARN的工作流程 1. 应用提交:用户提交应用程序到RM,包含AM的JAR包和配置信息。 2. AM启动:RM选择合适的NM启动AM,AM向...
总的来说,《Hadoop技术内幕深入解析YARN架构设计与实现原理》这本书是学习和理解YARN的宝贵资料,它不仅介绍了YARN的基本概念,还深入探讨了其工作原理和优化技巧,对于大数据开发者和系统管理员来说,是一本不可或...
- **一致性**:无论何时何地安装相同依赖,Yarn都会生成相同的`node_modules`结构,保证项目在不同环境下的可重复性。 - **缓存**:Yarn会缓存下载的包,避免重复下载,加快后续安装速度。 - **锁定文件**:`yarn...
从文件中提供的信息来看,董西成在其关于Hadoop YARN程序设计与应用案例的演讲中,涵盖了Hadoop YARN的定义、架构、API和开发步骤、应用类型、以及YARN API所涉及的通信协议和客户端库等核心知识点。以下是对这些...
Spark on Yarn是一种将Spark应用程序部署在Hadoop YARN资源管理器上的方法,它允许Spark充分利用YARN的资源管理和调度功能。在这个实验中,我们将详细探讨如何在Yarn模式下安装和部署Spark集群。 首先,我们需要...
Storm on YARN(Yet Another Resource Negotiator)的架构是将Storm集成到Hadoop的资源管理框架中,利用YARN进行资源管理和任务调度。在Storm on YARN中,Nimbus将分配给Supervisor的任务存储在Zookeeper中,通过...