`

Hadoop Yarn

 
阅读更多

一、Yarn产生 : 作为Hadoop的一个子项目,Yarn是一个通用的用于运行分布式应用的资源管理器

 

1、Mapreduce的缺陷和问题:

由于jobtracker会保存信息在内存中,使用的粗粒度的锁,所以可扩展有瓶颈 

 

2、Yarn要保持现有的mapduce的向后兼容性

 

3、Yarn : 资源调度器

基本思想: 将jobTracker两个主要的功能分离成单独的组件,一个全局的ResourceManager和每个应用对应的 ApplicationMaster

 

Yarn 的组件

ResourceManager : 资源管理器 , 一个纯粹的调度器

 

ApplicationManager: 应用程序管理器,负责与ResourceManager协商资源,并和NodeManager协同工作来执行和监控Container以及它们的资源消耗。

 

资源模型: 一个应用可以通过ApplicationMaster请求非常具体的资源

 

ResouceRequest 和 Container

一个应用程序通过ApplicationMaster请求特定的ResourceRequest来满足资源需求

scheduler 会分配一个Container 来响应资源请求

Container是一种资源分配形式,为应用程序授予在特定主机上使用资源

ApplicationMaster取走Container,并交给NodeManager。NodeManager会利用相应的资源来启动Container的任务进程。

 

 

 

 

 

 

 

分享到:
评论

相关推荐

    董西成:Hadoop YARN程序设计与应用案例

    从文件中提供的信息来看,董西成在其关于Hadoop YARN程序设计与应用案例的演讲中,涵盖了Hadoop YARN的定义、架构、API和开发步骤、应用类型、以及YARN API所涉及的通信协议和客户端库等核心知识点。以下是对这些...

    Apache Hadoop YARN:【Hadoop YARN权威指南】

    Apache Hadoop YARN:Moving beyond MapReduce and Batch Processing with Apach 2 【yarn权威指南】

    Hadoop YARN ResourceManager 未授权访问getshell

    利用Hadoop YARN ResourceManager 未授权访问getshell工具以及WORD说明

    HadoopYARN权威指南

    详细介绍Hadoop Yarn的架构以及如何构建Hadoop Yarn。详解介绍如何进行资源调优。

    HadoopYARN权威指南【中、英文版】

    《Hadoop YARN 权威指南》是一本深入解析Hadoop集群资源管理框架YARN的专业书籍,分为中文版和英文版。这本书对于理解和掌握Hadoop生态系统中的YARN至关重要,尤其对于大数据开发者、系统管理员和数据科学家来说,是...

    Apache Hadoop YARN (完整清晰电子书)

    Apache Hadoop YARN: Moving beyond MapReduce and Batch Processing with Apache Hadoop 2 完整版哦,绝对清晰,不是扫描的mobi格式电子书,请使用电子书库calibre (http://calibre-ebook.com/download) 打开。

    Hadoop的yarn详解

    Hadoop的YARN架构是Hadoop版本2.x引入的一个重要组件,它负责处理资源管理和作业调度,而核心的计算任务处理则交给了MapReduce、Tez、Spark等计算框架。YARN的出现是为了解决Hadoop早期版本中的可扩展性问题,它通过...

    Apache Hadoop YARN

    《Apache Hadoop YARN》,全名Apache Hadoop YARN: Moving beyond MapReduce and Batch Processing with Apache Hadoop 2 (Addison-Wesley Data & Analytics Series) 这本书是2014年3月31号出版的,是基于Hadoop 2...

    Apache Hadoop YARN:Moving beyond MapReduce and Batch Processing with Hadoop 2

    Apache Hadoop YARN是Hadoop 2.0核心组件之一,它代表了Hadoop技术的重大进步,超越了原有的MapReduce和批处理的局限性。Hadoop YARN权威指南是一本专门介绍YARN架构及其功能的书籍。首先,我们需要了解Hadoop YARN...

    hadoop yarn技术论文

    Hadoop YARN(Yet Another Resource Negotiator)是Apache Hadoop的一个子项目,旨在解决Hadoop第一版中MapReduce的缺陷和限制。YARN的核心是资源管理器(ResourceManager),它管理集群中所有计算资源,并负责调度...

    Hadoop Yarn 案例 2

    在大数据处理领域,Hadoop YARN(Yet Another Resource Negotiator)是Apache Hadoop项目中的一个核心组件,负责管理和调度集群中的资源。YARN为大数据处理提供了高效、可扩展的资源管理框架,使得不同类型的计算...

    Hadoop YARN 基本架构和发展趋势

    Hadoop YARN(Yet Another Resource Negotiator)是Hadoop 2.0引入的一个核心组件,旨在解决早期Hadoop版本中的扩展性问题、资源管理单一性以及对多计算框架支持不足的缺陷。YARN的出现,使得Hadoop不仅限于...

    hadoop-yarn-client-2.6.5-API文档-中文版.zip

    赠送jar包:hadoop-yarn-client-2.6.5.jar; 赠送原API文档:hadoop-yarn-client-2.6.5-javadoc.jar; 赠送源代码:hadoop-yarn-client-2.6.5-sources.jar; 赠送Maven依赖信息文件:hadoop-yarn-client-2.6.5.pom;...

    hadoop-yarn-api-2.5.1-API文档-中文版.zip

    赠送jar包:hadoop-yarn-api-2.5.1.jar; 赠送原API文档:hadoop-yarn-api-2.5.1-javadoc.jar; 赠送源代码:hadoop-yarn-api-2.5.1-sources.jar; 赠送Maven依赖信息文件:hadoop-yarn-api-2.5.1.pom; 包含翻译后...

    Hadoop Yarn - Apache - Cloudera - APIs

    ### Hadoop YARN调优与Cloudera配置详解 #### 一、概述 在大数据处理领域,Apache Hadoop YARN(Yet Another Resource Negotiator)作为资源管理和任务调度的核心组件,对于提升集群性能至关重要。本文将根据提供...

    hadoop yarn优化配置项生成工具

    在大数据处理领域,Hadoop YARN(Yet Another Resource Negotiator)是Apache Hadoop项目的核心组件之一,主要负责集群资源的管理和调度。YARN优化对于提升整个Hadoop集群的性能至关重要,尤其是在处理大规模数据...

    Hadoop yarn-site.xml

    在Linux系统的Centos7安装hadoop2.9.2版本所需配置的yarn-site.xml配置文件

Global site tag (gtag.js) - Google Analytics