`
gengqi88
  • 浏览: 22755 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

YARN 简介(Yarn 系列)

阅读更多

一 、YARN 介绍

    Apache Hadoop YARN 是 apache Software Foundation Hadoop的子项目,为分离Hadoop2.0资源管理和计算组件而引入。YARN的诞生缘于存储于HDFS的数据需要更多的交互模式,不单单是MapReduce模式。Hadoop2.0 的YARN 架构提供了更多的处理框架,不再强迫使用MapReduce框架。

 


 
 

 从hadoop2.0 的架构图可以看出,YARN承担着原本由MapReduce承担的资源管理的功能,同时将这部分的功能打包使得他们可以被新的数据处理引擎使用。这也同时简化了MapReduce的流程,使得MapReduce专注的将数据处理做到最好。使用YARN,可以用共同的资源管理,在Hadoop上跑很多应用程序。目前,很多机构已经开发基于YARN的应用程序。

 

 

当企业的数据在HDFS中是可用的,有多种数据处理方式是非常重要的。有了Hadoop2.0和YARN,机构可以采用流处理、互动数据处理方式以及其他的基于Hadoop的应用程序。

 

YARN 提供了些什么?

YARN从以下几个方面提升了Hadoop的计算能力:

1、可扩展性

      数据中心的数据处理能力继续快速增长。因为YARN ResourceManager 仅仅专注于 调度,能将大集群的管理变得更加简单。

2、兼容MapReduce

      现存的MapReduce 应用程序无需更改就能直接在YARN上运行

3、提高集群使用率

ResourceManager 是一个纯粹的调度系统根据capacity ,fair 或者SlAs等原则对集群进行优化利用。与之前不同的是,再也没有map slot和reduce slot,没有这两类资源的划分,有助于提高集群资源的利用。

4、支持MapReduce以外的计算框架

数据处理除了图形处理和迭代处理,还为企业添加了一些实时处理模型,从而提升企业对Hadoop投资回报率,

5、灵活

随着MapReduce 成为用户端库,它发展独立于底层的资源管理层,从而可以有多种灵活的方式。

 

 

YARN 是如何工作的?

   YARN的基本理念是将JobTracker/TaskTracker 两大职能分割为以下几个实体: 

(1)一个全局的资源管理ResourceManager

(2)每个应用程序一个ApplicationMaster

(3)每个从节点一个NodeManager

(4)每个应用程序一个运行在NodeManager上的Container 

 

 

ResouceManager 和 NodeManager 组成了一个新的、通用的、用分布式管理应用程序的系统。ResourceManager 对系统中的应用程序资源有终极仲裁的权限。ApplicationMaster 是一个特定于框架的实体,它的责任是同ResourceManager 谈判资源 ,同时为NodeManager(s)执行和监控组件任务。RessourceManager 有一个调度器,根据不同的约束条件,例如队列容量、用户限制等,将资源进行分配给各类运行着的应用程序。调度器执行调度功能是基于应用程序的资源申请。NodeManager 负责发布应用程序容器,监控资源的使用并向ResourceManager进行汇报。每个ApplicationMaster都有职责从调度器那谈判得到适当的资源容器,追踪它们的状态,并监控他们的进程。从系统的视图看,ApplicationMaster 作为一个普通的容器运行着。

 

  • 大小: 51.4 KB
  • 大小: 114.3 KB
分享到:
评论

相关推荐

    yarn-1.22.4.msi和yarn-1.22.5.msi

    Yarn是JavaScript社区广泛使用的包管理工具,它旨在提高npm(Node.js的包管理器)的性能、可预测性和安全性。这两个文件,"yarn-1.22.4.msi" 和 "yarn-1.22.5.msi",是Yarn的特定版本安装程序,适用于Windows操作...

    yarn 1.6 WIN安装文件

    **Yarn 1.6 在Windows上的安装指南** Yarn是一款高效的依赖管理工具,它为JavaScript项目提供了可靠的、可重复的以及快速的包管理解决方案。本指南将详细介绍如何在Windows操作系统上安装Yarn 1.6版本。 1. **了解...

    Yarn获取Application列表编码

    Yarn 获取 Application 列表编码 Yarn 是一个资源管理和调度框架,负责管理 Hadoop 集群中的资源和应用程序。获取 Application 列表编码是 Yarn 中的一种常见操作,本文将对其进行详细的分析和介绍。 Yarn 获取 ...

    yarn.lock yarn install 安装失败,使用官方下载的yarn.lock文件

    npm install -g yarn yarn install 安装失败,使用官方下载的yarn.lock文件

    yarn-1.22.0.zip

    **Yarn 1.22.0:高效且可靠的JavaScript包管理器** Yarn是Facebook在2016年推出的JavaScript包管理工具,它旨在解决npm(Node.js的默认包管理器)在处理依赖关系时的一些痛点,如不一致的安装结果、缓慢的安装速度...

    yarn 前端打包工具指定配置文件

    在前端开发领域,`Yarn` 是一个非常流行的依赖管理工具,它被广泛用于替代 `npm` 进行包的安装和管理。`Yarn` 提供了更快的速度、更可靠的重复性和更好的安全性。在某些情况下,我们可能需要对前端项目进行特定的...

    Hadoop的yarn详解

    Hadoop的YARN架构是Hadoop版本2.x引入的一个重要组件,它负责处理资源管理和作业调度,而核心的计算任务处理则交给了MapReduce、Tez、Spark等计算框架。YARN的出现是为了解决Hadoop早期版本中的可扩展性问题,它通过...

    Yarn编程ApplicationList

    在分布式计算领域,Apache Hadoop YARN(Yet Another Resource Negotiator)是核心组件之一,它作为资源管理系统,负责调度和管理Hadoop集群上的应用程序。在这个主题中,我们将深入探讨"Yarn编程ApplicationList",...

    yarn1.22.4与1.22.5最新安装包windows

    Yarn是Facebook开发的一款流行的JavaScript包管理工具,它在npm(Node Package Manager)的基础上提供了更快、更可靠和更安全的包管理和依赖关系解决方式。在本文中,我们将深入探讨Yarn 1.22.4和1.22.5这两个版本在...

    yarn-1.22.0.msi

    此外,Yarn提供了`yarn upgrade`、`yarn remove`、`yarn info`等命令,用于升级依赖、移除依赖和查看依赖信息。还有`yarn install --offline`命令,可以在没有网络的情况下利用本地缓存安装依赖。 总之,Yarn作为一...

    yarn-1.19.2.msi

    Yarn 对你的代码来说是一个包管理器, 你可以通过它使用全世界开发者的代码,或者分享自己的代码。 Yarn 做这些快捷、安全、可靠,所以你不用担心什么。 通过Yarn你可以使用其他开发者针对不同问题的解决方案,使...

    yarn-v1.19.1.tar.gz

    Yarn是JavaScript的世界中一个流行的包管理工具,它在2016年由Facebook推出,旨在解决npm(Node Package Manager)的一些性能和可预测性问题。`yarn-v1.19.1.tar.gz`是一个包含Yarn源码的压缩包,版本号为1.19.1。这...

    yarn-v1.22.5.tar.gz

    Yarn 的使用方法基本与 npm 类似,比如 `yarn init` 创建新项目,`yarn add` 添加依赖,`yarn remove` 移除依赖,`yarn upgrade` 升级依赖,`yarn install` 安装项目依赖等。然而,由于 Yarn 的特性,这些操作的执行...

    yarn安装.docx

    yarn安装 Yarn 是一个流行的 JavaScript 包管理器,可以帮助开发者快速安装、管理和共享项目依赖项。下面是关于 Yarn 安装的详细知识点: Yarn 安装步骤 1. 使用 npm 安装 Yarn:`npm install –g yarn` 或 `npm ...

    yarn-1.22.10编译工具

    yarn-1.22.10编译工具yarn-1.22.10编译工具 yarn-1.22.10编译工具yarn-1.22.10编译工具 yarn-1.22.10编译工具yarn-1.22.10编译工具 yarn-1.22.10编译工具yarn-1.22.10编译工具 yarn-1.22.10编译工具yarn-1.22.10编译...

    Hadoop技术-YARN简介.pptx

    **Hadoop技术-YARN简介** YARN,全称为Yet Another Resource Negotiator,是Apache Hadoop项目中的一个核心组件,主要用于解决Hadoop生态系统中资源管理和任务调度的问题。在Hadoop 2.x版本之后,YARN成为了Hadoop...

    最新yarn-1.22.5的windows的msi安装版本

    **Yarn 1.22.5 Windows MSI 安装详解** Yarn 是一个现代的、高性能的包管理器,它被广泛应用于JavaScript开发中,用于管理和安装项目依赖。相较于npm,Yarn 提供了更稳定的环境、更快的安装速度以及更好的并行处理...

    hadoop-yarn-api-2.5.1-API文档-中文版.zip

    赠送jar包:hadoop-yarn-api-2.5.1.jar; 赠送原API文档:hadoop-yarn-api-2.5.1-javadoc.jar; 赠送源代码:hadoop-yarn-api-2.5.1-sources.jar; 赠送Maven依赖信息文件:hadoop-yarn-api-2.5.1.pom; 包含翻译后...

    yarn.tar.gz

    【标题】"yarn.tar.gz" 是一个归档文件,它使用了gzip压缩算法来减小文件大小。在IT行业中,这种格式常用于分发软件、源代码或数据集,以便于下载和存储。"tar"是Linux和Unix系统中的一个工具,用于将多个文件和目录...

    hadoop-yarn-client-2.6.5-API文档-中文版.zip

    赠送jar包:hadoop-yarn-client-2.6.5.jar; 赠送原API文档:hadoop-yarn-client-2.6.5-javadoc.jar; 赠送源代码:hadoop-yarn-client-2.6.5-sources.jar; 赠送Maven依赖信息文件:hadoop-yarn-client-2.6.5.pom;...

Global site tag (gtag.js) - Google Analytics