`

Hadoop YARN配置参数剖析(2)—权限与日志聚集相关参数

 
阅读更多

注意,配置这些参数前,应充分理解这几个参数的含义,以防止误配给集群带来的隐患。另外,这些参数均需要在yarn-site.xml中配置。

1.    权限相关配置参数

这里的权限由三部分组成,分别是:(1)管理员和普通用户如何区分 (2)服务级别的权限,比如哪些用户可以向集群提交ResourceManager提交应用程序,(3)队列级别的权限,比如哪些用户可以向队列A提交作业等。

管理员列表由参数yarn.admin.acl指定。

服务级别的权限是通过配置hadoop-policy.xml实现的,这个与Hadoop 1.0类似

队列级别的权限是由对应的资源调度器内部配置的,比如Fair Scheduler或者Capacity Scheduler等,具体阅读后面几节。

2.    日志聚集相关配置参数

日志聚集是YARN提供的日志中央化管理功能,它能将运行完成的Container/任务日志上传到HDFS上,从而减轻NodeManager负载,且提供一个中央化存储和分析机制。默认情况下,Container/任务日志存在在各个NodeManager上,如果启用日志聚集功能需要额外的配置。

(1) yarn.log-aggregation-enable

参数解释:是否启用日志聚集功能。

默认值:false

(2) yarn.log-aggregation.retain-seconds

参数解释:在HDFS上聚集的日志最多保存多长时间。

默认值:-1

(3) yarn.log-aggregation.retain-check-interval-seconds

参数解释:多长时间检查一次日志,并将满足条件的删除,如果是0或者负数,则为上一个值的1/10。

默认值:-1

(4) yarn.nodemanager.remote-app-log-dir

参数解释:当应用程序运行结束后,日志被转移到的HDFS目录(启用日志聚集功能时有效)。

默认值:/tmp/logs

(5) yarn.log-aggregation.retain-seconds

参数解释:远程日志目录子目录名称(启用日志聚集功能时有效)。

默认值:日志将被转移到目录

${yarn.nodemanager.remote-app-log-dir}/${user}/${thisParam}下

原创文章,转载请注明: 转载自董的博客

本文链接地址: http://dongxicheng.org/mapreduce-nextgen/hadoop-yarn-configurations-log-aggregation/

作者:Dong,作者介绍:http://dongxicheng.org/about/

本博客的文章集合:

分享到:
评论

相关推荐

    hadoop2.6基于yarn的安装配置

    Hadoop 2.6 基于 YARN 的安装配置 Hadoop 2.6 是一个基于 YARN(Yet Another Resource Negotiator)的分布式计算框架,它提供了高效、可靠的数据处理能力。在本文中,我们将详细介绍 Hadoop 2.6 的安装配置过程,...

    Hadoop的yarn详解

    Hadoop的YARN架构是Hadoop版本2.x引入的一个重要组件,它负责处理资源管理和作业调度,而核心的计算任务处理则交给了MapReduce、Tez、Spark等计算框架。YARN的出现是为了解决Hadoop早期版本中的可扩展性问题,它通过...

    董西成:Hadoop YARN程序设计与应用案例

    从文件中提供的信息来看,董西成在其关于Hadoop YARN程序设计与应用案例的演讲中,涵盖了Hadoop YARN的定义、架构、API和开发步骤、应用类型、以及YARN API所涉及的通信协议和客户端库等核心知识点。以下是对这些...

    Apache Hadoop YARN:【Hadoop YARN权威指南】

    Apache Hadoop YARN:Moving beyond MapReduce and Batch Processing with Apach 2 【yarn权威指南】

    hadoop-yarn-api-2.5.1-API文档-中文版.zip

    赠送jar包:hadoop-yarn-api-2.5.1.jar; 赠送原API文档:hadoop-yarn-api-2.5.1-javadoc.jar; 赠送源代码:hadoop-yarn-api-2.5.1-sources.jar; 赠送Maven依赖信息文件:hadoop-yarn-api-2.5.1.pom; 包含翻译后...

    Hadoop YARN ResourceManager 未授权访问getshell

    利用Hadoop YARN ResourceManager 未授权访问getshell工具以及WORD说明

    hadoop-yarn-client-2.6.5-API文档-中文版.zip

    赠送jar包:hadoop-yarn-client-2.6.5.jar; 赠送原API文档:hadoop-yarn-client-2.6.5-javadoc.jar; 赠送源代码:hadoop-yarn-client-2.6.5-sources.jar; 赠送Maven依赖信息文件:hadoop-yarn-client-2.6.5.pom;...

    HadoopYARN权威指南

    详细介绍Hadoop Yarn的架构以及如何构建Hadoop Yarn。详解介绍如何进行资源调优。

    hadoop yarn优化配置项生成工具

    2. **yarn.nodemanager.vmem-pmem-ratio**:虚拟内存与物理内存的比例,用于控制容器的内存使用。 3. **yarn.scheduler.minimum-allocation-mb** 和 **yarn.scheduler.maximum-allocation-mb**:定义容器内存分配的...

    Apache Hadoop YARN (完整清晰电子书)

    Apache Hadoop YARN: Moving beyond MapReduce and Batch Processing with Apache Hadoop 2 完整版哦,绝对清晰,不是扫描的mobi格式电子书,请使用电子书库calibre (http://calibre-ebook.com/download) 打开。

    HadoopYARN权威指南【中、英文版】

    书中还会探讨如何配置和优化YARN,包括调整参数以提高性能、监控和故障排查等方面。另外,对于开发人员,书中还可能涉及如何编写兼容YARN的应用程序,以及如何利用YARN的特性实现并行计算和数据处理。 《Hadoop ...

    Apache Hadoop YARN

    全名Apache Hadoop YARN: Moving beyond MapReduce and Batch Processing with Apache Hadoop 2 (Addison-Wesley Data & Analytics Series) 这本书是2014年3月31号出版的,是基于Hadoop 2介绍YARN的一本好书,...

    Hadoop Yarn 案例 2

    本文将围绕"Hadoop Yarn案例2"这一主题,深入探讨YARN在实际应用中的工作原理和优势,以及如何利用它来实现好友推荐系统。 好友推荐系统是社交网络服务中常见的一种功能,其背后通常涉及到大量的数据处理和分析。在...

    Apache Hadoop YARN:Moving beyond MapReduce and Batch Processing with Hadoop 2

    Apache Hadoop YARN是Hadoop 2.0核心组件之一,它代表了Hadoop技术的重大进步,超越了原有的MapReduce和批处理的局限性。Hadoop YARN权威指南是一本专门介绍YARN架构及其功能的书籍。首先,我们需要了解Hadoop YARN...

    hadoop配置参数

    2. **hdfs-site.xml**:这个文件用于配置HDFS(Hadoop Distributed File System)的相关参数。例如,`dfs.replication`决定了文件副本的数量,默认为3,可以根据实际需求调整。`dfs.name.dir`和`dfs.data.dir`分别...

    Hadoop yarn-site.xml

    在Linux系统的Centos7安装hadoop2.9.2版本所需配置的yarn-site.xml配置文件

    hadoop yarn技术论文

    Hadoop YARN(Yet Another Resource Negotiator)是Apache Hadoop的一个子项目,旨在解决Hadoop第一版中MapReduce的缺陷和限制。YARN的核心是资源管理器(ResourceManager),它管理集群中所有计算资源,并负责调度...

Global site tag (gtag.js) - Google Analytics