概述
YARN命令通过bin/yarn 脚本调用.不传入任何参数运行该脚本会打印所有命令的描述。
Usage: yarn [--config confdir] COMMAND [--loglevel loglevel] [GENERIC_OPTIONS] [COMMAND_OPTIONS]
YARN有一个option解析框架用来解析通用options和运行class。
COMMAND_OPTIONS | Description |
--config confdir | 覆盖默认的配置目录。默认为${HADOOP_PREFIX}/conf |
--loglevel loglevel | 覆盖log level。有效的log level是FATAL, ERROR, WARN, INFO, DEBUG, and TRACE. 默认是INFO。 |
GENERIC_OPTIONS | 多个命令支持的通用选项集合。 |
COMMAND COMMAND_OPTIONS | 各种command以及它们的选项在以下章节描述。commands已经被分为了User Command和Administration Command。 |
User Commands
对Hadoop集群用户有用的Command。
application
Usage: yarn application [options]
COMMAND_OPTIONS | Description |
-appStates <States> | 与-list一起使用可以基于输入的逗号分隔的application states列表过滤application。有效的application state可以是如下:ALL, NEW, NEW_SAVING, SUBMITTED, ACCEPTED, RUNNING, FINISHED, FAILED, KILLED |
-appTypes <Types> | 与-list一起使用,基于传入的逗号分隔的application types列表过滤application。 |
-list | 从RM查看application列表。支持使用-appTypes选项,基于application type对application进行过滤。支持使用-appStates选项,基于application state对application进行过滤。 |
-kill <ApplicationId> | 杀死application |
-status <ApplicationId> | 打印application状态。 |
打印application report/杀死application
applicationattempt
Usage: yarn applicationattempt [options]
COMMAND_OPTIONS | Description |
-help | Help |
-list <ApplicationId> | 列出指定application的application attempts 。 |
-status <Application Attempt Id> | 打印application attempt的状态信息。 |
打印applicationattempt report
classpath
Usage: yarn classpath
打印需要hadoop jar和其他library的class path
container
Usage: yarn container [options]
COMMAND_OPTIONS | Description |
-help | Help |
-list <Application Attempt Id> | 列出application attempt的container列表。 |
-status <ContainerId> | 打印container的状态。 |
打印container report
jar
Usage: yarn jar <jar> [mainClass] args...
运行一个jar文件。用户可以将他们的YARN代码打包到一个jar文件,可以使用这个command执行它。
logs
Usage: yarn logs -applicationId <application ID> [options]
COMMAND_OPTIONS | Description |
-applicationId <application ID> | 指定application id。 |
-appOwner <AppOwner> | AppOwner (如果未指定则为当前用户) |
-containerId <ContainerId> | ContainerId (如果node address已经指定则该项必须指定) |
-help | Help |
-nodeAddress <NodeAddress> | NodeAddress 采用以下格式:nodename:port (如果container id指定了则该项必须指定) |
Dump the container logs
node
Usage: yarn node [options]
COMMAND_OPTIONS | Description |
-all | 与-list一起使用可列出所有node。 |
-list | 列出所有running的node。支持使用-states选项基于node state对node进行过滤,-all表示列出所有node。 |
-states <States> | 与-list一起使用可以基于输入的逗号分隔的node state列表进行node的过滤。 |
-status <NodeId> | 打印node的status report |
打印node report
queue
Usage: yarn queue [options]
COMMAND_OPTIONS | Description |
-help | Help |
-status <QueueName> | 打印队列状态信息。 |
打印队列信息
version
Usage: yarn version
打印hadoop版本.
管理Commands
管理hadoop集群的相关命令。
daemonlog
Usage:
yarn daemonlog -getlevel <host:httpport> <classname> yarn daemonlog -setlevel <host:httpport> <classname> <level>
COMMAND_OPTIONS | Description |
-getlevel <host:httpport> <classname> | 打印出运行在<host:httpport>deamon中的classname的log日志级别。这个命令内部连接到http://<host:httpport>/logLevel?log=<classname>。 |
-setlevel <host:httpport> <classname> <level> | 设置运行在<host:httpport>的deamon中的classname的日志级别。这个命令内部是连接到http://<host:httpport>/logLevel?log=<classname>&level=<level><level>http://<host:httpport>/logLevel?log=<classname>&level=<level> http://<host:httpport>/logLevel?log=<classname>&level=<level> |
Get/Set deamon中class name的日志级别。
示例: $ bin/yarn daemonlog -setlevel 127.0.0.1:8088 org.apache.hadoop.yarn.server.resourcemanager.rmapp.RMAppImpl DEBUG
nodemanager
Usage: yarn nodemanager
启动NodeManager
proxyserver
Usage: yarn proxyserver
启动web proxy server
resourcemanager
Usage: yarn resourcemanager [-format-state-store]
COMMAND_OPTIONS | Description |
-format-state-store | 格式化RMStateStore。这将会清除RMStateStroe,这在旧数据不在需要时会用到。这只应该是在ResourceManager不运行的时候执行。 |
启动ResourceManager
rmadmin
Usage:
yarn rmadmin [-refreshQueues] [-refreshNodes] [-refreshUserToGroupsMapping] [-refreshSuperUserGroupsConfiguration] [-refreshAdminAcls] [-refreshServiceAcl] [-getGroups [username]] [-transitionToActive [--forceactive] [--forcemanual] <serviceId>] [-transitionToStandby [--forcemanual] <serviceId>] [-failover [--forcefence] [--forceactive] <serviceId1> <serviceId2>] [-getServiceState <serviceId>] [-checkHealth <serviceId>] [-help [cmd]]
COMMAND_OPTIONS | Description |
-refreshQueues | 重新加载队列的acls,state和scheduler特定属性。ResourceManager会重新加载mapred-queues配置文件。 |
-refreshNodes | 在ResourceManager中刷新host信息。 |
-refreshUserToGroupsMappings | 刷新用户-组映射。 |
-refreshSuperUserGroupsConfiguration | 刷新超级用户代理组映射。 |
-refreshAdminAcls | 刷新ResourceManager的administration acls。 |
-refreshServiceAcl | 重新加载service-level授权策略文件,ResourceManager会重新加载授权策略文件。 |
-getGroups [username] | 获取指定用户属于的组。 |
-transitionToActive [–forceactive] [–forcemanual] <serviceId> | 将service转换为Active state. 如果使用了 –forceactive选项,那么目标直接active,无需检查当前是否已经没有active node。如果自动灾备启用的话,不能使用该命令。虽然你可以通过forcemanual 选项强行override,但是你需要非常小心。 |
-transitionToStandby [–forcemanual] <serviceId> | 将service转换为standby状态。这个命令不能在自动灾备启用的情况下使用。虽然你可以通过forcemanual 选项强行override,但是你需要非常小 |
-failover [–forceactive] <serviceId1> <serviceId2> | 初始化故障恢复,从serviceId1 切换到serviceId2。如果使用-forceactive 选项,那么会转移到目标service,哪怕它还没有ready。 |
-getServiceState <serviceId> | 获取service的state。 |
-checkHealth <serviceId> | 请求对service执行一次健康度检查。如果检查失败,RMAdmin工具的退出码为非零数字。 |
-help [cmd] | 显示指定command的帮助信息,如果未指定则显示全部命令的帮助信息。 |
运行ResourceManager 管理客户端。
scmadmin
Usage: yarn scmadmin [options]
COMMAND_OPTIONS | Description |
-help | Help |
-runCleanerTask | 执行清除task |
Runs Shared Cache Manager admin client
sharedcachemanager
Usage: yarn sharedcachemanager
Start the Shared Cache Manager
timelineserver
Usage: yarn timelineserver
Start the TimeLineServer
相关推荐
接着,解压下载的Hadoop 2.7.2 ZIP文件到一个合适的目录,并配置环境变量,如HADOOP_HOME,PATH等,以便系统能识别Hadoop命令。 Hadoop在Windows上的运行模式通常有本地模式(Local Mode)、伪分布式模式(Pseudo-...
1. YARN改进:在Hadoop 2.7.2中,YARN(Yet Another Resource Negotiator)进一步提升了资源管理效率,优化了任务调度算法,降低了作业启动延迟,增强了系统的整体性能。 2. HDFS增强:增加了对大文件的支持,改进...
5. **测试Hadoop**:使用`hadoop fs -ls`命令检查Hadoop是否正常运行,能否访问HDFS。 为了实现更好的集群管理,可以使用Ambari这样的工具,它可以简化Hadoop的安装、配置和监控。另外,Hadoop 2.7.2还支持HBase、...
描述中提到的"下载资源hadoop2.7.2资源包"意味着你可以在这个链接(https://archive.apache.org/dist/hadoop/common/)找到官方发布的Hadoop 2.7.2版本,这是获取开源软件的可靠渠道。用户可以在这里下载到二进制和...
本文将详细介绍这两个组件以及如何在Windows系统下配置Hadoop 2.7.2版本的开发环境。 首先,`hadoop.dll`是Hadoop在Windows平台上的一个动态链接库文件,它包含了Hadoop运行所需的特定功能。由于Hadoop主要设计为在...
Hadoop 2.7.2 是一个开源框架,主要用于分布式存储和计算,是大数据处理领域的重要组成部分。这个版本的Hadoop在2015年发布,提供了许多改进和新特性,使得它能在各种Linux环境下稳定运行,从而满足企业对大规模数据...
Hadoop2.7.2是该系统的一个稳定版本。伪分布部署是指在单机上模拟分布式环境运行Hadoop的过程,即一个节点既是NameNode也是DataNode,既执行Master角色又执行Slave角色,这为开发者在没有多台机器的情况下也能体验和...
Apache Hadoop 2.7.2 是一个广泛使用的开源框架,专为分布式存储和计算而设计,是大数据处理领域的重要工具。源码包提供了一窥Hadoop内部运作机制的机会,对于开发者、研究者以及想要深入理解Hadoop工作原理的人来说...
在这个名为“hadoop2.7.2安装依赖文件.zip”的压缩包中,包含了一系列在Windows环境下安装和运行Hadoop 2.7.2版本所必需的组件。下面我们将详细探讨这些文件及其在Hadoop生态系统中的作用。 首先,`hadoop.dll`是一...
8. **启动Hadoop服务**:最后,通过start-dfs.cmd和start-yarn.cmd脚本启动Hadoop的DataNodes、NameNodes以及ResourceManager等服务。 以上就是在Windows 7环境中安装和配置Hadoop 2.7.2所需的关键步骤,其中hadoop...
本文档将详细介绍如何搭建一个Hadoop 2.7.2版本的高可用(High Availability,简称HA)集群。此集群将包含五台服务器,分别命名为cancer01至cancer05,其中两台作为NameNode节点(活跃与备用),一台作为JournalNode...
这个"Hadoop_2.7.2安装包.rar"包含了Hadoop 2.7.2版本的所有组件,供用户在本地或者集群环境中搭建大数据处理平台。在这个版本中,Hadoop已经相当成熟,提供了稳定性和性能优化。 在安装Hadoop之前,我们需要了解...
这个压缩包文件“win10下编译过的hadoop2.7.2 jar包”是专门为在Windows 10操作系统上运行Hadoop 2.7.2版本而准备的。这个版本的Hadoop包含了所有必要的库文件和依赖,使得开发者能够在本地环境中配置和运行Hadoop...
Hadoop 2.7.2是Hadoop发展中的一个重要版本,它提供了稳定性和性能上的改进。本话题将详细探讨在Windows环境下编译Hadoop 2.7.2的过程以及相关知识点。 首先,我们来理解Hadoop的核心组件。Hadoop主要由两个主要...
3. **安全模型**:Hadoop 2.x引入了YARN(Yet Another Resource Negotiator),默认启用Secure Mode,这意味着在Windows上运行Hadoop可能需要配置Kerberos认证,这在Windows环境中相对复杂。 4. **文件权限**:...
`hadoop-2.7.2.tar.gz`是Hadoop 2.7.2的核心组件和库的打包文件,解压后将包含所有必要的二进制文件、配置文件、文档以及示例。这个文件通常在Linux服务器上通过`tar -zxvf hadoop-2.7.2.tar.gz`命令进行解压,然后...
《Hadoop 2.7.2与HBase的集成——深入理解hadoop-2.7.2-hbase-jar.tar.gz》 Hadoop是Apache软件基金会的一个开源项目,它为大规模数据处理提供了一个分布式计算框架。Hadoop的核心包括HDFS(Hadoop Distributed ...
标题 "hadoop-2.7.2-win10_x64.7z" 提供了关键信息,这是一款针对64位Windows 10系统的Hadoop版本,版本号为2.7.2,并且已经过编译,可以预期在解压后直接运行。Hadoop是一个开源的分布式计算框架,由Apache软件基金...
但是,通过一些特定的步骤,可以在Windows系统上编译和使用Hadoop,而提供的“win7下编译过的hadoop2.7.2”文件正是为了简化这一过程。 首先,我们来看一下Hadoop在Windows上的编译步骤。在Windows 7环境下编译...