`
bit1129
  • 浏览: 1067646 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

【Hadoop二】Hadoop常用命令

 
阅读更多

以Hadoop运行Hadoop自带的wordcount为例,

 

hadoop脚本位于/home/hadoop/hadoop-2.5.2/bin/hadoop,需要说明的是,这些命令的使用必须在Hadoop已经运行的情况下才能执行

 

Hadoop HDFS相关命令

  •  hadoop fs -ls

 列出HDFS文件系统的第一级文件和第一级目录,如:

 

hadoop@hadoop-Inspiron-3521:~/hadoop-2.5.2/bin$ ./hadoop fs -ls
Found 5 items
drwxr-xr-x   - hadoop supergroup          0 2014-11-24 23:13 QuasiMonteCarlo_1416841948675_1031539484
drwxr-xr-x   - hadoop supergroup          0 2014-11-23 10:37 input
drwxr-xr-x   - hadoop supergroup          0 2014-11-23 09:54 out
drwxr-xr-x   - hadoop supergroup          0 2014-11-23 10:44 out1
drwxr-xr-x   - hadoop supergroup          0 2014-11-23 10:38 output

 其中input目录是上传文本的目录(文本中包含了要统计的单词),out,out1和output是输出目录,

 

  • hadoop fs -ls ./input/*

列出input目录下的所有内容

 

 

 * 文件操作
 * 查看目录文件
 * $ hadoop dfs -ls /user/cl
 *
 * 创建文件目录
 * $ hadoop dfs -mkdir /user/cl/temp
 *
 * 删除文件
 * $ hadoop dfs -rm /user/cl/temp/a.txt
 *
 * 删除目录与目录下所有文件
 * $ hadoop dfs -rmr /user/cl/temp
 *
 * 上传文件
 * 上传一个本机/home/cl/local.txt到hdfs中/user/cl/temp目录下
 * $ hadoop dfs -put /home/cl/local.txt /user/cl/temp
 *
 * 下载文件
 * 下载hdfs中/user/cl/temp目录下的hdfs.txt文件到本机/home/cl/中
 * $ hadoop dfs -get /user/cl/temp/hdfs.txt /home/cl
 *
 * 查看文件
 * $ hadoop dfs –cat /home/cl/hdfs.txt

 

 

 

hdfs dfs -du -h -s 目录
可以用于查看指定目录占用的空间
分享到:
评论

相关推荐

    hadoop2安装和常用shell命令

    ### Hadoop2安装与常用Shell命令详解 #### Hadoop2安装步骤 在开始Hadoop2的安装之前,首先需要确保所有节点的操作系统版本为CentOS/Red Hat Linux 6.4_x64,并且每台服务器都已完成基本的系统配置。 ##### 系统...

    hadoop和HBase常用shell命令

    Hadoop 和 HBase 常用 shell 命令 在大数据处理中,Hadoop 和 HBase 是两个非常重要的组件。Hadoop 是一个分布式计算框架,用于处理大规模数据,而 HBase 是一个基于 Hadoop 的分布式数据库,用于存储和处理大规模...

    Hadoop常用命令

    ### Hadoop常用命令详解 Hadoop是一款开源软件框架,主要用于分布式存储与处理大规模数据集。在实际使用过程中,掌握一些常用的Hadoop命令对于管理和维护Hadoop集群至关重要。下面将详细介绍这些命令及其用法。 ##...

    Hadoop常用命令.pdf

    > hadoop jar test-1.0-SNAPSHOT-jar-with-dependencies.jar /user/test/input /user/test/out 2.运行Jar包指定类中的主函数 > java -cp test-1.0-SNAPSHOT-jar-with-dependencies.jar com.test.main.MainTest

    Linux常用的操作命令+hadoop安装指导.docx

    ### Linux常用的操作命令+hadoop安装指导 #### Linux用户与权限管理相关知识点 ##### 了解Linux用户与权限管理的重要性 在Linux系统中,用户管理和权限控制是确保系统安全性和稳定性的重要手段之一。通过合理地...

    Hadoop HDFS分布式文件系统 常用命令汇总

    Hadoop HDFS分布式文件系统常用命令汇总 Hadoop HDFS分布式文件系统是大数据存储和处理的核心组件。作为一个分布式文件系统,HDFS提供了高可靠性、高可扩展性和高性能的存储解决方案。在使用HDFS时,经常需要执行...

    hadoop 命令大全

    #### 二、常用Hadoop命令详解 **1. 查看支持的命令** 通过命令`$bin/hadoop fs -help`可以列出所有Hadoop Shell支持的命令及其简短的描述。 **2. 显示特定命令的帮助信息** 如果想要了解某个命令的具体使用方法...

    hadoop大数据常用命令

    ### Hadoop大数据常用命令知识点详解 #### 一、启动与关闭Hadoop集群 **启动Hadoop** - **步骤**: 进入HADOOP_HOME目录,然后执行`sh bin/start-all.sh`。 - **作用**: 启动Hadoop集群,包括DataNodes和NameNode。...

    Hadoop Shell命令大全

    下面将详细介绍一些常用命令的使用方法和示例: 1. cat命令:用于查看HDFS文件内容,命令格式为hadoop fs -cat URI [URI …]。例如,查看文件的内容,可以使用命令: ``` hadoop fs -cat hdfs://host1:port1/file...

    Hadoop-HDFS常用命令

    Hadoop-HDFS常用命令

    Hadoop命令手册

    下面介绍一些常用的Hadoop命令及其知识点: 1. hadoop fs -ls [URI]:这个命令用于列出HDFS(Hadoop Distributed File System)上的文件和目录。URI参数是指定HDFS路径的统一资源标识符。 2. hadoop fs -put ...

    hadoop常用命令详解,配有例子说明

    hadoop的常用命令详解,并配有例子说明详细信息

    Hadoop shell常用命令

    该文档记录了在linux的shell环境下执行的hadoop的相关操作命令,包括多hafs文件的相关操作

    hadoop常用命令

    这篇文档将详细介绍Hadoop的常用命令,以及如何在Windows环境下进行Hadoop的开发和操作。 首先,我们来了解一下Hadoop的基本命令。`hadoop fs`是Hadoop文件系统(HDFS)的交互接口,用于执行文件系统操作,如`ls`...

    熟悉常用的Linux操作和Hadoop操作

    ##### 二、熟悉常用的Hadoop操作 Hadoop 是一个能够对大量数据进行分布式处理的软件框架。以下是一些基本的 Hadoop 命令: 1. **启动 Hadoop**:在安装了 Hadoop 的目录下启动 Hadoop 服务。 2. **创建目录**:在 ...

    熟悉常用的Linux操作和Hadoop操作.docx

    本实验旨在帮助学生熟练掌握Linux操作系统中的常用命令,并初步了解如何在Linux环境下安装和配置Hadoop集群,为后续进行云计算与大数据处理打下坚实的基础。 ##### 实验环境 本次实验使用的操作系统为CentOS 6.5。...

    Linux下Hadoop伪分布式配置及操作命令

    以上知识点详细地阐述了在CentOS系统上配置Hadoop伪分布式环境的全过程,包括了环境准备、JDK安装、环境变量配置、Hadoop配置文件修改、SSH无密码登录配置、集群的启动和使用,以及常用命令的介绍。对于初学者来说,...

    Hadoop集群之—常用MySQL数据库命令_V1.0

    ### Hadoop集群之—常用MySQL数据库命令知识点 #### MySQL数据库连接与退出 要连接MySQL数据库,可以使用`mysql`命令并指定主机地址、用户名和密码。例如,登录本地MySQL数据库使用命令:`mysql -uroot -p`,然后...

    hadoop环境搭建,机器部署以及 Linux 常用命令操作指南

    hadoop 环境搭建、机器部署以及 Linux 常用命令操作指南 本指南将指导用户从头开始搭建 Hadoop 环境,包括虚拟机环境的准备、Linux 基础知识、shell 增强大数据集群环境准备、ZooKeeper 介绍及集群操作网络编程等...

    HadoopHA集群配置文件

    4. `yarn-site.xml`: YARN(Yet Another Resource Negotiator)是Hadoop的第二代资源管理系统,它负责调度计算资源。`yarn-site.xml`中的`yarn.resourcemanager.address`、`yarn.resourcemanager.scheduler.address`...

Global site tag (gtag.js) - Google Analytics