`
QING____
  • 浏览: 2251315 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

HDFS常用命令[备忘]

 
阅读更多

【HDFS常用命令】

一、appendToFile:将一个或多个目标文件append到hdfs文件中,目标文件可以为本地文件或者stdin。

    使用方式:hdfs dfs -appendToFile <localFile or -> <hdfs-path or hdfs URL>

    1) ./hdfs dfs -appendToFile /data.txt /hdfs/data.txt

    2) ./hdfs dfs -appendToFile /data.txt hdfs://otherClust/hdfs/data.txt 将src文件append到其他集群的hdfs中。

    3) ./hdfs dfs -appendToFile - /hdfs/data/txt,这个命令执行之后,允许在窗体中输入字符串,Ctrl + C退出stdin,此后stdin数据将会追加到hdfs文件中。

 

二、cat:将hdfs文件中的数据输出在stdout(窗体)中。此命令可以在外部调用,外部程序可以从stdout中读取数据。

    使用方式:hdfs dfs -cat <hdfs-path>

 

三、chgrp:修改指定文件或路径的group归属。注意,当前用户必须是文件的owner或者为super-user,否则权限不足。-R参数可以指定(递归的)当前目录下所有文件的group归属

    使用方式:hdfs dfs -chgrp [-R] <group-name> <hdfs-path>

 

四、chmod:修改文件或目录的权限,同linux指令chmod。当前用户必须为文件或者目录的owner或者为super-user,否则权限不足。-R参数可以指定当前目录下所有文件的权限。

 

    先了解一下linux chmod指令:chmod [-R] <[code] | [who opcode permission]> <file or dir>;其中-R为递归的执行目录之内的所有文件。

    [code]为一个三位数字,第一位表示owner的权限,第二位表示group权限,第三位表示其他user的权限;每一位使用4(读权限)、2(写)、1(执行)三种数字表示权限,6(即4+2)表示读 + 写权限,7(即4+2+1)表示读 + 写 + 执行权限;比如777表示owner、group、其他user均具有读写和执行的权限。

    [who]即参与授权的用户,u表示owner,g表示文件所属组,o表示其他用户;[opcode]有“+”(增加权限)、“-”(删除权限)、“=”(重置权限);[permission]表示权限类型,r(读)、w(写)、x(执行)。

 

    例如:

    1) chmod u+x /file:给file的owner用户增加执行权限

    2) chmod 754 /file:给file的owner用户全部权限,给文件所属group为读 + 执行权限,给其他用户读权限。

    3) chmod u=rwx,g=rx,o=r /file:同2)

    4) chmod o=r /file:将其他用户的权限重置为“只读”。

 

    不过hdfs文件没有“执行”权限,因为设置执行权限没有意义。例如:

>./hdfs dfs -chmod u=rw,g=rw,o=r /tmp/test.txt

 

五、chown:修改文件的owner,只能super-user才能进行此操作。-R参数可以递归的修改目录下所有文件的owner信息。

    使用方式:hdfs dfs -chown [-R] [owner][:group] hdfs-path

    例如:

./hdfs dfs -chown super-user:group /tmp/test1.txt

 

六、copyFromLocal:将本地文件copy到hdfs中。-f参数表示如果hdfs路径下已经存在同名文件,是否覆盖,此命令会保留本地文件的名字,即copy之后,hdfs目录下文件名和本地文件名一样。

    使用方式:hdfs dfs -copyFromLocal [-f] <localFile> hdfs-path

七、copyToLocal:将hdfs中的文件copy到本地目录中,同时保留文件名。

    使用方式:hdfs dfs -copyToLocal [-ignorecrc] [-crc] hdfs-path <local-dir>

八、count:计算指定的path下文件目录或者文件的总数。

    使用方式:hdfs dfs -count [-q] <path>

    -count输出的列依次是:DIR_COUNT(目录、子目录的个数),FILE_COUNT(文件个数),CONTENT_SIZE(占用空间),FILE_NAME(当前path)。

    -count -q输出的列依次是:QUOTA(文件个数配额,如果为none表示没有设定),REMAINING_QUOTA(剩余配额,inf表示无限制),SPACE_QUOTA(空间大小配额),DIR_COUNT,FILE_COUNT,CONTENT_SIZE,FILE_NAME。

九、cp:同linux cp。在hdfs中copy文件。

    使用方式:hdfs dfs -cp [-f] <hdfs-file-src> <hdfs-file-dist>

十、du:展示指定文件的大小,如果为目录,则展示目录下所有文件的大小之和。

    使用方式:hdfs dfs -du [-s] [-h] <file or path>...

十一、expunge:清空垃圾箱,trash。

十二、get:从hdfs中copy文件到本地,与copyToLocal指令的不同点是get指令可以指定本地文件的名称。

    使用方式:hdfs dfs -get [-ignorecrc] [-crc] <hdfs-file-src> <local-path-filename>

十三、ls:同linux ls指令。

十四、lsr:同linux ls -R指令。

十五、mkdir:同linux mkdir指令。

    使用方式:hdfs dfs -mkdir [-p] <paths>

十六、moveFromLocal:类似于linux mv指令,将本地文件move到hdfs上,此后删除本地文件,类似于put指令。

十七、mv:同linux mv指令,将hdfs-file移动到其他目录中。

十八、put:将本地文件copy到hdfs中,也可以从stdin中读取数据并写入指定的新文件。与copyFromLocal指令的区别为put指令可以自定义hdfs目标文件的名称。

十九、rm:同linux rm命令,删除指定的文件(将文件移动到trash中),如果使用了-skipTrash,那么文件将直接删除,rm指令只能删除文件和空目录。

    使用方式:hdfs dfs -rm [-skipTrash] <file or dir>

二十、rmr:同linux rm -r命令,递归的删除指定目录下的文件,也可以使用-skipTrasn参数。

二十一、setrep:修改文件或者目录的replication个数,如果指定的为目录,则目录树下所有的文件的replication都会修改。

    使用方式:hdfs dfs -setrep [-w] <numReplicas> <file or path>

    其中-w参数表示等待备份操作结束,但这通常是个耗时的过程。

 

二十二、stat:获取path的stat信息,只返回了一个修改时间。

二十三、tail:同linux tail命令,展示文件最后1K的数据。-f参数可以设定浮动展示。

二十四、test:检测文件。

    使用方式:hdfs dfs -text -[ezd] <file>

    -e参数用来检测文件是否存在,-z检测文件的大小是否为0,-d参数指定的file是否为目录,如果是返回0。

二十五、text:以文本的方式展示文件内容。

    使用方式:hdfs dfs -text <hdfs-file>

二十六、touchz:创建一个空文件,类似于vi指令

    使用方式:hdfs dfs -touchz <newFile>

 

    如果想查看一个目录下文件的replication情况,请使用hadoop fsck指令。

分享到:
评论

相关推荐

    大数据技术基础实验报告-HDFS常用操作命令.doc

    本实验报告主要关注HDFS的常用操作命令,这些命令是管理员和数据分析师日常工作中不可或缺的工具。 实验开始时,通过执行`start-dfs.sh`命令启动HDFS服务。这是在Hadoop集群中启动所有DataNode和NameNode节点的关键...

    Hadoop-HDFS常用命令

    Hadoop-HDFS常用命令

    HDFS常用Shell命令.md

    HDFS常用Shell命令,基础篇

    HDFSShell命令综合练习.pdf

    在Hadoop分布式文件系统(HDFS)的管理中,Shell命令是操作HDFS的基本工具,用于执行文件和目录的创建、查看、上传、下载、复制、移动、删除等操作。以下是对HDFS Shell命令的详细解释: 1. **创建文件夹**: 使用`...

    HDFS_HBaseShell的常用命令

    HDFS_HBaseShell的常用命令 HDFS(Hadoop Distributed File System)是一种分布式文件系统,主要用于存储和管理大规模数据。HBase 是一个基于HDFS的NoSQL数据库,用于存储和管理大规模结构化和半结构化数据。HBase ...

    HDFS基本命令.docx

    在HDFS中,基本命令是最基础也是最常用的命令,掌握这些命令是使用HDFS的基础。本节我们将详细介绍HDFS中的基本命令。 -help命令 HDFS中的-help命令用于显示HDFS的帮助信息。该命令可以显示所有可用的命令和参数。...

    Hadoop HDFS分布式文件系统 常用命令汇总

    Hadoop HDFS分布式文件系统常用命令汇总 Hadoop HDFS分布式文件系统是大数据存储和处理的核心组件。作为一个分布式文件系统,HDFS提供了高可靠性、高可扩展性和高性能的存储解决方案。在使用HDFS时,经常需要执行...

    大数据教程-HDFS常用Shell命令.md.zip

    本教程将聚焦于HDFS的Shell命令,这些命令对于数据处理和管理至关重要。以下是HDFS Shell命令的一些基本知识和常见操作。 1. **查看当前目录(pwd)**: 使用`hadoop fs -pwd`命令可以显示当前工作目录,它类似于...

    HDFS命令指南相关学习

    这些HDFS命令对于日常的数据操作至关重要,包括数据上传、下载、查看、权限管理等。熟悉并熟练使用这些命令能够大大提高Hadoop环境中的工作效率。在实际工作中,根据具体需求灵活运用这些命令,可以实现对HDFS的高效...

    第二章 HDFS的Shell操作.pptx

    HDFS的Shell操作,bin/hadoop fs 具体命令 OR bin/hdfs dfs 具体命令 dfs是fs的实现类等等。

    数据存储实验2-熟悉常用的HDFS操作.doc(实验报告)

    通过本实验,我们学习了HDFS的基本概念和常用的操作命令,熟悉了HDFS在Hadoop体系结构中的角色,并且掌握了HDFS的Java API。这些知识将帮助我们更好地理解和使用HDFS在数据存储和处理中的应用。

    HDFS部署与Shell命令使用

    通过对HDFS的不同部署模式及常用Shell命令的学习,我们可以更好地理解和操作HDFS。其中,`fs`命令用于基本的文件操作,`dfsadmin`用于管理HDFS集群的状态,`fsck`用于检查和维护文件系统的健康状态,而`balancer`则...

    大数据实验二-HDFS编程实践

    2. **Shell命令的掌握**:熟练掌握了HDFS常用Shell命令后,可以在日常运维或数据处理过程中快速高效地执行任务。 3. **Java API的应用**:Java API提供了更高级的功能支持,如并发处理、错误恢复等,对于开发高性能...

    实验二:熟悉常用的HDFS操作

    实验二:“熟悉常用的HDFS操作”旨在帮助学习者深入理解Hadoop分布式文件系统(HDFS)在大数据处理中的核心地位,以及如何通过Shell命令和Java API进行高效操作。HDFS在Hadoop架构中扮演着存储大数据的核心角色,为...

    大数据分析技术:HDFS的常用命令.docx

    了解并熟练掌握这些HDFS命令对于进行大数据分析至关重要,因为它们提供了对HDFS文件系统的直接操作,包括读取、写入、管理文件和目录,以及监控存储资源。通过这些命令,数据工程师和分析师可以高效地管理和处理存储...

    HDFS常用指令

    Hadoop是一个能够对大量数据进行分布式处理的软件框架,具有可靠、高效、可伸缩的,其核心是:HDFS(分布式文件系统)、Mapreduce(分布式计算框架)。HDFS分布式文件系统常用指令文档

    Hadoop HDFS_Shell命令详解.pdf

    #### 其他常用命令 ##### get **使用方法**: `hadoop fs -get URI &lt;localdst&gt;` 该命令用于从 HDFS 下载文件到本地文件系统。 ##### getmerge **使用方法**: `hadoop fs -getmerge &lt;src&gt; &lt;dst&gt;` 合并多个文件为一个...

    Hadoop中一些hdfs的命令

    下面详细介绍一些常用的HDFS命令及其用法: ##### 2.1 创建目录 - **语法**: `hdfs dfs -mkdir [-p] &lt;path&gt;` - `-mkdir`: 创建指定的目录。 - `-p`: 如果指定,则允许创建多级目录。 **示例**: ```shell # ...

    HDFS文件操作命令与HDFS编程

    文档详细的讲述了Hadoop中HDFS文件操作命令和HDFS编程

    HDFS Shell命令应用数管2101李怡然2021012073(1).docx

    HDFS Shell 命令应用 HDFS(Hadoop Distributed File System)是 Hadoop 项目中的一个分布式文件系统,提供了高可靠性、高可扩展性和高性能的存储解决方案。HDFS 使用 Shell 命令来管理和操作文件系统。下面将从 ...

Global site tag (gtag.js) - Google Analytics