`
hugh.wangp
  • 浏览: 292986 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

Hadoop查看目录空间使用情况

阅读更多

 

查看目录空间使用情况

  • 命令:hadoop fs -count [-q] <paths>

统计出目录数、文件数及指定路径下文件的大小,输出列为:

  • DIR_COUNT, FILE_COUNT, CONTENT_SIZE FILE_NAME.

带上-q选项后的输出列为:

  • QUOTA, REMAINING_QUOTA, SPACE_QUOTA, REMAINING_SPACE_QUOTA, DIR_COUNT, FILE_COUNT, CONTENT_SIZE, FILE_NAME.

 

查看指定目录下各子目录包含的目录数和文件数

 

  • awk 'BEGIN{while(("hadoop fs -ls /group/tmp/" | getline) >0){var = "hadoop fs -count "$8; system(var); }}' | sort -rk 1 | cat > shaka.dat
分享到:
评论

相关推荐

    【IT十八掌徐培成】Hadoop第02天-06.hadoop本地目录修改-属性查看.zip

    在这个由【IT十八掌徐培成】提供的课程中,我们将深入探讨Hadoop的本地目录修改和属性查看,这对于理解和管理Hadoop集群至关重要。 首先,我们要明白Hadoop的运行环境通常涉及到多个节点,这些节点上的数据需要通过...

    基于开源Hadoop的矢量空间数据分布式处理研究.pdf

    论文还构建了一个基于开源Hadoop项目的矢量空间数据分布式计算原型系统,并将其应用于中国关中地区1:100,000土地使用数据的处理中。实验结果显示,Hadoop MapReduce能够在处理大量矢量空间数据时显著提升分析性能,...

    Hadoop命令使用手册中文版

    - `hadoop fs -du &lt;path&gt;`:检查文件或目录的磁盘使用情况。 - `hadoop fs -df [-h]`:显示HDFS文件系统的磁盘使用状态。 ##### 3.2 MapReduce优化 - **作业参数调整**: - `mapreduce.job.reduces`:设置...

    hadoop的dll文件 hadoop.zip

    在提供的信息中,我们关注的是"Hadoop的dll文件",这是一个动态链接库(DLL)文件,通常在Windows操作系统中使用,用于存储可由多个程序共享的功能和资源。Hadoop本身是基于Java的,因此在Windows环境下运行Hadoop...

    安装hadoop使用Eclipse的插件

    通过这个插件,开发者可以将Hadoop集群视图集成到Eclipse的工作空间中,使得集群管理和任务调度变得更加直观和便捷。 以下是使用Hadoop Eclipse plugin 2.5.2进行Hadoop开发的基本步骤: 1. **下载与安装Hadoop**...

    hadoop.dll & winutils.exe For hadoop-2.8.0

    在IT行业中,Hadoop是一个广泛使用的开源框架,主要用于大数据处理和分析。这个压缩包文件包含的是"Hadoop.dll"和"winutils.exe"两个关键组件,它们对于在Windows环境下配置和运行Hadoop生态系统至关重要。 首先,...

    hadoop系列教程7

    例如,可以在E盘下创建一个名为HadoopWorkPlat的目录,将Eclipse和Hadoop解压到该目录下,并创建一个工作空间workplace。当然,这可以根据个人情况灵活调整。 特别要注意的是,为了让Eclipse能够在Hadoop集群上对...

    大数据 hadoop-3.1.3 linux 安装包

    为了验证Hadoop安装成功,可以运行一些简单的测试,如`hadoop fs -ls /`检查HDFS根目录,或者使用WordCount示例程序处理数据。Hadoop还提供了丰富的工具,如HBase(分布式数据库)、Hive(数据仓库工具)和Pig(数据...

    hadoop2.7.x_winutils_exe&&hadoop_dll

    使用`winutils.exe`初始化和格式化HDFS命名空间,创建`core-site.xml`和`hdfs-site.xml`配置文件,指定HDFS的相关参数,如namenode和datanode的地址。 5. **测试运行**: 一旦配置完成,你可以通过运行`hadoop fs...

    Hadoop的安装与使用

    了解Hadoop的基本操作,如上传数据到HDFS(`hadoop fs -put`),运行MapReduce作业(使用`hadoop jar`),以及监控集群状态(通过Web界面或`jps`命令查看进程状态)。 以上是Hadoop的基础安装和使用流程,对于初学...

    hadoop调试工具hadoop.dll和hadoop.exp和winutils.exe

    例如,它能够管理HDFS的文件和目录,设置Hadoop环境变量,以及执行其他与Hadoop相关的任务。在Windows环境中,由于缺乏像Linux的bash shell这样的工具,winutils.exe成为了不可或缺的助手。它对于配置Hadoop集群、...

    hadoop2.6.0插件+64位winutils+hadoop.dll

    在IT行业中,Hadoop是一个广泛使用的开源框架,主要用于大数据处理和分布式存储。Hadoop2.6.0是这个框架的一个重要版本,它包含了多项优化和改进,以提高系统的稳定性和性能。在这个压缩包中,我们关注的是与Windows...

    Hadoop3.1.3.rar

    为了安装和使用Hadoop 3.1.3,你需要解压"Hadoop3.1.3"压缩包,配置相关的环境变量,如`HADOOP_HOME`,然后根据你的需求设置集群配置文件(如`core-site.xml`, `hdfs-site.xml`, `yarn-site.xml`等)。在完成所有...

    Hadoop+Hbase技术使用文档(整理过的)

    ### Hadoop+Hbase技术使用文档关键知识点 #### 一、文档目的 本文档旨在指导用户如何在单节点上安装并配置Hadoop与Hbase,从而实现数据的分布式存储和处理。通过本教程的学习,读者将能够理解并掌握Hadoop与Hbase的...

    hadoop分布式部署教程

    - **配置文件隔离**:为了避免升级过程中配置文件被覆盖,建议将配置文件与Hadoop安装目录分离,例如创建一个专门用于存放配置文件的目录,并通过环境变量`$HADOOP_CONF_DIR`指定该目录路径。 #### 六、总结 ...

    hadoop+jdk.zip

    例如,可以使用`hadoop fs -ls /`命令检查HDFS的根目录,或者用`jps`命令查看各节点上的Hadoop进程状态。 总之,Hadoop与JDK在Linux环境中的集成是一项系统工程,涉及下载、安装、配置、启动等多个环节。正确理解和...

    Hadoop3.2.2资源包+安装文档

    Hadoop 2.x - 可以通过复制(浪费空间)来处理容错。 Hadoop 3.x - 可以通过Erasure编码处理容错。 数据平衡 Hadoop 2.x - 对于数据平衡使用HDFS平衡器。 Hadoop 3.x - 对于数据平衡使用Intra-data节点平衡器,该...

    hadoop-2.8.1源码

    - 名称节点(NameNode):作为元数据管理的中心,存储文件系统命名空间和文件块信息。 - 数据节点(DataNode):负责实际数据的存储,每个数据节点保存多个数据块副本,保证数据的高可用性。 - 心跳与数据块报告...

    hadoop2.6.0版本-hadoop-2.6.0.tar.gz

    Hadoop 2.6.0还支持HDFS Federation,允许在一个集群内有多个独立的命名空间,增强了扩展性和可用性。 此外,Hadoop 2.6.0在性能和稳定性方面进行了优化,例如改进了BlockCopy和数据本地性算法,提高了数据读写速度...

Global site tag (gtag.js) - Google Analytics