`

在hadoop中开启你的trash

 
阅读更多

hadoop fs -rmr /user 会把所有user目录下的所有目录和文件全都删除

这个命令运用的时候要慎重,他不会给你任何提示的。。。。

但是在hadoop中其实给了一个补救的措施,但是缺省情况下是不会开启的,这个其实就是trash机制,所以不需要提示

 

在core-site.xml中增加如下配置,表明rm后会在trash中保留多少分钟:

<property>
  <name>fs.trash.interval</name>
  <value>10080</value>
  <description>
      Number of minutes between trash checkpoints. If zero, the trash feature is disabled
  </description>
</property>

很遗憾的是,hadoop的这个默认值是0,就是直接删除了

经过简单的测试,这个trash功能还是不错的,当rm后,它会move到当前文件夹下的.Trash目录下

如果你删除相同名字的一个文件或目录多次,则hadoop会自动在name后加上数字序列号

这样,如果你误删除后,就可以有选择的恢复文件了

hadoop fs -mkdir /user/oplog/test
hadoop fs -put *.txt  /user/oplog/test
hadoop fs -rmr /user/oplog/test
hadoop fs -ls /user/oplog/.Trash/Current/user/oplog
    drwxr-xr-x   – oplog oplog          0 2010-11-16 10:44 /user/oplog/.Trash/Current/user/oplog/test
hadoop fs -cp /user/oplog/.Trash/Current/user/oplog/test   /user/oplog/

hadoop fs -rmr /user/oplog/test
hadoop fs -ls /user/oplog/.Trash/Current/user/oplog
    drwxr-xr-x   – oplog oplog          0 2010-11-16 10:44 /user/oplog/.Trash/Current/user/oplog/test
    drwxr-xr-x   – oplog oplog          0 2010-11-16 10:47 /user/oplog/.Trash/Current/user/oplog/test.1

 

分享到:
评论

相关推荐

    hadoop的默认配置文件

    在这个文件中,你可以找到关于NameNode、DataNode以及HDFS的各种参数设置,例如: - `fs.defaultFS`:定义了HDFS的默认命名空间URI,这是客户端连接HDFS的入口点。 - `dfs.replication`:设定副本因子,即每个数据...

    老师的Hadoop源代码分析报告.pdf

    - **Hadoop中的路径**:讨论了如何在Hadoop中表示和处理文件路径。 - **serverside属性**:解释了服务器端属性的概念及其用途。 - **FileContext**:深入分析了FileContext类的作用和其实现。 #### 六、其他类 ...

    HA模式部署hadoop1

    默认情况下,HDFS的回收站是关闭的,需要在`core-site.xml`配置文件中开启。通过设置`&lt;property&gt;`标签内的`&lt;name&gt;fs.trash.interval&lt;/name&gt;`属性,可以定义文件在回收站内保留的时间,单位是分钟。例如,设置`...

    12、HDFS Trash垃圾桶回收介绍与示例

    Trash中的文件会在用户配置的时间延迟后被永久删除,提供了数据恢复的窗口期。 Trash Checkpoint机制是为了更有效地管理回收站中的文件。它是一个特定时间点的快照,保存在`/user/${username}/.Trash/{timestamp_of...

    第六节、Hadoop集群搭建.pdf2

    在构建Hadoop集群的过程中,有几个关键的步骤和配置文件需要关注。首先,我们需要对JDK进行安装和配置,这是所有Java相关应用的基础。这通常包括解压缩下载的JDK安装包,然后设置环境变量,例如JAVA_HOME,将其指向...

    Hadoop 2.X新特性回收站功能的讲解

    在Hadoop 2.X版本中,引入了一项重要的新特性——回收站功能,这是一项针对文件系统的保护机制,旨在防止因误操作导致的数据丢失。回收站功能允许在一定时间内恢复被删除的文件,起到了类似传统操作系统中“回收站”...

    HDFS实验手册.pdf

    HDFS(Hadoop Distributed File System)是Hadoop生态系统中的一个重要组成部分,它是一种分布式文件系统,设计用于在大量硬件上存储大量的数据集。HDFS的设计目标是高容错性、高可扩展性和易于访问性,适用于处理大...

    CDH集群常用组件关键参数及修改建议.docx

    在CDH(Cloudera Distributed Hadoop)集群中,优化组件的性能是确保高效运行的关键。本文档主要针对CDH集群中两个重要的组件——HDFS(Hadoop Distributed File System)和YARN(Yet Another Resource Negotiator)...

Global site tag (gtag.js) - Google Analytics