hadoop fs -rmr /user 会把所有user目录下的所有目录和文件全都删除
这个命令运用的时候要慎重,他不会给你任何提示的。。。。
但是在hadoop中其实给了一个补救的措施,但是缺省情况下是不会开启的,这个其实就是trash机制,所以不需要提示
在core-site.xml中增加如下配置,表明rm后会在trash中保留多少分钟:
<property>
<name>fs.trash.interval</name>
<value>10080</value>
<description>
Number of minutes between trash checkpoints. If zero, the trash feature is disabled
</description>
</property>
很遗憾的是,hadoop的这个默认值是0,就是直接删除了
经过简单的测试,这个trash功能还是不错的,当rm后,它会move到当前文件夹下的.Trash目录下
如果你删除相同名字的一个文件或目录多次,则hadoop会自动在name后加上数字序列号
这样,如果你误删除后,就可以有选择的恢复文件了
hadoop fs -mkdir /user/oplog/test
hadoop fs -put *.txt /user/oplog/test
hadoop fs -rmr /user/oplog/test
hadoop fs -ls /user/oplog/.Trash/Current/user/oplog
drwxr-xr-x – oplog oplog 0 2010-11-16 10:44 /user/oplog/.Trash/Current/user/oplog/test
hadoop fs -cp /user/oplog/.Trash/Current/user/oplog/test /user/oplog/
hadoop fs -rmr /user/oplog/test
hadoop fs -ls /user/oplog/.Trash/Current/user/oplog
drwxr-xr-x – oplog oplog 0 2010-11-16 10:44 /user/oplog/.Trash/Current/user/oplog/test
drwxr-xr-x – oplog oplog 0 2010-11-16 10:47 /user/oplog/.Trash/Current/user/oplog/test.1
分享到:
相关推荐
在这个文件中,你可以找到关于NameNode、DataNode以及HDFS的各种参数设置,例如: - `fs.defaultFS`:定义了HDFS的默认命名空间URI,这是客户端连接HDFS的入口点。 - `dfs.replication`:设定副本因子,即每个数据...
- **Hadoop中的路径**:讨论了如何在Hadoop中表示和处理文件路径。 - **serverside属性**:解释了服务器端属性的概念及其用途。 - **FileContext**:深入分析了FileContext类的作用和其实现。 #### 六、其他类 ...
默认情况下,HDFS的回收站是关闭的,需要在`core-site.xml`配置文件中开启。通过设置`<property>`标签内的`<name>fs.trash.interval</name>`属性,可以定义文件在回收站内保留的时间,单位是分钟。例如,设置`...
Trash中的文件会在用户配置的时间延迟后被永久删除,提供了数据恢复的窗口期。 Trash Checkpoint机制是为了更有效地管理回收站中的文件。它是一个特定时间点的快照,保存在`/user/${username}/.Trash/{timestamp_of...
在构建Hadoop集群的过程中,有几个关键的步骤和配置文件需要关注。首先,我们需要对JDK进行安装和配置,这是所有Java相关应用的基础。这通常包括解压缩下载的JDK安装包,然后设置环境变量,例如JAVA_HOME,将其指向...
在Hadoop 2.X版本中,引入了一项重要的新特性——回收站功能,这是一项针对文件系统的保护机制,旨在防止因误操作导致的数据丢失。回收站功能允许在一定时间内恢复被删除的文件,起到了类似传统操作系统中“回收站”...
HDFS(Hadoop Distributed File System)是Hadoop生态系统中的一个重要组成部分,它是一种分布式文件系统,设计用于在大量硬件上存储大量的数据集。HDFS的设计目标是高容错性、高可扩展性和易于访问性,适用于处理大...
在CDH(Cloudera Distributed Hadoop)集群中,优化组件的性能是确保高效运行的关键。本文档主要针对CDH集群中两个重要的组件——HDFS(Hadoop Distributed File System)和YARN(Yet Another Resource Negotiator)...