Hadoop回收站trash,默认是关闭的。
习惯了window的同学,建议最好还是把它提前开开,否则误操作的时候,就欲哭无泪了
1.修改
conf/core-site.xml,增加
<property>
<name>fs.trash.interval</name>
<value>1440</value>
<description>Number of minutes between trash checkpoints.
If zero, the trash feature is disabled.
</description>
</property>
默认是0.单位分钟。这里我设置的是1天(60*24)
删除数据rm后,会将数据move到当前文件夹下的.Trash目录
2.测试
1)新建目录input
hadoop/bin/hadoop fs -mkdir input
2)上传文件
root@master:/data/soft# hadoop/bin/hadoop fs -copyFromLocal /data/soft/file0* input
3)删除目录input
[root@master data]# hadoop fs -rmr input
Moved to trash: hdfs://master:9000/user/root/input
4)参看当前目录
[root@master data]# hadoop fs -ls
Found 2 items
drwxr-xr-x - root supergroup 0 2011-02-12 22:17 /user/root/.Trash
发现input删除,多了一个目录.Trash
5)恢复刚刚删除的目录
[root@master data]# hadoop fs -mv /user/root/.Trash/Current/user/root/input /user/root/input
6)检查恢复的数据
[root@master data]# hadoop fs -ls input
Found 2 items
-rw-r--r-- 3 root supergroup 22 2011-02-12 17:40 /user/root/input/file01
-rw-r--r-- 3 root supergroup 28 2011-02-12 17:40 /user/root/input/file02
6)删除.Trash目录(清理垃圾)
[root@master data]# hadoop fs -rmr .Trash
Deleted hdfs://master:9000/user/root/.Trash
分享到:
相关推荐
### Hadoop回收站trash机制详解 #### 配置回收站功能 首先,为了启用Hadoop的回收站功能,需要在`core-site.xml`配置文件中添加以下内容: ```xml <name>fs.trash.interval <value>1440 <description>Number ...
在HDFS中,文件删除操作默认是不可逆的,但通过启用Trash功能,HDFS引入了一个类似操作系统级别的回收站机制,使得误删的文件和目录可以在一段时间内被找回。这个功能对于大数据处理环境尤为重要,因为数据的丢失...
在Hadoop 2.X版本中,引入了一项重要的新特性——回收站功能,这是一项针对文件系统的保护机制,旨在防止因误操作导致的数据丢失。回收站功能允许在一定时间内恢复被删除的文件,起到了类似传统操作系统中“回收站”...
还设置了HDFS文件的回收站功能(fs.trash.interval)以及检查点间隔时间(fs.trash.checkpoint.interval)。 - HDFS配置文件hdfs-site.xml:设置了HDFS的副本数量(dfs.replication),名称节点的数据目录(dfs....
通过设置`<property>`标签内的`<name>fs.trash.interval</name>`属性,可以定义文件在回收站内保留的时间,单位是分钟。例如,设置`<value>1440</value>`意味着文件在被删除后将在回收站中保留一天(1440分钟)再被...
`fs.trash.interval`则设定了垃圾回收的时间间隔。核心配置文件对整个Hadoop环境的稳定性和性能有着直接影响。 4. **mapred-default.xml**:这个文件涉及到MapReduce的默认配置,包括作业调度、任务执行、内存分配...
6. **fs.trash.interval**: 设定文件回收站的清理间隔,值为0表示禁用回收站功能。 7. **fs.hdfs.impl**: 定义HDFS文件系统的实现,通常是`org.apache.hadoop.hdfs.DistributedFileSystem`。 这些配置参数可以根据...
`fs.trash.interval`设定垃圾回收的时间间隔。 接下来,`hdfs-default.xml`关注HDFS的配置。HDFS是Hadoop的分布式文件系统,它的配置直接影响数据存储和访问。例如,`dfs.replication`设置数据块的副本数量,用于...
11. 关闭HDFS的回收站功能,可以在core-site.xml中将fs.trash.interval属性设置为0。 12. 在Windows环境下安装Hadoop,需要先安装Cygwin,因为它提供了一个类似Linux的环境,使得Hadoop可以在Windows上运行。 13. ...
- **知识点**: 通过设置`core-site.xml`中的`fs.trash.interval`为0来禁用HDFS回收站。 - **解释**: 为了防止误删除,HDFS提供了回收站功能。如果需要完全禁用此功能,可以通过设置`fs.trash.interval`为0来实现。...
4. **垃圾回收间隔时间** (`fs.trash.interval`): - 描述:定义文件被删除后放入用户目录下的 `.Trash` 目录的保留时间(以分钟计),默认为 0,表示禁用。 - 推荐设置:1440(一天)。 - 示例:`fs.trash....
- **Trash**:分析了Trash类,用于管理HDFS中的回收站。 #### 七、结论与进一步的工作 报告最后总结了分析结果,并提出了未来的研究方向和改进计划。总体而言,这份报告提供了对Hadoop文件系统内部实现的深入理解...
- 配置垃圾回收间隔时间: ```xml <name>fs.trash.interval <value>10080 Number of minutes between trash checkpoints. If zero, the trash feature is disabled ``` 3. **配置`hdfs-site.xml`**: ...
相信每个人都对 回收站(trashcan)很熟悉,因为无论是对 Linux 用户,还是 Windows 用户,或者 Mac 用户来说,它都很常见。当你删除一个文件或目录的时候,该文件或目录会被移动到回收站中。 需要注意的是,当把文件...
1. `core-site.xml`:这个文件定义了Hadoop的基本行为,比如临时目录(`hadoop.tmp.dir`),默认文件系统的URI(`fs.defaultFS`),以及回收站机制的设置(`fs.trash.interval`)。 2. `hdfs-site.xml`:HDFS(Hadoop...
HDFS 的回收站功能可以通过配置 fs.trash.interval 属性来关闭,fs.trash.interval 属性的默认值为 21600 秒。 HBase 是一种基于列式数据库,它可以存储大量结构化和半结构化数据。HBase 提供了高性能的数据存储和...
1. **Trash机制**:Hadoop 0.21引入了垃圾回收机制,允许用户在误删除文件后有一定的恢复时间窗口,增加了系统的友好性和安全性。 2. **副本放置策略**:0.21版本提供了更灵活的副本放置策略,可以依据网络拓扑或...