LocalFileSystem
Hadoop LocalFileSystem是客户端校验的类。在使用LocalFileSystem写文件时,会透明的创建一个.filename.crc的文件。校验文件大小的字节数由io.bytes.per.checksum属性设置,默认是512bytes,即每512字节就生成一个CRC-32校验和。
.filename.crc文件会存 io.bytes.per.checksum的信息。在读取的时候,会根据此文件进行校验。
事实上LocalFileSystem是通过继承ChecksumFileSystem实现校验的工作。
写例子:
package com.bigdata.io;
import java.io.IOException;
import java.io.OutputStream;
import java.net.URI;
import java.net.URISyntaxException;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.LocalFileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.fs.RawLocalFileSystem;
public class WriteToLocal {
public static void main(String[] args) throws IOException, URISyntaxException {
Configuration conf = new Configuration();
LocalFileSystem fs = new LocalFileSystem(new RawLocalFileSystem());
fs.initialize(new URI("file:///home/peter/abc1"), conf); // put the conf object to filesystem instance
OutputStream out = fs.create(new Path("file:///home/peter/abc1"));
for(int i = 0; i < 512*10;i++){
out.write(97);
}
out.close();
Path file = fs.getChecksumFile(new Path("file:///home/peter/abc1"));
System.out.println(file.getName());
fs.close();
}
}
分享到:
相关推荐
深入理解HDFS部分还涉及对不同类型的文件系统的讨论,比如DistributedFileSystem、FilterFileSystem、ChecksumFileSystem以及LocalFileSystem。DFSClient是HDFS的客户端组件,它通过网络协议与HDFS进行交互,使用NIO...
1. `LocalFileSystem`:本地文件系统,支持客户端校验和。 2. `RawLocalFileSystem`:无校验和的本地文件系统。 3. `HDFS`:Hadoop的分布式文件系统。 4. `HftpFileSystem` 和 `HsftpFileSystem`:分别通过HTTP和...
本报告是对Hadoop源代码进行深入分析的结果,重点研究了Hadoop分布式文件系统(HDFS)的内部实现细节。Hadoop是一种开源软件框架,主要用于分布式存储和处理大规模数据集。本分析报告主要涵盖了以下几个方面:文件...
LocalFileSystem 84 ChecksumFileSystem 85 Compression 85 Codecs 87 Compression and Input Splits 91 Using Compression in MapReduce 92 Serialization 94 The Writable Interface 95 Writable Classes 98 iv | ...
fs.all.*.impl=org.apache.hadoop.fs.LocalFileSystem ``` 7. **测试安装**: 安装完成后,你可以通过运行`winutils.exe`的一些基本命令来测试是否安装成功,如`winutils fs -ls /`,如果能正确列出HDFS的根目录...
对于LocalFileSystem,即本地文件系统,它也实现了类似的数据校验功能。在写入文件时,会在同目录下创建一个隐藏的.crc文件,存储每个文件块的校验和。读取文件时,会验证这些校验和,如果检测到不一致,同样会抛出...
LocalFileSystem ChecksumFileSystem 压缩 codec 压缩和输入切分 在MapReduce中使用压缩 序列化 Writable接口 Writable类 实现定制的Writable类型 序列化框架 Avro 依据文件的数据结构 写入SequenceFile MapFile 第5...
LocalFileSystem ChecksumFileSystem 压缩 codec 压缩和输入切分 在MapReduce中使用压缩 序列化 Writable接口 Writable类 实现定制的Writable类型 序列化框架 Avro 依据文件的数据结构 ...