Java IO体系之强大的RandomAccessFile

qindongliang1922

浏览: 2198101 次
性别:
来自: 北京

最近访客更多访客>>

北风norther

godandghost

youhere

tanss

博主相关

博客

微博

相册

留言

关于我

博客专栏

: 证道Lucene4
浏览量：117951

: 证道Hadoop
浏览量：126338

: 证道shell编程
浏览量：60301

: ELK修真
浏览量：71645

文章分类

社区版块

存档分类

博客分类：

JAVA

java IO 任意读写多线程下载上传 RandomAccessFile

现有如下的一个需求，向已存在1G数据的txt文本里末尾追加一行文字，内容如下“Lucene是一款非常优秀的全文检索库”。可能大多数朋友会觉得这个需求很easy，说实话，确实easy，然后XXX君开始实现了，直接使用Java中的流读取了txt文本里原来所有的数据转成字符串后，然后拼接了“Lucene是一款非常优秀的全文检索库”，又写回文本里了，至此，大功告成。后来需求改了，向5G数据的txt文本里追加了，结果XXX君傻了，他内存只有4G，如果强制读取所有的数据并追加，会报内存溢出的异常。

其实上面的需求很简单，如果我们使用JAVA IO体系中的RandomAccessFile类来完成的话，可以实现零内存追加。其实这就是支持任意位置读写类的强大之处。

在这之前，散仙还是喜欢先啰嗦的介绍下RandomAccessFile这个类，RandomAccessFile是Java中输入，输出流体系中功能最丰富的文件内容访问类，它提供很多方法来操作文件，包括读写支持，与普通的IO流相比，它最大的特别之处就是支持任意访问的方式，程序可以直接跳到任意地方来读写数据。

如果我们只希望访问文件的部分内容，而不是把文件从头读到尾，使用RandomAccessFile将会带来更简洁的代码以及更好的性能。

下面来看下RandomAccessFile类中比较重要的2个方法，其他的和普通IO类似，在这里，就不详细说明了。

方法名作用
getFilePointer() 返回文件记录指针的当前位置
seek(long pos) 将文件记录指针定位到pos的位置

下面散仙给出示例，分析下怎么使用RandomAccessFile
首先，我们先看下散仙要操作的文本文件的内容截图。

功能one，读取任意位置的数据，代码如下

/**
	 * 读的方法
	 * @param path 文件路径
	 * @param pointe 指针位置
	 * **/
	public static void randomRed(String path,int pointe){
		try{
			//RandomAccessFile raf=new RandomAccessFile(new File("D:\\3\\test.txt"), "r");
			/**
			 * model各个参数详解
			 * r 代表以只读方式打开指定文件
			 * rw 以读写方式打开指定文件
			 * rws 读写方式打开，并对内容或元数据都同步写入底层存储设备
			 * rwd 读写方式打开，对文件内容的更新同步更新至底层存储设备
			 * 
			 * **/
			RandomAccessFile raf=new RandomAccessFile(path, "r");
			//获取RandomAccessFile对象文件指针的位置，初始位置是0
			System.out.println("RandomAccessFile文件指针的初始位置:"+raf.getFilePointer());
			raf.seek(pointe);//移动文件指针位置
			byte[]  buff=new byte[1024];
			//用于保存实际读取的字节数
			int hasRead=0;
			//循环读取
			while((hasRead=raf.read(buff))>0){
				//打印读取的内容,并将字节转为字符串输入
				System.out.println(new String(buff,0,hasRead));
				
			}
			
			
			
		}catch(Exception e){
			e.printStackTrace();
		}
		
		
		
	}

测试代码

	public static void main(String[] args) {
		String path="D:\\3\\test.txt";		 
		 int seekPointer=20;
		 randomRed(path,seekPointer);//读取的方法 
		//randomWrite(path);//追加写的方法
		//insert(path, 33, "\nlucene是一个优秀的全文检索库");
	}

运行效果：

RandomAccessFile文件指针的初始位置:0
is a teacher
hadoop is perfect

功能two，追加数据，代码如下

	/**
	 * 追加方式
	 * 写的方法
	 * @param path 文件路径
	 * ***/
	public static void randomWrite(String path){
		try{
			/**以读写的方式建立一个RandomAccessFile对象**/
			RandomAccessFile raf=new RandomAccessFile(path, "rw");
			
			//将记录指针移动到文件最后
			raf.seek(raf.length());
			raf.write("我是追加的 \r\n".getBytes());
			
		}catch(Exception e){
			e.printStackTrace();
		}
		
	}

测试代码

	public static void main(String[] args) {
		String path="D:\\3\\test.txt";		 
		 //int seekPointer=20;
		// randomRed(path,seekPointer);//读取的方法 
		 randomWrite(path);//追加写的方法
		//insert(path, 33, "\nlucene是一个优秀的全文检索库");
	}

运行效果：

功能three，任意位置插入数据，代码如下

/**
	 * 实现向指定位置
	 * 插入数据
	 * @param fileName 文件名
	 * @param points 指针位置
	 * @param insertContent 插入内容
	 * **/
	public static void insert(String fileName,long points,String insertContent){
		try{
		File tmp=File.createTempFile("tmp", null);
		tmp.deleteOnExit();//在JVM退出时删除
		
		RandomAccessFile raf=new RandomAccessFile(fileName, "rw");
		//创建一个临时文件夹来保存插入点后的数据
		FileOutputStream tmpOut=new FileOutputStream(tmp);
		FileInputStream tmpIn=new FileInputStream(tmp);
		raf.seek(points);
		/**将插入点后的内容读入临时文件夹**/
		
		byte [] buff=new byte[1024];
		//用于保存临时读取的字节数
		int hasRead=0;
		//循环读取插入点后的内容
		while((hasRead=raf.read(buff))>0){
			// 将读取的数据写入临时文件中
			tmpOut.write(buff, 0, hasRead);
		}
		
		//插入需要指定添加的数据
		raf.seek(points);//返回原来的插入处
		//追加需要追加的内容
		raf.write(insertContent.getBytes());
		//最后追加临时文件中的内容
		while((hasRead=tmpIn.read(buff))>0){
			raf.write(buff,0,hasRead);
		}
		}catch(Exception e){
			e.printStackTrace();
		}
	}

测试代码

public static void main(String[] args) {
		String path="D:\\3\\test.txt";		 
		 //int seekPointer=20;
		// randomRed(path,seekPointer);//读取的方法 
		// randomWrite(path);//追加写的方法
		 insert(path, 33, "\nlucene是一个优秀的全文检索库");
	}

运行效果：

至此，RandomAccessFile类的几个功能，散仙在代码中已给出实现了，现在回到本文开始前的提的那个需求，用RandomAccessFile类就可以轻而易举的完成了，另外需要注意的是，向指定位置插入数据，是散仙自己改造的功能，RandomAccessFile并不直接支持，需要新建一个缓冲区临时空间，存数据，然后在写，因为一旦数据量上了级别，在任意位置插入数据，是很耗内存的，这个也就是为什么hadoop的HDFS文件系统，只支持append的方式，而没有提供修改的操作。

另外我们可以用RandomAccessFile这个类，来实现一个多线程断点下载的功能，用过下载工具的朋友们都知道，下载前都会建立两个临时文件，一个是与被下载文件大小相同的空文件，另一个是记录文件指针的位置文件，每次暂停的时候，都会保存上一次的指针，然后断点下载的时候，会继续从上一次的地方下载，从而实现断点下载或上传的功能，有兴趣的朋友们可以自己实现下。

查看图片附件

8
顶

0
踩

分享到：

图解eclipse环境下安装python3.x插件支持 | 走出误区之解惑，何谓“随机访问”? 何谓 ...

2013-11-06 16:23
浏览 12916
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

博客专栏

文章分类

社区版块

存档分类

最新评论