`

如何分段读取文件

 
阅读更多

项目中使用到了读文件,但是有的文件很大。一下子加入到内存中再循环取,效率很底,试着用分段读,这个方法可行。把代码贴出来,如果大家有更好的方法。欢迎指正。

 

public static List<Keyword> readFile(int formIndex, int toIndex) {
        List<Keyword> lists = new ArrayList<Keyword>();
        String path = getPadFilePath();
        try {
            FileReader fr = new FileReader(path);
            BufferedReader br = new BufferedReader(fr);

            String temp;
            int i = 0;
            while ((temp = br.readLine()) != null) {
                i++;
                if (i > formIndex && i < toIndex) {
                    lists.add(new Keyword(temp));
                }
            }
            fr.close();
        } catch (Exception e) {
           
            log.error("read file exception :" + getExceptionStr(e));
        }
        return lists;
    }

 

  注:fromIndex -- 起始位置。toIndex --- 结束位置。

  之前的做法是用的是List中有一个subList的方法,这个也可以实现,但是目的不一样。如果是那样的话。做起来很简单。

分享到:
评论
15 楼 windywany 2010-03-14  
MAPPING应该是最好的解决办法
14 楼 FeiXing2008 2010-03-14  
楼主这里并没有将所有数据加载到内存里,但是这样的做法需要多次读文件
13 楼 云中苍月 2010-03-14  
RandomAccessFile可以很好的解决楼主的需求。
内存映射也是好的选择,在think in java的IO章节有很完整的介绍。
12 楼 yvfish 2010-03-14  
javafound兄给出的正解!
11 楼 javafound 2010-03-13  
有如下情况下可以用到内存文件映射技术解决问题:
 1.不要复制文件中所有的数据,只需要修改文件中局部的数据。
 2.并行\分段处理大文件。

  如下代码示使用javaNIO局部修改文件中指定位置的部分数据:
/**
	 * 修改文件中的某一部分的数据测试:将字定位置的字母改为大写
	 * @param fName  :要修改的文件名字
	 * @param start:起始字节
	 * @param len:要修改多少个字节
	 * @return :是否修改成功
	 * @throws Exception:文件读写中可能出的错
* @author  javaFound
	 */
	public static boolean changeFile(String fName,int start,int len) throws Exception{
	  //创建一个随机读写文件对象
		java.io.RandomAccessFile raf=new java.io.RandomAccessFile(fName,"rw");
		long totalLen=raf.length();
		System.out.println("文件总长字节是: "+totalLen);
		//打开一个文件通道
		java.nio.channels.FileChannel channel=raf.getChannel();
		//映射文件中的某一部分数据以读写模式到内存中
		java.nio.MappedByteBuffer buffer=  channel.map(FileChannel.MapMode.READ_WRITE, start, len);
		//示例修改字节
		for(int i=0;i<len;i++){
		byte src=	buffer.get(i);
		buffer.put(i,(byte)(src-31));//修改Buffer中映射的字节的值
		System.out.println("被改为大写的原始字节是:"+src);
	   }
		buffer.force();//强制输出,在buffer中的改动生效到文件
		buffer.clear();
		channel.close();
		raf.close();
		return true;
	}
	//测试主方法
	public static void main(String[] args) throws Exception{
		changeFile("BigFileRW.java",3,5);
		System.out.println(" change OK... ");
	}




要想看到测试结果,需要在项目的的当前目录下创建一个名为BigFileRW.java文本文件,其中写上10上以上的字母。运行如上程序,文件中第3个字母起后面5个都变为大写了。

   NIO可以理解为传统IO的加强版,功能和性能都加强了,但使用变得更复杂。本节通过一些典型的用例展示了NIO的应用特征。深入灵活地将NIO用巧用好只有一个办法:有战斗中学习战斗,在实践中应用!

10 楼 qiren83 2010-03-13  
看不懂 有啥实际含义

要是分段为N
按你的要求 你把整个文件从头到尾全读了N次
9 楼 C_J 2010-03-13  
楼上的兄弟说这段代码确实是有问题的。

-finally都没有一个关闭句柄的。
-RandomAccessFile确实好点。
-break都没有,没意义了。
8 楼 vsover 2010-03-13  
用序列化吧! 
7 楼 mercyblitz 2010-03-13  
利用FileReader的会把所有的内容加载到内存中,因此没有意义。
如果要使用BIO,建议使用java.io.RandomAccessFile来做,读取部分信息。
如果要使用NIO,建议使用java.nio.channels.FileChannel,使用虚拟内存来Mapping大文件。
6 楼 ssy8110 2010-03-13  
应在不符合条件时跳出来...
5 楼 超级潜水艇 2010-03-13  
读都读完了,这又分段不分段有啥意义。
4 楼 xprayc 2010-03-12  
<div class="quote_title">lz这样还是遍历了整个文件啊。当你取到所需内容之后就可以break了吧。另一方面,这种情况下还是随机访问的方式效率好一些吧。</div>
<div class="quote_title">p_x1984 写道</div>
<div class="quote_div">
<p>项目中使用到了读文件,但是有的文件很大。一下子加入到内存中再循环取,效率很底,试着用分段读,这个方法可行。把代码贴出来,如果大家有更好的方法。欢迎指正。</p>
<p> </p>
<p>public static List&lt;Keyword&gt; readFile(int formIndex, int toIndex) {<br>
        List&lt;Keyword&gt; lists = new ArrayList&lt;Keyword&gt;();<br>
        String path = getPadFilePath();<br>
        try {<br>
            FileReader fr = new FileReader(path);<br>
            BufferedReader br = new BufferedReader(fr);<br><br>
            String temp;<br>
            int i = 0;<br>
            while ((temp = br.readLine()) != null) {<br>
                i++;<br>
                if (i &gt; formIndex &amp;&amp; i &lt; toIndex) {<br>
                    lists.add(new Keyword(temp));<br>
                }<br>
            }<br>
            fr.close();<br>
        } catch (Exception e) {<br>
            <br>
            log.error("read file exception :" + getExceptionStr(e));<br>
        }<br>
        return lists;<br>
    }</p>
<p> </p>
<p>  注:fromIndex -- 起始位置。toIndex --- 结束位置。</p>
<p>  之前的做法是用的是List中有一个subList的方法,这个也可以实现,但是目的不一样。如果是那样的话。做起来很简单。</p>
</div>
<p> </p>
3 楼 p_x1984 2010-03-12  
WorldHello

你有好的做法贴上来看看阿。别在说瞎话
2 楼 Jacky-Q 2010-03-12  
while ((temp = br.readLine()) != null) {
                i++;
                if (i > formIndex && i < toIndex) {
                    lists.add(new Keyword(temp));
                }
            }

一直到文件读完指针才会停下来?那分段的意义在哪里?
1 楼 WorldHello 2010-03-12  
<div class="quote_title">p_x1984 写道</div>
<div class="quote_div">
<p>项目中使用到了读文件,但是有的文件很大。一下子加入到内存中再循环取,效率很底,试着用分段读,这个方法可行。把代码贴出来,如果大家有更好的方法。欢迎指正。</p>
<p> </p>
<p>public static List&lt;Keyword&gt; readFile(int formIndex, int toIndex) {<br>
        List&lt;Keyword&gt; lists = new ArrayList&lt;Keyword&gt;();<br>
        String path = getPadFilePath();<br>
        try {<br>
            FileReader fr = new FileReader(path);<br>
            BufferedReader br = new BufferedReader(fr);<br><br>
            String temp;<br>
            int i = 0;<br>
            while ((temp = br.readLine()) != null) {<br>
                i++;<br>
                if (i &gt; formIndex &amp;&amp; i &lt; toIndex) {<br>
                    lists.add(new Keyword(temp));<br>
                }<br>
            }<br>
            fr.close();<br>
        } catch (Exception e) {<br>
            <br>
            log.error("read file exception :" + getExceptionStr(e));<br>
        }<br>
        return lists;<br>
    }</p>
<p> </p>
<p>  注:fromIndex -- 起始位置。toIndex --- 结束位置。</p>
<p>  之前的做法是用的是List中有一个subList的方法,这个也可以实现,但是目的不一样。如果是那样的话。做起来很简单。</p>
</div>
<p> </p>
<p> </p>
<p>你头上的星星怎么来的?</p>
<p>这代码写的</p>
<p>看着不爽</p>
<p> </p>

相关推荐

    C# FileStream 分段读取文本内容

    接下来,我们可以使用`FileStream`的`Read`方法来分段读取文件内容。`Read`方法接受三个参数:一个缓冲区(`byte[]`),一个缓冲区起始位置(`int`),以及要读取的字节数(`int`)。读取完成后,返回实际读取到的...

    java实现分段读取文件并通过HTTP上传的方法

    为了分段读取文件,我们可以设定一个固定大小的块,如1MB,然后使用`seek()`方法移动文件指针到指定位置,再使用`read()`方法读取指定长度的数据。这样就可以将大文件分割成多个小段。 ```java RandomAccessFile ...

    文件带标识,分段读取

    文件带标识,分段读取,设置开头和结尾判断,读取相应的数据 一下是一个例子,存入文档,输入路径即可看到结果

    分段读取二进制文件

    在IT领域,分段读取二进制文件是一种常见的优化技术,特别是在处理大文件或需要实时更新显示的情况下。本文将详细探讨如何实现这一技术,并针对“分段读取二进制文件”这一主题进行深入解析。 首先,我们要理解二...

    易语言文件分段加密类

    在易语言的类中,开始解密可能涉及读取加密后的文件分段,然后逐个进行解密操作,最终恢复整个文件。 6. **获得文件长度**:在加密和解密过程中,需要知道文件的原始大小以确保正确处理所有分段。易语言提供的...

    分段读取_shujucaiji_

    标题“分段读取_shujucaiji_”表明我们讨论的是如何在LabVIEW中对大文件或连续数据流进行分块处理。在处理大量数据时,一次性加载所有数据可能导致内存溢出或系统响应变慢,因此分段读取是一种有效的解决策略。它...

    使用RandomAccessFie分段写大文件,创建多线程程席、通讨多线程分段读取大文件并分段写入到新文件

    接下来,我们详细讨论如何实现分段读取大文件并分段写入新文件的过程: 1. **文件分段**:首先,我们需要确定文件大小和要创建的线程数。将文件大小除以线程数得到每个分段的大小。然后,使用`RandomAccessFile`...

    C++逐行读取txt整条内容和分段内容

    通过提取输入文件(txt格式),输出每个学生的作业平均分和总分,并根据人数和作业数自动修改 number_of_students 9 number_of_assignments 3 student_number first_name last_name 10 10 10 98861 BOB BARKER 8 5 9...

    多线程读取大文件

    这时,通过多线程来分段读取文件,可以有效提高读取效率。例如,可以将大文件分成若干部分,每个线程负责读取一部分,这样各个线程就可以并行工作,减少了整体的等待时间。 实现多线程读取大文件的方法多种多样,...

    用labview读取数据,把数据分段读取后在处理.zip

    2. **分段读取**:在数据量较大时,一次性读取所有数据可能导致内存不足,因此通常会采用分段读取的方式。可以使用循环结构,如“for”或“while”循环,每次读取文件的一部分。例如,你可以设定每次读取的数据行数...

    webservice分段上传文件

    3. FileByteUtil.java:这个文件很可能是包含了一些文件操作和字节流处理的工具类,比如读取和写入文件,计算文件校验和(如MD5或SHA),或者比较和拼接字节数组。 详细知识点: 1. 分段上传机制:理解分段上传的...

    webApi、MVC、ajax分段上传文件带进度条

    这通常通过读取每个分段,然后追加到新的文件中来实现。合并完成后,服务器可以进行验证和存储。 七、错误处理与重试机制 在上传过程中,可能会遇到网络问题或其他异常,因此需要实现错误处理和重试机制。如果某个...

    Android 逐行写入和读取文本文件Demo

    我们可以使用`openFileOutput()`方法来创建或打开一个文件,并使用`openFileInput()`方法来读取文件。这两个方法都需要一个文件名参数,并返回一个`FileOutputStream`或`FileInputStream`对象,用于进行实际的数据...

    SpringBoot版本的多线程下载文件,分段下载文件

    2. 根据范围创建`Callable`任务,负责读取并返回指定范围的文件数据。 3. 合并所有下载的片段,并设置正确的`Content-Type`和`Content-Length`响应头。 4. 如果用户中断了下载,他们可以在下一次请求时提供上一次...

    视频文件的读取与保存

    在IT领域,尤其是计算机视觉和多媒体处理中,视频文件的读取与保存是至关重要的操作。OpenCV(开源计算机视觉库)是一个强大的工具,广泛应用于图像和视频处理任务。在这个主题中,我们将深入探讨如何使用OpenCV在...

    ASP.NET中读取TXT文件及插入到数据库存中

    - **编码问题**:确保读取文件时指定正确的编码方式,如UTF-8、GBK或GB2312等,避免乱码出现。 - **安全性**:在处理用户上传的文件时,需要对数据进行校验和清理,防止SQL注入等安全问题。 - **性能优化**:对于...

    使用HttpWebRequest实现大文件上最新传

    - **分段读取文件**:接着,使用`FileStream`读取文件,并按照预定的块大小(例如4KB)逐段读取文件内容。 - **构建请求数据**:每读取一段数据后,构建HTTP请求体,添加到`HttpWebRequest`对象中。 - **发送请求**...

    js分段上传文件.zip

    "js分段上传文件.zip" 包含了一个利用JavaScript(特别是JQUERY库)实现的大文件分段上传解决方案。这种方法允许用户高效地上传大文件,即使在带宽有限或者网络不稳定的情况下也能保证上传的可靠性。 分段上传的...

Global site tag (gtag.js) - Google Analytics