`
该用户名已经存在
  • 浏览: 308562 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

重复读取InputStream的方法

    博客分类:
  • Java
阅读更多
这篇博客中我们已经知道了Java的InputStream是不能重复被读取的。
但是在有的场合中,我们需要重复利用InputStream的数据。
比如:
1. 一个office word文件流,我需要首先读取InputStream中的前一些字节来判断word文件的实际内容(word文件可以保存html,mht的内容)。然后再根据实际内容决定我要解析InputStream的方式。

2. 一个Html文件流,我需要首先读取InputStream中的一些字节来判断Html文件编码方式。然后再根据html文件编码方式读取Html内容。

3. 从socket收到的一个InputStream,我首先需要读取InputStream判断是什么类型的字符串。然后再将InputStream读取写到文件里。

总之,在实际的工作当中,我们常常会需要多次读取一个InputStream的需求。
如果该InputStream是我们通过某种方式“主动”获取的,那我们可以不必重复读取一个InputStream,而是再次获取一样数据的InputStream来处理。
例如:
InputStream inputStream = new FileInputStream(path);
//利用inputStream
inputStream = new FileInputStream(path);
//再次利用inputStream

再例如:
InputStream inputStream = httpconn.getInputStream(); 
//利用inputStream
inputStream = httpconn.getInputStream();
//再次利用inputStream

但是,对于“被动”利用InputStream的接口,在接口内部需要重复利用InputStream,对于InputStream的来源,可能是文件,可能是网络,也可能是内存里的一个String,对于InputStream的方式接口内部不得而知,因此更谈不上在接口内部重复获取了。
例如有这样一个接口:
//将InputStream转换成一个文本字符串
public String convert(InputStream inputStream);

在接口内部我们可能需要首先读取InputStream前n个字节来判断InputStream流的数据流型,然后转化InputStream为一个字符串。

最简单的方式就是缓存,首先将InputStream缓存到内存,然后重复使用内存里的数据。
例如:
package com.gs.cvoud.attachment.converter;

import java.io.ByteArrayInputStream;
import java.io.ByteArrayOutputStream;
import java.io.IOException;
import java.io.InputStream;

import com.gs.cvoud.util.ObjectUtils;

/**
 * 缓存InputStream,以便InputStream的重复利用
 * @author boyce
 * @version 2014-2-24
 */
public class InputStreamCacher {
	
	private static final org.slf4j.Logger logger = org.slf4j.LoggerFactory.getLogger(InputStreamCacher.class);
	
	/**
	 * 将InputStream中的字节保存到ByteArrayOutputStream中。
	 */
	private ByteArrayOutputStream byteArrayOutputStream = null;
	
	public InputStreamCacher(InputStream inputStream) {
		if (ObjectUtils.isNull(inputStream))
			return;
		
		byteArrayOutputStream = new ByteArrayOutputStream();
		byte[] buffer = new byte[1024];  
		int len;  
		try {
			while ((len = inputStream.read(buffer)) > -1 ) {  
				byteArrayOutputStream.write(buffer, 0, len);  
			}
			byteArrayOutputStream.flush();
		} catch (IOException e) {
			logger.error(e.getMessage(), e);
		}  
	}
	
	public InputStream getInputStream() {
		if (ObjectUtils.isNull(byteArrayOutputStream))
			return null;
		
		return new ByteArrayInputStream(byteArrayOutputStream.toByteArray());
	}
}

接口内部使用情景:
InputStreamCacher  cacher = new InputStreamCacher(inputStream);
InputStream stream = cacher.getInputStream();
//读取stream
stream = cacher.getInputStream();

上述的方式是将InputStream缓存到一个ByteArrayOutputStream中,当然缓存的数据类型和方式都是任意的,这只是一种解决思路。
这种方式有一个最大的缺点,就是内存压力。
外部传给接口的InputStream有可能很大。每调用一次接口就将InputStream缓存到内存中,内存要承受的压力是可想而知的。

编程永远都是在时间和空间之间找到一个平衡点,前面说的“主动获取方式”的重复获取也有它的缺点,就是需要重新读取文件,获取重新建立网络连接等,这就是需要消耗更多的时间。

万事万物都是这样,天下没有完美的事,有舍才有得,选择什么就意味着放弃什么,开了一扇窗可能就要关一扇门。所以不管是生活还是编程,我们都需要在舍与得,选择的与放弃的,窗和门之间做出相对合理的抉择,或者说不得不做的抉择。

闲话扯远了,其实重复利用InputStream还有另一种方式:
通过mark和reset方法重复利用InputStream
分享到:
评论

相关推荐

    java * 构建可重复读取inputStream的request

    java * 构建可重复读取inputStream的requestjava * 构建可重复读取inputStream的requestjava * 构建可重复读取inputStream的requestjava * 构建可重复读取inputStream的requestjava * 构建可重复读取inputStream的...

    springboot 解决InputStream只能读取一次的问题

    我们可以创建一个自定义的`HttpServletRequestWrapper`子类,重写`getInputStream()`方法,使其返回一个可以重复读取的`InputStream`。 以下是一个简单的自定义`HttpServletRequestWrapper`示例: ```java import ...

    Java使用ByteArrayOutputStream 和 ByteArrayInputStream 避免重复读取配置文件的方法

    它接受一个字节数组作为构造函数的参数,然后我们可以使用 `read()` 方法逐个读取字节,或者 `read(byte[] b, int off, int len)` 方法读取到指定的字节数组中。通过这种方式,我们可以在不依赖外部文件或网络连接的...

    为什么SpringMVC中请求的body不支持多次读取

    这个方法返回一个 ServletInputStream 对象,该对象可以用来读取请求体。但是,一旦读取完毕,流就关闭了,无法再次读取。 为什么会出现这个问题呢?这是因为在 Servlet 中,请求体只能被读取一次,一旦读取后,流...

    完美解决java读取excel内存溢出问题.rar

    重复使用对象或者使用高效的数据结构,如ArrayList而非LinkedList,都可以减少内存开销。 5. **优化代码逻辑**:检查代码中是否有不必要的数据复制或计算。在读取和处理数据时,尽可能地减少冗余操作。 6. **延迟...

    读取网络图片

    `readStream()`方法负责读取InputStream中的数据,并将其存储到一个字节数组中。这里使用了ByteArrayOutputStream和字节数组作为缓冲区,逐块读取输入流数据并写入输出流,直到流结束。最后,关闭输入流和输出流,并...

    完美解决request请求流只能读取一次的问题

    为了解决这个问题,我们可以自定义一个HttpServletRequestWrapper,覆写getInputStream()和getReader()方法,从而实现流的重复读取。 在SpringBoot项目中,我们可以使用Filter拦截器对所有请求流中的json数据进行...

    读取properties文件工具类

    通过这样的工具类,开发者可以方便地加载和获取配置文件中的属性值,避免重复编写相同的代码。下面我们将详细探讨`properties`文件、如何创建工具类以及如何使用此类进行文件读取。 1. **什么是.properties文件** ...

    restream:用于缓冲和重新读取 java.io.InputStream 的实用程序类

    在Java编程中,`InputStream`是处理字节流的基础类,广泛用于读取各种输入数据,如文件、网络连接等。然而,有时我们可能需要对输入流进行缓冲或重新读取,以实现某些高级功能,比如数据缓存、断点续传等。`restream...

    读取Properties信息工具类

    - 使用`Properties.load(InputStream)`方法可以从输入流中加载Properties文件。例如,我们可以使用`FileInputStream`打开文件,然后调用`load()`方法。 - 示例代码: ```java FileInputStream fis = new ...

    浅谈request.getinputstream只能读取一次的问题

    在处理这类问题时,开发者应确保一次性处理完所有数据,或者先将数据复制到可重复读取的数据结构中。同时,深入理解Java I/O流的原理,特别是`read()`、`mark()`和`reset()`方法,对于优化和调试Web应用的输入处理...

    Java_输入输出流及文件读写详解.docx

    如果需要重复读取流中同一段内容,则需要使用流类中的 mark 方法进行标记,然后才能重复读取。 本文档对 Java 中的输入输出流和文件读写进行了详细的介绍,涵盖了 I/O 类的体系结构、字节流和字符流、InputStream ...

    java读取properties配置文件的方法

    这种方法通过静态初始化块一次性加载配置,之后的每次调用都将直接从内存中获取,避免了重复的文件读取。 总结来说,读取Java properties配置文件有多种方法,每种都有其适用场景。静态变量和静态方法可以优化性能...

    java通过url读取远程数据并保持到本地的实例代码

    上面的实例代码中,使用了 RedisTemplate 来缓存读取的数据,以避免重复读取和中途异常退出。 知识点四:使用自动化工具和脚本来实现批量下载 在批量下载远程数据时,可以使用自动化工具和脚本来实现批量下载。...

    Excel POI读取封装(文件+示范代码)

    Excel POI读取封装(文件+示范代码) package org.excel.service; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileWriter; import java.io.IOException; import java....

    BufferedInputStream(缓冲输入流)详解_动力节点Java学院整理

    BufferedInputStream 的优点是可以提高输入流的读取速度和效率,同时也提供了 mark() 和 reset() 方法来支持标记和重置操作。但是,它也存在一些缺点,例如缓冲区的大小可能会限制输入流的读取速度。 ...

    杭州公司笔试题目.doc

    dc.setResultTransformer(Criteria.DISTINCT_ROOT_ENTITY) 是 Hibernate 框架中用于去除重复项的方法。Criteria.DISTINCT_ROOT_ENTITY 是一个标记,用于指定结果集的去重方式。在 Hibernate 中,我们可以使用 ...

    Android实验7

    - **逐行读取**:使用`BufferedReader.readLine()`方法逐行读取文件内容。 - **处理内容**:将读取到的每一行内容拼接起来,并展示在界面上。 #### 实验关键点总结 - **数据持久化**:`SharedPreferences`是一种...

    Java I/O详细笔记

    缓冲流还提供了`mark()`和`reset()`方法来标记位置并重置到标记位置,这对于某些需要重复读取数据的应用非常有用。 #### 三、类层次 Java的I/O流体系结构基于一系列抽象基类,通过继承这些基类实现具体的流操作。 ...

    Java 中的 DataInputStream 介绍_动力节点Java学院整理

    该方法可以重复读取直到填满字节数组 b。 DataInputStream 是 Java 中一个非常重要的输入流类,它提供了许多方法来读取基本 Java 数据类型。开发者可以使用 DataInputStream 来读取数据,并使用 DataOutputStream ...

Global site tag (gtag.js) - Google Analytics