如何正确使用Java I/O输出和读入数据
前言
Java的I/O系统使用“流”来处理各种类型的输入、输出数据的任务。
在传输数据的过程中,我们需要判断流中传输的数据何时结束这样的问题。这对于我们正确地发送和接收数据是非常关键的。
如何判断流的末尾和批数据的末尾,是解决这个问题的关键。本文就是要深入地分析Java I/O输入输出的工作原理,保证我们能够正确地执行数据的发送和接收!
Java I/O任务
一个Java的I/O任务,创建了一个连接两个系统的数据传输管道。它分为两个部分:输入流和输出流。
输入流,指的是通过流向本系统的内存传输数据的单向数据传输通道。
输出流,指的是通过流向外部系统传输数据的单向数据传输通道。
输入流
InputStream类是表示字节输入流的所有类的超类。这是一个抽象类。
我们看它提供的读入数据的方法:
read
public abstract int read()
throws IOException
从输入流读取下一个数据字节。返回 0 到 255 范围内的 int 字节值。如果因已到达流末尾而没有可用的字节,则返回值 -1。在输入数据可用、检测到流的末尾或者抛出异常前,此方法一直阻塞。
子类必须提供此方法的一个实现。
返回:
下一个数据字节,如果到达流的末尾,则返回 -1。
抛出:
IOException - 如果发生 I/O 错误。
--------------------------------------------------------------------------------
read
public int read(byte[] b)
throws IOException
从输入流中读取一定数量的字节并将其存储在缓冲区数组 b 中。以整数形式返回实际读取的字节数。在输入数据可用、检测到文件末尾或者抛出异常前,此方法一直阻塞。
如果 b 为 null,将抛出 NullPointerException。如果 b 的长度为 0,则无字节可读且返回 0;否则,要尝试读取至少一个字节。如果因为流位于文件末尾而没有可用的字节,则返回值 -1;否则,至少可以读取一个字节并将其存储在 b 中。
将读取的第一个字节存储在元素 b[0] 中,下一个存储在 b[1] 中,依次类推。读取的字节数最多等于 b 的长度。让 k 为实际读取的字节数;这些字节将存储在元素 b[0] 至 b[k-1] 之间,不影响元素 b[k] 至 b[b.length-1]。
如果不是因为流位于文件末尾而无法读取读取第一个字节,则抛出 IOException。特别是,如果输入流已关闭,则抛出 IOException。
类 InputStream 的 read(b) 方法的效果等同于:
read(b, 0, b.length)
参数:
b - 读入数据的缓冲区。
返回:
读入缓冲区的总字节数,如果由于流末尾已到达而不再有数据,则返回 -1。
抛出:
IOException - 如果发生 I/O 错误。
NullPointerException - 如果 b 为 null。
另请参见:
read(byte[], int, int)
--------------------------------------------------------------------------------
read
public int read(byte[] b,
int off,
int len)
throws IOException
将输入流中最多 len 个数据字节读入字节数组。尝试读取多达 len 字节,但可能读取较少数量。以整数形式返回实际读取的字节数。
在输入数据可用、检测到流的末尾或者抛出异常前,此方法一直阻塞。
如果 b 为 null,则抛出 NullPointerException。
如果 off 为负,或 len 为负,或 off+len 大于数组 b 的长度,则抛出 IndexOutOfBoundsException。
如果 len 为 0,则没有字节可读且返回 0;否则,要尝试读取至少一个字节。如果因为流位于文件末尾而没有可用的字节,则返回值 -1;否则,至少可以读取一个字节并将其存储在 b 中。
将读取的第一个字节存储在元素 b[off] 中,下一个存储在 b[off+1] 中,依次类推。读取的字节数最多等于 len。让 k 为实际读取的字节数;这些字节将存储在元素 b[off] 至 b[off+k-1] 之间,其余元素 b[off+k] 至 b[off+len-1] 不受影响。
在任何情况下,元素 b[0] 至 b[off] 和元素 b[off+len] 至 b[b.length-1] 都不会受到影响。
如果不是因为流位于文件末尾而无法读取第一个字节,则抛出 IOException。特别是,如果输入流已关闭,则抛出 IOException。
类 InputStream 的 read(b, off, len) 方法只重复调用方法 read()。如果第一个这样的调用导致 IOException,则从对 read(b, off, len) 方法的调用中返回该异常。如果对 read() 的任何后续调用导致 IOException,则该异常会被捕获并将发生异常时的位置视为文件的末尾;到达该点时读取的字节存储在 b 中并返回发生异常之前读取的字节数。建议让子类提供此方法的更有效的实现。
参数:
b - 读入数据的缓冲区。
off - 在其处写入数据的数组 b 的初始偏移量。
len - 要读取的最大字节数。
返回:
读入缓冲区的总字节数,如果由于已到达流末尾而不再有数据,则返回 -1。
抛出:
IOException - 如果发生 I/O 错误。
NullPointerException - 如果 b 为 null。
另请参见:
read()
read方法解读
这些方法的核心。实际上就是read()方法。
这个方法的JavaDoc中指出:
“如果因已到达流末尾而没有可用的字节,则返回值 -1。如果因已到达流末尾而没有可用的字节,则返回值 -1。在输入数据可用、检测到流的末尾或者抛出异常前,此方法一直阻塞。”
1,read方法会在能够返回流中的字节之前,一直阻塞线程。这就是说,read方法是一个低消耗的监听和读取I/O传输的好方法。
这个方法的实现,具有非常高的性能。
2,如果输入流的I/O系统在执行这个read方法时抛出异常,那么显然这个方法会非正常结束,这个也是毫无疑问的。
3,“如果因已到达流末尾而没有可用的字节,则返回值 -1。”
这句话看似没有问题,但实际上有非常大的歧义!什么是流的末尾?只有流的末尾才能返回-1吗?
InputStream类和SocketInputStream类的源码解读
通过查看InputStream类的源码,我发现实际上,流,就好比是双向2车道的高速公路。它传输数据是一批一批的。我把它叫做“批数据”。
假设A=======B两个系统通过一个I/O流来连接。
那么,从B端通向A端的车道,就叫作A的“输入流”。同一条车道,在B这边,叫作B的“输出流”。
同理,从A端通向B端的车道,就叫作A的“输出流”。同一条车道,在B这边,就叫作B的“输入流”。
数据在这条高速公路上,不是一条一条跑的,而是一批一批跑。
OutputStream类,此抽象类是表示输出字节流的所有类的超类。输出流接受输出字节并将这些字节发送到某个接收器。
OutputStream类的write方法,每执行一次,就向这条高速公路上发送了一批数据。OutputStream类的一些子类,它们并不是在每次write()方法执行之后立刻把这批数据发送到数据高速公路上的。而是只有在执行flush()方法之后,才把之前write的多批数据真正地发送到数据通道中。
这样,多个write()方法发送的数据就变为了一批数据了!
通过read()方法读入时,当读完该批数据之后,如果再一次执行read()方法,就会立刻返回-1。
实际上,这是并没有到达流的末尾!仅仅是读完了一批发送的数据而已!
如果我们又一次执行read()方法,那么,如果:
1,流没有结束。也就是说,对面的发送端可能还会发送下一批数据时,就会进入阻塞状态。当前线程暂停,直到读取到输入流中下一批数据的第一个字节。
2,流结束了。也就是说,对面的发送端不再发送任何数据,也即:这条数据通道已经没有用了,这时,可以说“到达流的末尾”了!返回-1。
所以,InputStream及其子类的read()方法的注释是不完整的!
Read()方法的注释,应该这么说:
read
public abstract int read()
throws IOException
从输入流读取下一个数据字节。返回 0 到 255 范围内的 int 字节值。
如果在读完一批数据后首次调用read()方法,那么返回-1。表示这批数据已经读完了!
如果因已到达流末尾而没有可用的字节,则返回值 -1。在输入数据可用、检测到流的末尾或者抛出异常前,此方法一直阻塞。
子类必须提供此方法的一个实现。
返回:
下一个数据字节;
如果刚读完一批数据,则返回-1;
如果到达流的末尾,则返回 -1。
抛出:
IOException - 如果发生 I/O 错误。
如何正确使用Java I/O输出和读入数据
明白了Java的I/O流的工作机理和read方法的执行结果,我们就能够正确地使用Java I/O系统输出和读入数据了。
如何分批输出数据
由于read(…)方法是分批读取数据的,所以,我们应该在输出端正确地分批输出数据。
Write(…)方法,然后执行flush()方法能够将多批数据合并成一批数据输出。
尽管OutputStream这个基类的flush()方法是无用的,但是由于我们得到的OutputStream类型的输出对象都是这个类的子类的对象,所以,我们还是应该尽量使用flush()方法强制向输出流中物理输出数据,以避免错误。
如何分批读取数据
我们常常使用public int read(byte[] b,
int off,
int len)
throws IOException
这个方法来读取一批数据。
查看这个方法的源代码,我们可以发现,它在读取完一批数据时,又执行了一次read()方法,由于前面论述的原因,这个方法立刻返回-1,然后这个方法退出,返回这次读取的字节数。
因此,如果我们要读取一批数据,可以采用如下几种方法:
使用read()判断-1来读完一批数据:
代码示例:
Int byte;
While((byte=inputStream.read())!=-1 ){
Byte就是返回的字节。
}
如果读完一批数据后再一次执行read方法,将会立刻返回-1,表示这批数据已经读完。
使用read(byte[] buffer)判断是否返回小于buffer.length或者-1来判断是否读完一批数据
上面那样一个一个字节读取数据比较麻烦,我们通常使用一个字节数组来读取数据。
read(byte[] buffer)方法返回:
1,buffer.length,表示从输入流中读取到的数据塞满了这个字节数组。此时,可能已经读完了这批数据,也可能没有读完这批数据。
如果刚好读完,那么再执行一次read()方法,就会返回-1,表示这批数据已经读完,而不是表示流已经结束。
2,小于buffer.length。表示读完了该批数据。并且执行了一次read()方法,返回-1,表示这批数据已经读完。
3,-1。这批数据已经读完了。 不可能是表示流已经结束。因为之前就会退出while循环。
代码示例:
Byte[] buffer=new byte[1024];
int size=buffer.length;
While(size!=-1 || size>=buffer.length){
Size=inputStream.read(buffer));
将数据读到数组buffer中。
如果读到了-1,或者 读出的数据少于buffer的尺寸,表示已经读完该批数据,不再循环读取数据了!
}
读入一批数据的操作必须对应输出一批数据的操作
读入一批数据的操作必须对应输出一批数据的操作。否则,读入数据的线程会一直阻塞,等待输出端输出下一批数据。
如果对方也需要我们提供输出数据,那么就可能会使整个流的两端的线程互相等待,死锁住。并且这个I/O流也会永远不释放,这样就会使系统的资源耗尽。
后记:
在前两天的工作中,我使用Socket在服务器和客户端执行操作时,出现了死锁的现象。为了找出问题的根源,我仔细查看了InputStream类和SocketInputStream类的源代码。找出了造成输入、输出流误用的原因。
希望这篇文章能够帮助饱受I/O输入、输出流问题困扰的Java程序员!
分享到:
相关推荐
描述:本文将全面介绍Java中的新输入输出(NIO),一个自JDK 1.4版本引入的重要库,旨在提供高速、块导向的输入输出处理能力,相较于传统的Java I/O包,NIO通过数据缓冲和块处理技术充分利用了底层优化,无需依赖...
Java I/O系统是基于流(Stream)的概念,流可以分为两大类别:输入流和输出流。 输入流(Input Stream)用于从数据源读取数据,而输出流(Output Stream)则是将数据写入目的地。这种分类并不严格,因为一个数据源在...
* 文件数据流包括 FileInputStream 和 FileOutputStream,这两个类用来进行文件的I/O 处理,其数据源或数据终点都应当是文件;不支持方法 mark()和 reset()。 * 缓冲区数据流有 BufferInputStream 和 ...
2. Java I/O操作:在实现读入和写入文件的操作时,需要掌握Java的输入输出流(I/O Streams)机制。涉及到的关键类有BufferedReader、FileReader、BufferedWriter、FileWriter等。BufferedReader用于高效读取文本数据...
总的来说,Java新IO提供了一种全新的、高性能的I/O模型,它通过Channel、Buffer、Selector等组件实现了非阻塞I/O、文件锁定和更高效的内存映射,尤其适用于需要高并发、低延迟的场景,比如网络服务器和大数据处理。
- 使用缓冲区可以提高文件传输效率,减少磁盘I/O操作。在读写文件时,可以将数据批量读入内存,然后一次性写出,避免频繁的系统调用。 7. **错误处理**: - 在上传和下载过程中,可能会遇到网络中断、文件不存在...
5. 读取数据:使用I/O流的读取方法,如`read()`或`read(buffer)`,将图片数据读入内存。 6. 写入文件:创建一个本地文件,通过`FileOutputStream`将数据写入。确保正确处理异常,如文件不存在、磁盘空间不足等。 7...
要实现“读入十六进制txt文件转十进制txt输出”,我们可以使用各种编程语言,例如Python、Java或C++等。这里以Python为例,介绍一个基本的处理流程: 1. **读取十六进制文件**:Python的内置函数`open()`可以用来...
例如,使用并行流处理数据,或者预加载电话号码到内存中以减少磁盘I/O。 7. **拓展功能**:除了基础的去重,还可以增加其他功能,如支持多种格式的电话号码,提供统计报告,或者集成到其他系统中作为服务接口。 在...
Java编程语言以其强大的类库和跨平台特性,广泛...总之,使用Java实现压缩软件是一个涉及到多方面知识的任务,包括文件I/O、压缩算法、异常处理和资源管理等。通过不断学习和实践,可以创建出高效、稳定的压缩工具。
3. **流的概念**:Java中的I/O操作基于流的概念,流是数据的有序序列,可以是输入流(从源读取数据)或输出流(向目标写入数据)。例如,`FileInputStream`和`FileOutputStream`分别用于读取和写入文件。 4. **...
总的来说,这个实验涵盖了Java I/O流的基础知识,包括从键盘读取数据,将数据写入文件,以及使用`File`类对文件和目录进行操作。这些都是Java编程中非常重要的基础技能,对于理解数据的输入输出流程和文件系统的操作...
全国软件设计大赛预测试卷(Java)主要涵盖了Java编程的基础知识,包括语言特性、I/O流、事件处理、Applet、面向对象特性、程序结构和控制流等方面。以下是试卷中涉及的一些关键知识点: 1. **Java语言特性**: - ...
- `BufferedInputStream` 是 `InputStream` 的子类,内部维护了一个缓冲区,可以在读取数据时先读入缓冲区再逐个读取,从而减少磁盘 I/O 操作次数,提高读取效率。 - **F BufferedOutputStream** - `...
1. **I/O操作**:在计算机科学中,输入/输出(I/O)操作是指程序与外部设备之间的数据传输。读取文件是I/O操作的一种,通过打开文件,读取内容,然后关闭文件。在大多数编程语言中,如Python、Java或C#,都有相应的...
Java是一种广泛使用的面向对象的编程语言,其设计目标...以上知识点涵盖了Java语言的基础,包括语法、异常处理、多线程、GUI编程、文件I/O以及包和类的组织等。通过不断练习,开发者可以深入理解和熟练应用这些概念。
Java中的I/O流分为字节流和字符流,字节流处理的是字节数据,如FileInputStream和FileOutputStream;而字符流处理的是字符数据,如InputStreamReader和OutputStreamWriter。字节流直接操作原始二进制数据,而字符流...
为了保证数据一致性,线程间的协作需要正确地使用同步机制,如`synchronized`关键字,`wait()`, `notify()`,或`java.util.concurrent`包中的高级工具。 8. **数据结构的选择**: 根据题目需求,可能需要使用`...
这两种流属于**过滤器流**,它们通过在内部使用缓冲区来提高I/O操作的效率,减少对底层物理设备的访问次数。 #### DataInputStream和DataOutputStream 这些类提供了读写Java基本数据类型的功能,常用于在网络上...