出处:http://www.cnblogs.com/shitouer/archive/2012/12/19/2823641.html
最近在看《Hadoop:The Definitive Guide》,对其分布式文件系统HDFS的Streaming data access不能理解。基于流的数据读写,太抽象了,什么叫基于流,什么是流?Hadoop是Java语言写的,所以想理解好Hadoop的Streaming Data Access,还得从Java流机制入手。流机制也是JAVA及C++中的一个重要的机制,通过流使我们能够自由地操作包括文件,内存,IO设备等等中的数据。
首先,流是什么?
流是个抽象的概念,是对输入输出设备的抽象,Java程序中,对于数据的输入/输出操作都是以“流”的方式进行。设备可以是文件,网络,内存等。
流具有方向性,至于是输入流还是输出流则是一个相对的概念,一般以程序为参考,如果数据的流向是程序至设备,我们成为输出流,反之我们称为输入流。
可以将流想象成一个“水流管道”,水流就在这管道中形成了,自然就出现了方向的概念。
当程序需要从某个数据源读入数据的时候,就会开启一个输入流,数据源可以是文件、内存或网络等等。相反地,需要写出数据到某个数据源目的地的时候,也会开启一个输出流,这个数据源目的地也可以是文件、内存或网络等等。
流有哪些分类?
可以从不同的角度对流进行分类:
1. 处理的数据单位不同,可分为:字符流,字节流
2.数据流方向不同,可分为:输入流,输出流
3.功能不同,可分为:节点流,处理流
1. 和 2. 都比较好理解,对于根据功能分类的,可以这么理解:
节点流:节点流从一个特定的数据源读写数据。即节点流是直接操作文件,网络等的流,例如FileInputStream和FileOutputStream,他们直接从文件中读取或往文件中写入字节流。
处理流:“连接”在已存在的流(节点流或处理流)之上通过对数据的处理为程序提供更为强大的读写功能。过滤流是使用一个已经存在的输入流或输出流连接创建的,过滤流就是对节点流进行一系列的包装。例如BufferedInputStream和BufferedOutputStream,使用已经存在的节点流来构造,提供带缓冲的读写,提高了读写的效率,以及DataInputStream和DataOutputStream,使用已经存在的节点流来构造,提供了读写Java中的基本数据类型的功能。他们都属于过滤流。
举个简单的例子:
public static void main(String[] args) throws IOException { // 节点流FileOutputStream直接以A.txt作为数据源操作 FileOutputStream fileOutputStream = new FileOutputStream("A.txt"); // 过滤流BufferedOutputStream进一步装饰节点流,提供缓冲写 BufferedOutputStream bufferedOutputStream = new BufferedOutputStream( fileOutputStream); // 过滤流DataOutputStream进一步装饰过滤流,使其提供基本数据类型的写 DataOutputStream out = new DataOutputStream(bufferedOutputStream); out.writeInt(3); out.writeBoolean(true); out.flush(); out.close(); // 此处输入节点流,过滤流正好跟上边输出对应,读者可举一反三 DataInputStream in = new DataInputStream(new BufferedInputStream( new FileInputStream("A.txt"))); System.out.println(in.readInt()); System.out.println(in.readBoolean()); in.close(); }
流结构介绍:
Java所有的流类位于java.io包中,都分别继承字以下四种抽象流类型。
字节流 | 字符流 | |
输入流 | InputStream | Reader |
输出流 | OutputStream | Writer |
1.继承自InputStream/OutputStream的流都是用于向程序中输入/输出数据,且数据的单位都是字节(byte=8bit),如图,深色的为节点流,浅色的为处理流。
2.继承自Reader/Writer的流都是用于向程序中输入/输出数据,且数据的单位都是字符(2byte=16bit),如图,深色的为节点流,浅色的为处理流。
常见流类介绍:
节点流类型常见的有:
对文件操作的字符流有FileReader/FileWriter,字节流有FileInputStream/FileOutputStream。
处理流类型常见的有:
缓冲流:缓冲流要“套接”在相应的节点流之上,对读写的数据提供了缓冲的功能,提高了读写效率,同事增加了一些新的方法。
字节缓冲流有BufferedInputStream/BufferedOutputStream,字符缓冲流有BufferedReader/BufferedWriter,字符缓冲流分别提供了读取和写入一行的方法ReadLine和NewLine方法。
对于输出地缓冲流,写出的数据,会先写入到内存中,再使用flush方法将内存中的数据刷到硬盘。所以,在使用字符缓冲流的时候,一定要先flush,然后再close,避免数据丢失。
转换流:用于字节数据到字符数据之间的转换。
仅有字符流InputStreamReader/OutputStreamWriter。其中,InputStreamReader需要与InputStream“套接”,OutputStreamWriter需要与OutputStream“套接”。
数据流:提供了读写Java中的基本数据类型的功能。
DataInputStream和DataOutputStream分别继承自InputStream和OutputStream,需要“套接”在InputStream和OutputStream类型的节点流之上。
对象流:用于直接将对象写入写出。
流类有ObjectInputStream和ObjectOutputStream,本身这两个方法没什么,但是其要写出的对象有要求,该对象必须实现Serializable接口,来声明其是可以序列化的。否则,不能用对象流读写。
还有一个关键字比较重要,transient,由于修饰实现了Serializable接口的类内的属性,被该修饰符修饰的属性,在以对象流的方式输出的时候,该字段会被忽略。
相关推荐
理解java.util.stream.Stream与java.io.Stream的区别对于Java开发者来说非常重要。这两种Stream在Java生态系统中都扮演着重要的角色,但它们服务于不同的目的。正确选择和使用这两种Stream,可以帮助你编写更高效、...
通过理解其核心方法和特性,可以有效地实现数据的转换和汇总,无论是在顺序流还是并行流中。掌握Collector接口的使用,将极大地提升处理集合数据的能力 在Java 8引入的Stream API中,java.util.stream.Collector接口...
这篇博文将深入探讨Java 8中的流,并结合`java8-stream.xls`这个Excel文件来解析流的相关概念。 **1. 流的概念** 流是Java 8引入的新概念,它是一个顺序或并行的数据序列,可以源自任何支持数据源(如集合、数组、I...
Java Stream 是Java编程语言中处理数据流的一种抽象概念,它允许程序员以一种声明性的方式处理数据,特别是集合...通过深入理解并熟练运用Stream API,开发者可以写出更加优雅、高效的代码,提升程序的性能和可维护性。
Java8是Java语言的一个重要版本,引入了许多新特性,其中最为引人注目的就是Stream API。Stream API极大地改进了集合操作的方式,使得处理大量...通过深入理解和熟练掌握Stream API,可以提升你的编程能力和项目效率。
本文将深入探讨Java中的“流”以及与之相关的基础知识,结合博客文章《Java中的那些“流”之JAVA基础知识之我的理解8》的内容进行详细阐述。 首先,我们需要了解什么是流。在Java中,流可以被看作是一组有序的数据...
Collectors.averagingInt() 是 Java 8 Stream API 中一个非常有用的工具,它允许开发者以声明式的方式轻松计算流中整数属性的平均值。通过结合使用 ToIntFunction 和 Collectors.averagingInt(),可以解决各种复杂的...
在Java IO中,缓冲流(Buffered Stream)被设计用来提高性能,通过在内部创建缓冲区来存储数据。BufferedInputStream和BufferedOutputStream是缓冲字节流的代表,而BufferedReader和BufferedWriter则是缓冲字符流的...
### 深入理解Java函数式编程和Streams API #### 一、引言 随着Java 8的发布,函数式编程范式正式被引入到Java语言中,这标志着Java编程方式的重大转变。Java 8引入了Lambda表达式、方法引用等新特性,使得Java能够...
Collectors.maxBy() 是 Java 8 Stream API 中一个非常有用的工具,它允许开发者以声明式的方式轻松找到流中的最大元素。通过结合使用 Comparator 和 Optional,它提供了一种强大且灵活的方式来处理集合数据,特别是...
在 Java 8 引入的 Stream API 中,java.util.stream.Collectors.minBy() 方法是一个强大的工具,用于在集合操作中找到流中按照指定比较器最小的元素。与 maxBy() 方法相对应,minBy() 提供了一种声明式的方式来确定...
在现代软件开发中,处理集合数据是常见的任务之一。...本文详细介绍了 Collectors.summingDouble() 方法的使用方法和应用场景,希望能够帮助你在实际开发中更好地利用 Java 8 的 Stream API 来处理数据集合。
本文将深入探讨Java 8 Stream API的基础知识及其在`Java8Test.java`中的应用。 1. **Stream API的基本概念** - Stream API是一种用于处理集合的新接口,它专注于数据的处理,而不是数据的存储。Stream不是集合元素...
这个"深入理解Java集合框架.zip"文件很可能是包含了一系列关于Java集合框架的详细资料,比如源码分析、设计模式以及最佳实践。下面将详细探讨Java集合框架的关键知识点。 1. **集合接口**:Java集合框架的核心接口...
本套教程通过详细讲解这些概念,并结合具体的实践练习,将帮助你深入理解Java函数式编程,提升你的代码质量和效率。无论是初学者还是有经验的开发者,都能从中受益匪浅,实现Java编程的新飞跃。
本文将深入探讨Java中的集合操作,并结合PPT(虽然这里没有提供具体的PPT内容,但通常这样的资源会包含示例、解释和最佳实践)来帮助初学者理解。 1. **集合接口**: - **List**: 有序的集合,允许重复元素,如...
IO流分为字节流(Byte Stream)和字符流(Character Stream),它们构成了Java IO系统的基础。 1. **字节流**: - 字节流主要处理单个字节的数据,包括`InputStream`和`OutputStream`两个抽象基类。例如,`...
在这个详细的源代码下载中,我们可以通过四篇相关的CSDN博客文章来深入理解Java IO流的工作原理和实际应用。 首先,我们需要了解Java IO流的分类。Java IO库中的流分为字节流和字符流两大类,每类又分为输入流和...
本实验旨在通过dat文件输入输出,让你深入理解流密码的工作机制。 流密码的核心在于密钥生成器(Keystream Generator),它能产生一系列随机的比特流,这个比特流与明文进行异或操作后形成密文。常见的流密码算法有...
本章节将深入探讨Java IO流的基本原理、分类以及常用类。 首先,让我们了解什么是流。在计算机科学中,"流"是一个流动的数据缓冲区,它允许数据从源头流向目的地。在Java中,流被用于实现程序与外部设备、文件、...