`

Java中将InputStream读取为String, 各种方法的性能对比

 
阅读更多

如下, 一共存在11种实现方式及其对应的性能测试结果:

1. 使用IOUtils.toString (Apache Utils)

String result = IOUtils.toString(inputStream, StandardCharsets.UTF_8);

 2. 使用CharStreams (guava)

String result = CharStreams.toString(new InputStreamReader(inputStream, Charsets.UTF_8));

 3. 使用Scanner (JDK)

Scanner s = new Scanner(inputStream).useDelimiter("\\A");
String result = s.hasNext() ? s.next() : "";

 4. 使用Stream Api (Java 8). 提醒: 这种方式会将不同的换行符 (比如\r\n) 都替换为 \n.

String result = new BufferedReader(new InputStreamReader(inputStream))
  .lines().collect(Collectors.joining("\n"));

 5. 使用parallel Stream Api (Java 8). 提醒: 这种方式会将不同的换行符 (比如\r\n) 都替换为 \n.

String result = new BufferedReader(new InputStreamReader(inputStream))
  .lines().parallel().collect(Collectors.joining("\n"));

 6. 使用InputStreamReader 和StringBuilder (JDK)

final int bufferSize = 1024;
final char[] buffer = new char[bufferSize];
final StringBuilder out = new StringBuilder();
Reader in = new InputStreamReader(inputStream, "UTF-8");
for (; ; ) {
    int rsz = in.read(buffer, 0, buffer.length);
    if (rsz < 0)
        break;
    out.append(buffer, 0, rsz);
}
return out.toString();

 7. 使用StringWriter 和 IOUtils.copy (Apache Commons)

StringWriter writer = new StringWriter();
IOUtils.copy(inputStream, writer, "UTF-8");
return writer.toString();

 8. 使用ByteArrayOutputStream 和 inputStream.read (JDK)

ByteArrayOutputStream result = new ByteArrayOutputStream();
byte[] buffer = new byte[1024];
int length;
while ((length = inputStream.read(buffer)) != -1) {
    result.write(buffer, 0, length);
}
return result.toString("UTF-8");

 9. 使用BufferedReader (JDK). 提醒: 这种方式会将不同的换行符 (比如\r\n) 都替换为当前系统的换行符(例如, 在windows下是"\r\n").

String newLine = System.getProperty("line.separator");
BufferedReader reader = new BufferedReader(new InputStreamReader(inputStream));
StringBuilder result = new StringBuilder();
String line; boolean flag = false;
while ((line = reader.readLine()) != null) {
    result.append(flag? newLine: "").append(line);
    flag = true;
}
return result.toString();

 10. 使用BufferedInputStream 和 ByteArrayOutputStream (JDK)

BufferedInputStream bis = new BufferedInputStream(inputStream);
ByteArrayOutputStream buf = new ByteArrayOutputStream();
int result = bis.read();
while(result != -1) {
    buf.write((byte) result);
    result = bis.read();
}
return buf.toString();

 11. 使用 inputStream.read() 和 StringBuilder (JDK). 提醒: 这种方式处理Unicode时存在问题, 例如俄文, 仅在非Unicode字符串下工作正常.

int ch;
StringBuilder sb = new StringBuilder();
while((ch = inputStream.read()) != -1)
    sb.append((char)ch);
reset();
return sb.toString();

 提醒:

方式 4, 5 和 9 都存在替换换行符的问题. 方式11在Unicode下不能正常工作.

性能测试
对于短字符串 (length = 175)的测试, url in github (mode = Average Time, system = Linux, score 1,343 is the best):

       Benchmark                        Mode  Cnt   Score   Error  Units
8. ByteArrayOutputStream and read (JDK)        avgt   10   1,343 ± 0,028  us/op
6. InputStreamReader and StringBuilder (JDK)   avgt   10   6,980 ± 0,404  us/op
10.BufferedInputStream, ByteArrayOutputStream  avgt   10   7,437 ± 0,735  us/op
11.InputStream.read() and StringBuilder (JDK)  avgt   10   8,977 ± 0,328  us/op
7. StringWriter and IOUtils.copy (Apache)      avgt   10  10,613 ± 0,599  us/op
1. IOUtils.toString (Apache Utils)             avgt   10  10,605 ± 0,527  us/op
3. Scanner (JDK)                               avgt   10  12,083 ± 0,293  us/op
2. CharStreams (guava)                         avgt   10  12,999 ± 0,514  us/op
4. Stream Api (Java 8)                         avgt   10  15,811 ± 0,605  us/op
9. BufferedReader (JDK)                        avgt   10  16,038 ± 0,711  us/op
5. parallel Stream Api (Java 8)                avgt   10  21,544 ± 0,583  us/op

 对于长字符串的测试 (length = 50100), url in github (mode = Average Time, system = Linux, score 200,715 is the best):

 Benchmark                        Mode  Cnt   Score        Error  Units
8. ByteArrayOutputStream and read (JDK)        avgt   10   200,715 ±   18,103  us/op
1. IOUtils.toString (Apache Utils)             avgt   10   300,019 ±    8,751  us/op
6. InputStreamReader and StringBuilder (JDK)   avgt   10   347,616 ±  130,348  us/op
7. StringWriter and IOUtils.copy (Apache)      avgt   10   352,791 ±  105,337  us/op
2. CharStreams (guava)                         avgt   10   420,137 ±   59,877  us/op
9. BufferedReader (JDK)                        avgt   10   632,028 ±   17,002  us/op
5. parallel Stream Api (Java 8)                avgt   10   662,999 ±   46,199  us/op
4. Stream Api (Java 8)                         avgt   10   701,269 ±   82,296  us/op
10.BufferedInputStream, ByteArrayOutputStream  avgt   10   740,837 ±    5,613  us/op
3. Scanner (JDK)                               avgt   10   751,417 ±   62,026  us/op
11.InputStream.read() and StringBuilder (JDK)  avgt   10  2919,350 ± 1101,942  us/op

 可以看出8和6是相对更好的选择

 

分享到:
评论

相关推荐

    Java实现字节流与图片的转化Java源码

    2. **读取字节**:调用InputStream的read()方法,将图片文件的每个字节读取到一个字节数组中。 3. **处理字节数组**:读取到的字节数组就是图片的二进制表示,可以根据需要进行传输或存储。 4. **关闭流**:在完成...

    Java实现输入流转化为String

    在Java编程中,处理输入流(InputStream)并将其转换为字符串(String)是一种常见的操作,特别是在处理网络请求、文件读取或者XML/JSON解析等场景。以下将详细解释如何实现这个过程,并讨论其中涉及的关键知识点。 ...

    java源码包---java 源码 大量 实例

     在对象创建的过程中将被容器调用,onMessage函数方法接收消息参数,将其强制转型为合适的消息类型,同时打印出消息的内容。同时一个mail note将被发送给消息发送者,发送一个e-mail通知给由recipient参数确定的e-...

    用JAVA导出MYSQL的数据

    这通常涉及使用Java的`Runtime.getRuntime().exec()`方法来执行系统命令。以下是一个简单的Java示例,展示了如何调用`mysqldump`命令来导出数据: ```java package com; import java.io.*; public class Test { ...

    java源码包3

     在对象创建的过程中将被容器调用,onMessage函数方法接收消息参数,将其强制转型为合适的消息类型,同时打印出消息的内容。同时一个mail note将被发送给消息发送者,发送一个e-mail通知给由recipient参数确定的e-...

    java源码包2

     在对象创建的过程中将被容器调用,onMessage函数方法接收消息参数,将其强制转型为合适的消息类型,同时打印出消息的内容。同时一个mail note将被发送给消息发送者,发送一个e-mail通知给由recipient参数确定的e-...

    成百上千个Java 源码DEMO 4(1-4是独立压缩包)

    消息驱动Bean必须实现两个接口MessageDrivenBean和MessageListener 在对象创建的过程中将被容器调用,onMessage函数方法接收消息参数,将其强制转型为合适的消息类型,同时打印出消息的内容。同时一个mail note将被...

    java源码包4

     在对象创建的过程中将被容器调用,onMessage函数方法接收消息参数,将其强制转型为合适的消息类型,同时打印出消息的内容。同时一个mail note将被发送给消息发送者,发送一个e-mail通知给由recipient参数确定的e-...

    成百上千个Java 源码DEMO 3(1-4是独立压缩包)

    消息驱动Bean必须实现两个接口MessageDrivenBean和MessageListener 在对象创建的过程中将被容器调用,onMessage函数方法接收消息参数,将其强制转型为合适的消息类型,同时打印出消息的内容。同时一个mail note将被...

    java android 读写txt项目源码

    例如,可以有一个`readTxtFile(String filePath)`方法和一个`writeTxtFile(String filePath, String content)`方法。这两个方法可以分别处理读写操作,简化主业务逻辑。 在实际开发中,我们还需要考虑错误处理,如...

    Java中几个文件输入流和文件输出流的研究.pdf

    4. 读取方法:public int read(byte[] b) throws IOException:从此输入流中将最多 b.length 个字节的数据读入一个 byte 数组中。 5. 关闭方法:public void close() throws IOException:关闭此文件输入流并释放与...

    java面试题目大全

    - **本地方法栈**:本地方法栈与虚拟机栈所发挥的作用是非常相似的,其区别只是虚拟机栈为虚拟机执行 Java 方法服务,而本地方法栈则是为虚拟机使用到的 Native 方法服务。 总结来说,Java 内存模型主要由栈、堆、...

    几个java作业小题代码

    - 使用 `String` 类的 `equals` 方法来比较两个字符串是否相等。 4. **条件判断与输出:** - 通过 `count` 变量记录找到的重复元素的数量。 - 最后通过条件判断输出结果。 **扩展知识点:** - 更高效的检查重复...

    主题JAVANIO简介知识点.pdf

    各种编程语言提供的运行时系统都会为开发者提供执行I/O操作的更高级别工具,例如C语言中的`printf`和`scanf`函数,以及Java中面向对象的封装。 **Java标准IO** Java的标准IO类库是对I/O操作的一种面向对象的抽象。...

    java实现文件上传到服务器

    首先,我们需要将文件内容读取到`InputStream`,然后在SQL语句中将其作为参数传递: ```java Connection conn = DriverManager.getConnection(DB_URL, USER, PASS); PreparedStatement pstmt = conn.prepare...

    java实现两台服务器间文件复制的方法

    总之,Java实现两台服务器间文件复制的方法涉及网络编程和文件I/O,理解这些基本概念是实现跨服务器文件复制的关键。在实际项目中,应根据需求选择合适的解决方案,并确保数据传输的安全性和可靠性。

    java输出excel

    读取Excel文件与创建的过程类似,只是使用`WorkbookFactory.create(InputStream)`方法打开现有文件,然后遍历工作表、行和单元格,获取数据。 8. **Eclipse集成**: 项目中提到的"导入eclipse后,加载lib文件夹下...

    J003-JavaSE-RevE.1.1.pdf

    JavaSE类库中的API分为基础API和扩展API,基础API以java为顶级包名,如java.lang、java.util、java.io等,而扩展API通常以javax为顶级包名。 2. java.lang包:这个包是Java编程语言的核心包,它包含了许多基础和...

    java 后台将base64字符串保存为图片的方法

    Java 后台将 Base64 字符串保存为图片的方法是指在 Java 应用程序中将 Base64 编码的字符串解码并保存为图片的过程。在本篇文章中,我们将介绍如何使用 Java 语言将 Base64 字符串保存为图片。 首先,需要了解什么...

Global site tag (gtag.js) - Google Analytics