`

Google Guava Splitter 对比 Apache StringUtils

阅读更多

google的guava库是个很不错的工具库,这次来学习其spliiter的用法,它是一个专门用来 
分隔字符串的工具类,其中有四种用法,分别来小结 

1 基本用法 

[html] view plain copy
 
  1. import com.google.common.base.Splitter;   
  2.   
  3. public class GuavaSplitterExample {   
  4.   
  5. public static void main(String[] args) {   
  6.   
  7. String str = "a,,b,     c,,,d";   
  8.   
  9. Iterable<String> result = Splitter.on(',')   
  10.        .split(str);   
  11.   
  12. System.out.println("--start--");   
  13. for(String s: result){   
  14. System.out.println(s);   
  15. }   
  16. System.out.println("--end--");   
  17. }   
  18. }   


  输出: 
–start– 



      c 


–end– 


2) 去除空格,使用omitEmptyStrings 

[html] view plain copy
 
  1. String str = "a,,b,     c,,,d";   
  2.   
  3. rable<String> result = Splitter.on(',')   
  4.     .omitEmptyStrings()   
  5.     .split(str);   



输出: 
–start– 


      c 

–end– 

3) 去除每一行的空格 

[html] view plain copy
 
  1. String str = "a,,b,     c,,,d";   
  2.   
  3. erable<String> result = Splitter.on(',')   
  4.      .trimResults()   
  5.      .omitEmptyStrings()   
  6.      .split(str);   


输出: 
–start– 




–end– 

4) 还可以指定使用哪些字符去除 

[html] view plain copy
 
  1. String str = "a,,b,c1,,,d2";   
  2.   
  3. Iterable<String> result = Splitter.on(',')   
  4.        .trimResults(CharMatcher.DIGIT)   
  5.        .omitEmptyStrings()   
  6.        .split(str);   



输出: 
–start– 



–end– 

 

===================================================

性能对比:

 

首先看基本的使用方法: 

Java代码  收藏代码
  1. // Apache StringUtils...  
  2. String[] tokens1= StringUtils.split("one,two,three",',');  
  3.    
  4. // Google Guava splitter...  
  5. Iteratable<String> tokens2 = Splitter.on(','),split("one,two,three");  



很明显,google提供的方法更加的面向对象一点,因为它要先创建一个Splitter对象,然后使用它来分割字符串,而apache的方法则有点函数式编程的味道,它的方法都是静态的。 

这里我更加倾向于采用google的splitter,因为这个对象是可以重用的,且可以在其上附加更多的功能,比如trim,去掉空的元素等,一切都很简单。 

Java代码  收藏代码
  1. Splitter niceCommaSplitter = Splitter.on(',') .omitEmptyString().trimResults();  
  2. niceCommaSplitter.split("one,, two,  three"); //"one","two","three"  
  3. niceCommaSplitter.split("  four  ,  five  "); //"four","five"  




看起来有点用,还有其他区别么? 
另外一个需要注意的地方就是Splitter返回的是Iteratable<String>,而StringUtils.split返回的是一个String数组。 

大部分使用分隔符的情况是我们需要对字符串按照分隔符进行遍历处理,仅此而已。 
下面就是常用的代码性能对比的例子: 

Java代码  收藏代码
  1. final String numberList = "One,Two,Three,Four,Five,Six,Seven,Eight,Nine,Ten";  
  2.   
  3. long start = System.currentTimeMillis();    
  4. for(int i=0; i<1000000; i++) {  
  5.     StringUtils.split(numberList , ',');     
  6. }  
  7. System.out.println(System.currentTimeMillis() - start);  
  8.     
  9. start = System.currentTimeMillis();  
  10. for(int i=0; i<1000000; i++) {  
  11.     Splitter.on(',').split(numberList );  
  12. }  
  13. System.out.println(System.currentTimeMillis() - start);  

代码很简单,就是都对同一个字符串进行100万次的分隔操作,看看时间上的区别,结果如下: 

Java代码  收藏代码
  1. 983  
  2. 165  

很明显,guava的速度快很多,这个程序如果运行在每天处理大量字符串的服务中,那么性能差异更加明显。我想其中的原因是Splitter返回的是Iterable<String>,而StringUtils.split返回的是一个String[],需要创建新的String对象,导致耗时增加。 

如果我们对Splitter对象缓存,那么速度提高更多: 

Java代码  收藏代码
  1. start = System.currentTimeMillis();  
  2.     Splitter s = Splitter.on(',');  
  3.     for (int i = 0; i < 1000000; i++) {  
  4.       s.split(numberList);  
  5.     }  
  6.     System.out.println(System.currentTimeMillis() - start);  

结果为12,神奇吧,呵呵 

别急,结果还没有出来,目前我们还没有对结果进行处理。我们试试对上面的结果进行处理: 

Java代码  收藏代码
  1. final String numberList = "One,Two,Three,Four,Five,Six,Seven,Eight,Nine,Ten";  
  2.     long start = System.currentTimeMillis();  
  3.     for (int i = 0; i < 1000000; i++) {  
  4.       final String[] numbers = StringUtils.split(numberList, ',');  
  5.       for (String number : numbers) {  
  6.         number.length();  
  7.       }  
  8.     }  
  9.     System.out.println(System.currentTimeMillis() - start);  
  10.     start = System.currentTimeMillis();  
  11.     for (int i = 0; i < 1000000; i++) {  
  12.       Iterable<String> is = Splitter.on(',').split(numberList);  
  13.       for(String s:is) {  
  14.         s.length();  
  15.       }  
  16.     }  
  17.     System.out.println(System.currentTimeMillis() - start);  
  18.     start = System.currentTimeMillis();  
  19.     Splitter sp = Splitter.on(',');  
  20.     for (int i = 0; i < 1000000; i++) {  
  21.       Iterable<String> is =  sp.split(numberList);  
  22.       for(String s:is) {  
  23.         s.length();  
  24.       }  
  25.     }  
  26.     System.out.println(System.currentTimeMillis() - start);  



结果再次令人惊奇: 

Java代码  收藏代码
  1. 851  
  2. 2967  
  3. 2514  



guava比apache 的StringUtils慢3倍。 

结论: 
很明显,guava把处理时间较长的操作延迟到后面了,前期处理比较快。无论如何,我还是比较倾向于采用guava处理常见的字符串分隔任务,如果你要处理大量分隔后的字符串,且对性能比较关注,那可以使用StringUtils.split。

分享到:
评论

相关推荐

    不加密Google Guava视频教程.txt

    ├─Google Guava 第01讲-Joiner详细介绍以及和Java8Collector对比.wmv ├─Google Guava 第02讲-Guava Splitter详细讲解以及实战练习.wmv ├─Google Guava 第03讲-Preconditions&Objects;&assert;讲解.wmv ├─...

    Google Guava 官方教程

    Guava 提供了有用的字符串工具,如 Joiner 和 Splitter,用于高效地连接和拆分字符串。此外,Strings 类包含了许多静态方法,用于处理常见字符串操作。 6. **I/O 工具** Guava 的 Files 和 CharStreams 模块提供...

    使用google guava 实现定时缓存功能

    在IT行业中,Google Guava库是一个非常强大的工具集,它为Java开发人员提供了一系列实用的集合、缓存、并发和I/O工具。本篇文章将详细探讨如何利用Guava库实现定时缓存功能,以提高应用的性能和效率。 首先,Guava...

    google guava 中文教程

    Guava提供了更高效、更简洁的字符串处理工具,如Strings类中的join()方法用于拼接字符串,Joiner类提供了更灵活的连接功能,Splitter类则帮助我们根据特定分隔符拆分字符串。 五、函数式编程 Guava引入了Function...

    google开源项目guava.jar包

    谷歌的Guava库是Java开发中的一个非常重要的开源项目,它提供了一系列的高效、实用的工具类,大大简化了常见的编程任务。Guava的核心特性包括集合框架、缓存、原生类型支持、并发库、字符串处理、I/O操作等。这个...

    Getting Started with Google Guava

    《Getting Started with Google Guava》是Bill Bejeck所著,旨在帮助Java开发者通过Google Guava库编写更优质、更高效的代码。Bill Bejeck是一位拥有10年经验的资深软件工程师,专注于各种项目的开发工作。在写作...

    guavapdf-ch_GoogleGuava官方教程_

    Guava提供了许多字符串处理的辅助方法,如Joiner和Splitter,它们分别用于连接字符串和分割字符串。Strings类包含了一些实用的静态方法,如isNullOrEmpty、commonPrefix等,可以更方便地处理字符串。 **实用方法** ...

    guava-20.0-API文档-中文版.zip

    标签:google、guava、jar包、java、中文文档; 使用方法:解压翻译后的API文档,用浏览器打开“index.html”文件,即可纵览文档内容。 人性化翻译,文档中的代码和结构保持不变,注释和说明精准翻译,请放心使用。

    Getting Started with Google Guava code

    5. **字符串处理**:Guava 提供了各种字符串工具,如 Joiner、Splitter 和 CharMatcher,可以更方便地进行字符串操作。 6. **I/O 操作**:Guava 提供了 Files、ByteStreams 和 CharStreams 等类,使得文件读写和流...

    谷歌guava的jar包和源码,值得收藏

    Guava的核心API包含很多通用的实用工具,如Joiner、Splitter、Charsets、Cache等,这些工具覆盖了日常编程中的各种需求。 通过导入Guava的jar包和源码,开发者可以在Eclipse等IDE中直接查看和学习源代码,加深对...

    Google Guava 多版本集合

    Guava是一种基于开源的Java库,其中包含谷歌正在由他们很多项目使用的很多核心库。这个库是为了方便编码,并减少编码错误。这个库提供用于集合,缓存,支持原语,并发性,常见注解,字符串处理,I/O和验证的实用方法...

    Google Guava

    Google Guava库是由Google开发的一个开源项目,旨在提供Java开发中常用的基础功能。它的目标是简化Java编程,为开发者提供更加清晰、高效的代码编写方式。通过使用Guava库,开发者可以不必在每次项目中重复编写相同...

    google guava

    Google Guava是一个由Google开发并维护的开源Java库,它为Java开发者提供了许多实用的工具类和集合框架,极大地简化了常见的编程任务。这个框架包含了多个模块,如基础(base)、缓存(cache)、I/O(io)以及并发...

    Getting Started with Google Guava.pdf

    Google Guava 是一个由Google提供的开源Java库,它包含了许多强大的工具类和集合类,这些类可以帮助开发者更高效地编写Java代码。Guava的目标是提供一种更加简洁、优雅的方式来处理常见的编程任务,并且在很多情况下...

    google Guava集合工具类(超实用)

    Guava 是一个 Google 的基于java1.6的类库集合的扩展项目,包括 collections, caching, primitives support, concurrency libraries, common annotations, string processing, I/O, 等等. 这些高质量的 API 可以使你...

    Google Guava 官方教程 - v1.1.2018-07-22.pdf

    Google Guava 官方教程 v1.1 2018-07-22 https://github.com/tianbian224/GuavaLearning/blob/master/Google%20Guava%20%E5%AE%98%E6%96%B9%E6%95%99%E7%A8%8B%20-%20v1.1.pdf

    com.google.guava_1.6.0.jar.zip

    《深入解析Google Guava库:Ints模块》 在Java编程中,Google Guava库是一个不可或缺的工具集合,它提供了大量的高效、实用的类和方法,极大地提升了开发效率。本次我们将聚焦于Guava中的`Ints`模块,通过分析`...

    Google的Guava工具包

    Guava 是一个 Google 的基于java1.6的类库集合的扩展项目,包括 collections, caching, primitives support, concurrency libraries, common annotations, string processing, I/O, 等等. 这些高质量的 API 可以使你...

    google-guava.jar

    《谷歌Guava库详解》 谷歌Guava,全称为Google Guava,是Google推出的一款Java库,它包含一系列基础工具类,旨在简化Java开发工作,提高代码效率和可维护性。Guava的核心特性包括集合框架、缓存、原始类型支持、...

    Google Guava 官方教程 - v1.1.epub

    Google Guava 官方教程,电子书,epub格式,可用在手机端阅读

Global site tag (gtag.js) - Google Analytics