Guava Splitter vs StringUtils
最近写了关于apache commons的StringUtils提供的常用功能介绍,见链接(http://vipcowrie.iteye.com/blog/1513017),但是我们知道google的guava也提供了一些字符串处理的常见功能,所以,我在本文将对两者的字符串分割函数做一次比较详细的对比(结果比较surprise)。
区别
首先看基本的使用方法:
- // Apache StringUtils...
- String[] tokens1= StringUtils.split("one,two,three",',');
- // Google Guava splitter...
- Iteratable<String> tokens2 = Splitter.on(','),split("one,two,three");
// Apache StringUtils... String[] tokens1= StringUtils.split("one,two,three",','); // Google Guava splitter... Iteratable<String> tokens2 = Splitter.on(','),split("one,two,three");
很明显,google提供的方法更加的面向对象一点,因为它要先创建一个Splitter对象,然后使用它来分割字符串,而apache的方法则有点函数式编程的味道,它的方法都是静态的。
这里我更加倾向于采用google的splitter,因为这个对象是可以重用的,且可以在其上附加更多的功能,比如trim,去掉空的元素等,一切都很简单。
- Splitter niceCommaSplitter = Splitter.on(',') .omitEmptyString().trimResults();
- niceCommaSplitter.split("one,, two, three"); //"one","two","three"
- niceCommaSplitter.split(" four , five "); //"four","five"
Splitter niceCommaSplitter = Splitter.on(',') .omitEmptyString().trimResults(); niceCommaSplitter.split("one,, two, three"); //"one","two","three" niceCommaSplitter.split(" four , five "); //"four","five"
看起来有点用,还有其他区别么?
另外一个需要注意的地方就是Splitter返回的是Iteratable<String>,而StringUtils.split返回的是一个String数组。
大部分使用分隔符的情况是我们需要对字符串按照分隔符进行遍历处理,仅此而已。
下面就是常用的代码性能对比的例子:
- final String numberList = "One,Two,Three,Four,Five,Six,Seven,Eight,Nine,Ten";
- long start = System.currentTimeMillis();
- for(int i=0; i<1000000; i++) {
- StringUtils.split(numberList , ',');
- }
- System.out.println(System.currentTimeMillis() - start);
- start = System.currentTimeMillis();
- for(int i=0; i<1000000; i++) {
- Splitter.on(',').split(numberList );
- }
- System.out.println(System.currentTimeMillis() - start);
final String numberList = "One,Two,Three,Four,Five,Six,Seven,Eight,Nine,Ten"; long start = System.currentTimeMillis(); for(int i=0; i<1000000; i++) { StringUtils.split(numberList , ','); } System.out.println(System.currentTimeMillis() - start); start = System.currentTimeMillis(); for(int i=0; i<1000000; i++) { Splitter.on(',').split(numberList ); } System.out.println(System.currentTimeMillis() - start);
代码很简单,就是都对同一个字符串进行100万次的分隔操作,看看时间上的区别,结果如下:
- 983
- 165
983 165
很明显,guava的速度快很多,这个程序如果运行在每天处理大量字符串的服务中,那么性能差异更加明显。我想其中的原因是Splitter返回的是Iterable<String>,而StringUtils.split返回的是一个String[],需要创建新的String对象,导致耗时增加。
如果我们对Splitter对象缓存,那么速度提高更多:
- start = System.currentTimeMillis();
- Splitter s = Splitter.on(',');
- for (int i = 0; i < 1000000; i++) {
- s.split(numberList);
- }
- System.out.println(System.currentTimeMillis() - start);
start = System.currentTimeMillis(); Splitter s = Splitter.on(','); for (int i = 0; i < 1000000; i++) { s.split(numberList); } System.out.println(System.currentTimeMillis() - start);
结果为12,神奇吧,呵呵
别急,结果还没有出来,目前我们还没有对结果进行处理。我们试试对上面的结果进行处理:
- final String numberList = "One,Two,Three,Four,Five,Six,Seven,Eight,Nine,Ten";
- long start = System.currentTimeMillis();
- for (int i = 0; i < 1000000; i++) {
- final String[] numbers = StringUtils.split(numberList, ',');
- for (String number : numbers) {
- number.length();
- }
- }
- System.out.println(System.currentTimeMillis() - start);
- start = System.currentTimeMillis();
- for (int i = 0; i < 1000000; i++) {
- Iterable<String> is = Splitter.on(',').split(numberList);
- for(String s:is) {
- s.length();
- }
- }
- System.out.println(System.currentTimeMillis() - start);
- start = System.currentTimeMillis();
- Splitter sp = Splitter.on(',');
- for (int i = 0; i < 1000000; i++) {
- Iterable<String> is = sp.split(numberList);
- for(String s:is) {
- s.length();
- }
- }
- System.out.println(System.currentTimeMillis() - start);
final String numberList = "One,Two,Three,Four,Five,Six,Seven,Eight,Nine,Ten"; long start = System.currentTimeMillis(); for (int i = 0; i < 1000000; i++) { final String[] numbers = StringUtils.split(numberList, ','); for (String number : numbers) { number.length(); } } System.out.println(System.currentTimeMillis() - start); start = System.currentTimeMillis(); for (int i = 0; i < 1000000; i++) { Iterable<String> is = Splitter.on(',').split(numberList); for(String s:is) { s.length(); } } System.out.println(System.currentTimeMillis() - start); start = System.currentTimeMillis(); Splitter sp = Splitter.on(','); for (int i = 0; i < 1000000; i++) { Iterable<String> is = sp.split(numberList); for(String s:is) { s.length(); } } System.out.println(System.currentTimeMillis() - start);
结果再次令人惊奇:
- 851
- 2967
- 2514
851 2967 2514
guava比apache 的StringUtils慢3倍。
结论:
很明显,guava把处理时间较长的操作延迟到后面了,前期处理比较快。无论如何,我还是比较倾向于采用guava处理常见的字符串分隔任务,如果你要处理大量分隔后的字符串,且对性能比较关注,那可以使用StringUtils.split。
相关推荐
下面的示例展示了与 Apache Commons `StringUtils` 在性能上的对比: ```java public void testPerformance() { final String numberList = "One,Two,Three,Four,Five,Six,Seven,Eight,Nine,Ten"; long start = ...
对于更复杂的解析任务,可以使用正则表达式或者第三方库,如Guava的`Lists`和`Splitter`类。 这些知识点在日常的Java Web开发中非常常见,掌握它们有助于提高开发效率和代码质量。在实际应用中,可以根据具体需求...
4. **第三方库**: 如Apache Commons Lang提供了一系列高级的字符串处理函数,如`StringUtils`类,包含了许多实用的方法。Guava库也有强大的字符串处理工具,如`Joiner`和`Splitter`,可以方便地拼接和分割字符串。 ...
嵌入式八股文面试题库资料知识宝典-华为的面试试题.zip
训练导控系统设计.pdf
嵌入式八股文面试题库资料知识宝典-网络编程.zip
人脸转正GAN模型的高效压缩.pdf
少儿编程scratch项目源代码文件案例素材-几何冲刺 转瞬即逝.zip
少儿编程scratch项目源代码文件案例素材-鸡蛋.zip
嵌入式系统_USB设备枚举与HID通信_CH559单片机USB主机键盘鼠标复合设备控制_基于CH559单片机的USB主机模式设备枚举与键盘鼠标数据收发系统支持复合设备识别与HID
嵌入式八股文面试题库资料知识宝典-linux常见面试题.zip
面向智慧工地的压力机在线数据的预警应用开发.pdf
基于Unity3D的鱼类运动行为可视化研究.pdf
少儿编程scratch项目源代码文件案例素材-霍格沃茨魔法学校.zip
少儿编程scratch项目源代码文件案例素材-金币冲刺.zip
内容概要:本文深入探讨了HarmonyOS编译构建子系统的作用及其技术细节。作为鸿蒙操作系统背后的关键技术之一,编译构建子系统通过GN和Ninja工具实现了高效的源代码到机器代码的转换,确保了系统的稳定性和性能优化。该系统不仅支持多系统版本构建、芯片厂商定制,还具备强大的调试与维护能力。其高效编译速度、灵活性和可扩展性使其在华为设备和其他智能终端中发挥了重要作用。文章还比较了HarmonyOS编译构建子系统与安卓和iOS编译系统的异同,并展望了其未来的发展趋势和技术演进方向。; 适合人群:对操作系统底层技术感兴趣的开发者、工程师和技术爱好者。; 使用场景及目标:①了解HarmonyOS编译构建子系统的基本概念和工作原理;②掌握其在不同设备上的应用和优化策略;③对比HarmonyOS与安卓、iOS编译系统的差异;④探索其未来发展方向和技术演进路径。; 其他说明:本文详细介绍了HarmonyOS编译构建子系统的架构设计、核心功能和实际应用案例,强调了其在万物互联时代的重要性和潜力。阅读时建议重点关注编译构建子系统的独特优势及其对鸿蒙生态系统的深远影响。
嵌入式八股文面试题库资料知识宝典-奇虎360 2015校园招聘C++研发工程师笔试题.zip
嵌入式八股文面试题库资料知识宝典-腾讯2014校园招聘C语言笔试题(附答案).zip
双种群变异策略改进RWCE算法优化换热网络.pdf
内容概要:本文详细介绍了基于瞬时无功功率理论的三电平有源电力滤波器(APF)仿真研究。主要内容涵盖并联型APF的工作原理、三相三电平NPC结构、谐波检测方法(ipiq)、双闭环控制策略(电压外环+电流内环PI控制)以及SVPWM矢量调制技术。仿真结果显示,在APF投入前后,电网电流THD从21.9%降至3.77%,显著提高了电能质量。 适用人群:从事电力系统研究、电力电子技术开发的专业人士,尤其是对有源电力滤波器及其仿真感兴趣的工程师和技术人员。 使用场景及目标:适用于需要解决电力系统中谐波污染和无功补偿问题的研究项目。目标是通过仿真验证APF的有效性和可行性,优化电力系统的电能质量。 其他说明:文中提到的仿真模型涉及多个关键模块,如三相交流电压模块、非线性负载、信号采集模块、LC滤波器模块等,这些模块的设计和协同工作对于实现良好的谐波抑制和无功补偿至关重要。