`
dawnzhang
  • 浏览: 44603 次
  • 性别: Icon_minigender_1
社区版块
存档分类
最新评论

Java 性能优化

    博客分类:
  • Java
阅读更多
我一直觉得性能优化是出力不讨好的事情,因为花费了大量的精力,经常收获甚微。不过还是工作还是要做的,就稍微总结一些。

个人性能优化不要经常做,除非觉得系统存在相当严重的性能问题,因为优化通常意味着要改动,在系统没有足够多的test case和auto test保证下,后果通常是很恐怖的。现在的硬件已经相当廉价,如果可以,选择增加适当的硬件投入是一个不错的选择。

系统是否存在严重的性能问题,光靠感觉是不够的,给老板的report如果没有几组量化的数据,是很难不被骂的。现在的性能测试工具还是蛮多的,比较好用的包括load runner和jmeter。前者可以自动录制测试脚本,后者通过第三方工具也可以录制自动测试脚本。通常测试工具都有格式良好的report输出,在web应用中有几个指标需要我们给予更多关注:a. Average Hits per Second,b. 90 Percent transaction response time,c. Average Throughput (bytes/second)。需要注意的是,指标a和指标b是有一些相互约束关系的,很难做到系统有很高的并发请求量,同时请求的响应时间又很小,就好象很难让“马儿跑得快”又让“马儿不吃草”,我们需要在二者之间找到平衡点。当然,不同工具的指标名称可以不同,但这三个指标通常都会有对应的数据。一个性能测试报告,是在一定的前提下,比如怎样的硬件设置,怎样的网络环境,怎样的请求数据,怎样的并发模拟,以及多少的并发量等,不同的测试环境所得到的数据可能相差甚远。

如果系统确实存在性能问题,比如经常宕机,或者响应时间很慢,处理的并发量很小,就不得不进入性能优化阶段。性能优化包括几个环节:运行环境参数调优,数据库调优,应用调优等。

       Jvm中提供了丰富的参数供我们设置,合理的设置这些参数,可以有效的提高系统的性能。在列出这些参数之前,先大致介绍一些jvm的heap结构。Jvm的heap包括三部分,其中permanent generation, new generation以及tenured(old) generation。其中permanent generation是jvm自用的区域,用于存放反射代理和class,所以如果应用的class相当多时,就可以考虑将这一块区域放大一些。New generation和tenured generation是java应用的heap区,其中new generation有分为eden space, from space和to space,eden space用于存放新创建的对象(eden是上帝创造人时设立的,呵呵),from & to space都是survivor space。当jvm minor gc时,会将eden space的数据copy到survivor甚至tenured generation,所以每一次minor gc时,eden space区域都会被清空。Tenured generation用于存放长寿的对象,当其空间不够用时,会促使jvm major gc,major gc通常是很耗时的。合理的设置各个区的大小,可以快速的mimor gc,避免频繁的major gc。To summarize, you want to maximize quick minor collections and minimize major collections。常用的参数包括:

-Xmx 设置Java heap size最大值,注意这里的heap size = new generation + tenured generation,是不包括permanent generation的

-Xms 设置Java heap size 初始值

-XX:NewRatio new/old generation sizes的比率

-XX:NewSize new generation heap size

-XX:MaxNewSize 可以通过NewRatio和-Xmx计算得到

-XX:SurvivorRatio eden/survivor space size比率

-XX:PermSize permanent generation初始值

-XX:MaxPermSize Permanent Generation最大值

这些值得设置可以通过经验获得,也可以通常Jvm log分析得到。Jvm的一些参数可以输出有效的log文件:

-verbose:gc – 输出一些gc信息

-XX:+PrintGCDetails – 输出gc详细信息

-XX:+PrintGCTimeStamps – 包含时间戳信息

-XX:+PrintHeapAtGC – 包括gc前后heap状况

-XX:+PrintTenuringDistribution – 输出对象年龄或者tenured generation其他信息

-XX:+PrintHeapUsageOverTime - Print heap usage and capacity with timestamps

-Xloggc:filename – 输出gc信息到日志文件

通常在jvm中加入下面的设置,足以满足大多数要求:set JAVA_OPTS=%JAVA_OPTS% -verbose:gc -Xloggc:gc.log -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintHeapAtGC。不过拿到日志,对着一大堆的数字,也是天书一本,很难直接得到有效的信息。Jdk 1.6.0的gc log输出如下:

{Heap before GC invocations=0 (full 0):

def new generation   total 254464K, used 213053K [0x10030000, 0x20030000, 0x20030000)

  eden space 246784K,  86% used [0x10030000, 0x1d03f7d8, 0x1f130000)

  from space 7680K,   0% used [0x1f130000, 0x1f130000, 0x1f8b0000)

  to   space 7680K,   0% used [0x1f8b0000, 0x1f8b0000, 0x20030000)

tenured generation   total 262144K, used 0K [0x20030000, 0x30030000, 0x30030000)

   the space 262144K,   0% used [0x20030000, 0x20030000, 0x20030200, 0x30030000)

compacting perm gen  total 16384K, used 16383K [0x30030000, 0x31030000, 0x34030000)

   the space 16384K,  99% used [0x30030000, 0x3102ff38, 0x31030000, 0x31030000)

No shared spaces configured.

12.928: [Full GC 12.928: [Tenured: 0K->6352K(262144K), 0.1784526 secs] 213053K->6352K(516608K), [Perm : 16383K->16383K(16384K)], 0.1785568 secs]

Heap after GC invocations=1 (full 1):

def new generation   total 254464K, used 0K [0x10030000, 0x20030000, 0x20030000)

  eden space 246784K,   0% used [0x10030000, 0x10030000, 0x1f130000)

  from space 7680K,   0% used [0x1f130000, 0x1f130000, 0x1f8b0000)

  to   space 7680K,   0% used [0x1f8b0000, 0x1f8b0000, 0x20030000)

tenured generation   total 262144K, used 6352K [0x20030000, 0x30030000, 0x30030000)

   the space 262144K,   2% used [0x20030000, 0x20664290, 0x20664400, 0x30030000)

compacting perm gen  total 16384K, used 16383K [0x30030000, 0x31030000, 0x34030000)

   the space 16384K,  99% used [0x30030000, 0x3102ff38, 0x31030000, 0x31030000)

No shared spaces configured.

}

不过通过格式分析,可以写成java程序来处理这些日志,生成有用的report。我喜欢的report是chart,所以我把这个日志文件转换成图表方式,可以清晰的看到jvm heap size发生的变化,以及gc的频率,和full gc的时间。通过分析heap size的使用,可以设置合理的jvm运行参数。

在java应用中,虽然不太容易出现内存泄漏的问题,因为jvm会不定期的进行gc。但是因为程序的不合理写法,也会导致一些数据不能被收集。典型的状况是在hashmap中放置大量不用的数据,而没有及时的清理。在web应用中,很多人喜欢在session放放置状态数据,而没有清理,也是内存泄漏的一个原因。在session中存放数据还好,因为session终究会有过期时间,但是如果在class的static变量中放置数据,那就怎么样也没办法了。诊断应用中是否存在内存泄漏也有一些方法,通过分析jvm gc log就是一个直观的方式。通过分析gc after heap的变化趋势,如果gc after heap稳步上升,及时full(major) gc后,仍然不能降下来,通常就意味着存在内存泄漏了。当然也有情况是,的确有一些数据是application scope的,但是要确认除了这些数据,是否还存在一些unexpected数据一直占据内存。可以通过Jprofile的memory views来观察class的对象数,在一段请求过后,如果还存在一些class的instance数目相当多,就可以判断这个class可能会是问题的根源。

在o/r mapping盛行的今天,数据库已经和我们渐行渐远,我们不用建数据库和表结构,不用写sql查询,一切都是对象操作,除非存在性能问题,否则没有人会乐意关注一些数据库。但是不可否认的是,今天的java应用,大多数依然是数据集中式的,需要和数据库频繁的交互,而且数据库也很容易成为性能的瓶颈。数据库的调优包括三部分:数据库参数的设置,表结构以及sql代码优化。

大多数数据库的参数都相当多,调优所需要的知识很复杂,这也是现在professional的dba特别贵的原因,这一块俺也没有什么经验可分享。

至于表结构,因为现在o/r mapping工具已经包揽了这项工作,所以已经转为对象结构的优化了。我的理解是可以适当的非规范化对象结构,包括允许一些冗余属性,同时减少一些双向关联,过往的经验告诉我,双向关联通常都是性能的杀手。有一块需要做的是索引,合理的索引可以成倍的提高数据库性能。不过这一块做起来,通常要考虑应用中出现的sql。Index是一把双刃剑,很多时候可以提高查询的速度,但同样其存在维护成本,导致update性能下降。而且是否用得上index,还要看查询返回的结果集,如果查询的结果集很多,此时使用index,反而性能会下降,因为需要进行两次访问,还不如直接table scan来的快。

在sql调优时,可以先挑出性能很差的同时又频繁执行的sql,可以通过Jprofile的CPU Views过滤出Jdbc calls。这些sql可以拿到相应的数据库工具中调优,数据库引擎通常会根据数据库的一些metadata和statistics,生成一个execution plan,通过这个execution plan,可以找到优化的途径。通常的思路是,表访问策略(index scan, table scan),表连接策略(sort merge join, nested loop join, hash join),表顺序(驱动表的选择),是否充分并行等。通过调整sql的写法,会使dbms使用不同的执行计划。当然要得到有效的执行计划,需要时常更新数据库的statistics,很多是否发现index没用上,后来发现原来是这个原因。此外,sql语句还有一些其他好的习惯,简单列出一些:

避免where子句中出现or,事实证明or的性能通常不如in;

避免like子句,尤其是通配符%在前面;

避免where子句中在indexed column中加函数,尽量将函数转移到的比较运算符右边去,否则没办法使用到索引;

where中column出现的顺序和index的顺序一致;

避免使用select *,不要偷懒,还是自己写要取那些列,即使是获得所有的列;

一句性能优良的sql,是不太容易写出的,其实这也是大量o/r mapping tools出现的一个原因,想让o/r mapping生成一个很好的sql不容易,不过想让其生成一个很烂的sql也同样式不容易的,毕竟综合了很多人的经验在其中。

应用的调优,需要具体情况具体分析,通常code review是一个很好的时机,分析具体代码是否存在性能缺陷。此外,通过Jprofile观察,其CPU Views列出了所有method的执行时间,可以找到其中的性能缺陷,重点分析。这种调整通常涉及到算法的优化和结构的调整,不过俺也没有具体的经验总结可以提供。


Trackback: http://tb.donews.net/TrackBack.aspx?PostId=1250928

分享到:
评论

相关推荐

    4本高清中文版Java性能优化经典书籍

    Java性能优化是IT行业中至关重要的一个领域,尤其是在大型企业级应用和互联网服务中,高效的Java代码能够显著提升系统运行效率,降低服务器资源消耗。以下是对这四本经典书籍中的核心知识点的详细介绍: 1. **...

    java性能优化教程

    Java性能优化是提升软件效率和用户体验的关键环节,尤其是在大规模应用和高并发场景中。本教程将深入探讨如何通过各种技术和策略来优化Java程序,确保其高效运行。 首先,理解Java性能的基础是JVM(Java虚拟机)。...

    大话JAVA性能优化

    《大话JAVA性能优化》这份文档深入探讨了Java程序在多个层面的性能调优策略,旨在帮助开发者提高程序运行效率,降低资源消耗,提升用户体验。以下是对这些知识点的详细阐述: 1. **代码层次优化**:在代码编写阶段...

    Java性能优化实战视频全集

    ### Java性能优化实战知识点概述 #### 一、理论分析篇 **1.1 性能优化的衡量指标及注意事项** - **衡量指标**: 包括响应时间、吞吐量、资源利用率等。 - **注意事项**: 在进行性能优化时,需确保优化方案不会引入...

    Java 性能优化实战 21 讲2021年

    │ 开篇词 Java 性能优化,是进阶高级架构师的炼金石.mp4 │ 02 理论分析:性能优化有章可循,谈谈常用的切入点.mp4 │ 03 深入剖析:哪些资源,容易成为瓶颈?.mp4 │ 04 工具实践:如何获取代码性能数据?....

    大话java性能优化 周明耀 完整版

    《大话java性能优化》是周明耀先生的一本深入探讨Java性能调优的专业书籍,其主要内容涵盖了Java程序设计中的各种性能优化策略和技术。这本书旨在帮助开发者理解和掌握如何提升Java应用的运行效率,减少资源消耗,...

    Java 性能优化 一书源码

    Java性能优化是软件开发中的一个关键领域,尤其是在大型企业级应用和高并发系统中。《Java性能优化》一书深入探讨了如何通过各种技术提升Java应用程序的效率和响应速度。以下是一些基于书籍源码和相关文件名的关键...

    java性能优化java性能优化

    Java性能优化是提升Java应用程序效率的关键技术,涵盖了内存管理、代码优化、I/O处理等多个方面。以下是一些关键的性能优化策略: 1. **对象创建与克隆**:使用`new`关键字创建对象时,会调用构造函数链,这可能...

    Java 性能优化实战 21 讲

    在Java性能优化实战的21讲中,涵盖了Java开发中至关重要的性能调优技术,旨在提升应用程序的效率、稳定性和可扩展性。以下是对这些关键知识点的详细解析: 1. **JVM内存模型**:理解Java虚拟机(JVM)的内存结构是...

    大话Java性能优化.epub

    大话java性能优化,pdf版!

    Java性能优化的45个细节.pdf

    根据提供的文件信息,以下是关于Java性能优化的详细知识点,内容包括单例模式的合理应用、静态变量的使用考量、对象创建与垃圾回收策略、final修饰符与内联优化、局部变量与实例变量的性能差异、包装类型与基本类型...

    10种java性能优化方案.docx

    ### Java性能优化方案详解 #### 一、理解性能优化的重要性 在现代软件开发中,特别是在Java领域,性能优化是一项至关重要的任务。随着系统的复杂性和规模不断增长,优化不仅仅是提高用户体验那么简单,更是确保...

    大话JAVA性能优化.pdf

    大话Java性能优化》主要提供Java性能调优方面的参考建议及经验交流。作者力求做到知识的综合传播,而不是仅仅只针对Java虚拟机调优进行讲解,另外力求每一章节都有实际的案例支撑。具体包括:性能优化策略、程序编写...

    Java性能优化技巧集锦

    Java性能优化是提升软件效率和用户体验的关键步骤,涵盖了多种技术和策略。本文将深入探讨Java通用篇、J2EE篇、GUI篇、EJB篇以及缓存优化等方面的知识点,旨在帮助开发者实现更高效的代码。 一、Java通用篇 在Java...

Global site tag (gtag.js) - Google Analytics