`
starbhhc
  • 浏览: 660599 次
  • 性别: Icon_minigender_2
  • 来自: 深圳
社区版块
存档分类
最新评论

JVM调优总结(三):高吞吐低延迟Java应用的垃圾回收优化

 
阅读更多

 

高性能应用构成了现代网络的支柱。LinkedIn有许多内部高吞吐量服务来满足每秒数千次的用户请求。要优化用户体验,低延迟地响应这些请求非常重要。

  比如说,用户经常用到的一个功能是了解动态信息——不断更新的专业活动和内容的列表。动态信息在LinkedIn随处可见,包括公司页面,学校页面以及最重要的主页。基础动态信息数据平台为我们的经济图谱(会员,公司,群组等等)中各种实体的更新建立索引,它必须高吞吐低延迟地实现相关的更新。

图1 LinkedIn 动态信息

 

  这些高吞吐低延迟的Java应用转变为产品,开发人员必须确保应用开发周期的每个阶段一致的性能。确定优化垃圾回收(Garbage Collection,GC)的设置对达到这些指标非常关键。

  本文章通过一系列步骤来明确需求并优化GC,目标读者是为实现应用的高吞吐低延迟,对使用系统方法优化GC感兴趣的开发人员。文章中的方法来自于LinkedIn构建下一代动态信息数据平台过程。这些方法包括但不局限于以下几点:并发标记清除(Concurrent Mark Sweep,CMS)和G1垃圾回收器的CPU和内存开销,避免长期存活对象引起的持续GC周期,优化GC线程任务分配使性能提升,以及GC停顿时间可预测所需的OS设置。

 

优化GC的正确时机?

 

  GC运行随着代码级的优化和工作负载而发生变化。因此在一个已实施性能优化的接近完成的代码库上调整GC非常重要。但是在端到端的基本原型上进行初步分析也很有必要,该原型系统使用存根代码并模拟了可代表产品环境的工作负载。这样可以捕捉该架构延迟和吞吐量的真实边界,进而决定是否纵向或横向扩展。

  在下一代动态信息数据平台的原型阶段,几乎实现了所有端到端的功能,并且模拟了当前产品基础架构所服务的查询负载。从中我们获得了多种用来衡量应用性能的工作负载特征和足够长时间运行情况下的GC特征。

 

优化GC的步骤

 

  下面是为满足高吞吐,低延迟需求优化GC的总体步骤。也包括在动态信息数据平台原型实施的具体细节。可以看到在ParNew/CMS有最好的性能,但我们也实验了G1垃圾回收器。

1. 理解GC基础知识

  理解GC工作机制非常重要,因为需要调整大量的参数。Oracle的Hotspot JVM 内存管理白皮书是开始学习Hotspot JVM GC算法非常好的资料。了解G1垃圾回收器,请查看该论文

2. 仔细考量GC需求

  为降低应用性能的GC开销,可以优化GC的一些特征。吞吐量、延迟等这些GC特征应该长时间测试运行观察,确保特征数据来自于应用程序的处理对象数量发生变化的多个GC周期。

  • Stop-the-world回收器回收垃圾时会暂停应用线程。停顿的时长和频率不应该对应用遵守SLA(Service Level Agreement,服务水平协议)产生不利的影响。
  • 并发GC算法与应用线程竞争CPU周期。这个开销不应该影响应用吞吐量。
  • 不压缩GC算法会引起堆碎片化,导致full GC长时间Stop-the-world停顿。
  • 垃圾回收工作需要占用内存。一些GC算法产生更高的内存占用。如果应用程序需要较大的堆空间,要确保GC的内存开销不能太大。
  • 清晰地了解GC日志和常用的JVM参数对简单调整GC运行很有必要。GC运行随着代码复杂度增长或者工作特性变化而改变。

  我们使用Linux OS的Hotspot Java7u51,32GB堆内存,6GB新生代(young generation)和-XX:CMSInitiatingOccupancyFraction值为70(老年代GC触发时其空间占用率)开始实验。设置较大的堆内存用来维持长期存活对象的对象缓存。一旦这个缓存被填充,提升到老年代的对象比例显著下降。

  使用初始的GC配置,每三秒发生一次80ms的新生代GC停顿,超过99.9%的应用延迟100ms。这样的GC很可能适合于SLA不太严格要求延迟的许多应用。然而,我们的目标是尽可能降低99.9%应用的延迟,为此GC优化是必不可少的。

3. 理解GC指标

  优化之前要先衡量。了解GC日志的详细细节(使用这些选项:-XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps -XX:+PrintTenuringDistribution -XX:+PrintGCApplicationStoppedTime)可以对该应用的GC特征有总体的把握。

  LinkedIn的内部监控和报表系统,inGraphsNaarad,生成了各种有用的指标可视化图形,比如GC停顿时间百分比,一次停顿最大持续时间,长时间内GC频率。除了Naarad,有很多开源工具比如gclogviewer可以从GC日志创建可视化图形。

  在这个阶段,需要确定GC频率和停顿时长是否影响应用满足延迟性需求的能力。

4. 降低GC频率

  在分代GC算法中,降低回收频率可以通过:(1) 降低对象分配/提升率;(2) 增加代空间的大小。

  在Hotspot JVM中,新生代GC停顿时间取决于一次垃圾回收后对象的数量,而不是新生代自身的大小。增加新生代大小对于应用性能的影响需要仔细评估:

  • 如果更多的数据存活而且被复制到survivor区域,或者每次垃圾回收更多的数据提升到老年代,增加新生代大小可能导致更长的新生代GC停顿。
  • 另一方面,如果每次垃圾回收后存活对象数量不会大幅增加,停顿时间可能不会延长。在这种情况下,减少GC频率可能使应用总体延迟降低和(或)吞吐量增加。

  对于大部分为短期存活对象的应用,仅仅需要控制前面所说的参数。对于创建长期存活对象的应用,就需要注意,被提升的对象可能很长时间都不能被老年代GC周期回收。如果老年代GC触发阈值(老年代空间占用率百分比)比较低,应用将陷入不断的GC周期。设置高的GC触发阈值可避免这一问题。

  由于我们的应用在堆中维持了长期存活对象的较大缓存,将老年代GC触发阈值设置为-XX:CMSInitiatingOccupancyFraction=92 -XX:+UseCMSInitiatingOccupancyOnly我们也试图增加新生代大小来减少新生代回收频率,但是并没有采用,因为这增加了应用延迟。

5. 缩短GC停顿时间

  减少新生代大小可以缩短新生代GC停顿时间,因为这样被复制到survivor区域或者被提升的数据更少。但是,正如前面提到的,我们要观察减少新生代大小和由此导致的GC频率增加对于整体应用吞吐量和延迟的影响。新生代GC停顿时间也依赖于tenuring threshold(提升阈值)和空间大小(见第6步)。

  使用CMS尝试最小化堆碎片和与之关联的老年代垃圾回收full GC停顿时间。通过控制对象提升比例和减小-XX:CMSInitiatingOccupancyFraction的值使老年代GC在低阈值时触发。所有选项的细节调整和他们相关的权衡,请查看Web Services的Java 垃圾回收Java 垃圾回收精粹

  我们观察到Eden区域的大部分新生代被回收,几乎没有对象在survivor区域死亡,所以我们将tenuring threshold从8降低到2(使用选项:-XX:MaxTenuringThreshold=2),为的是缩短新生代垃圾回收消耗在数据复制上的时间。

  我们也注意到新生代回收停顿时间随着老年代空间占用率上升而延长。这意味着来自老年代的压力使得对象提升花费更多的时间。为解决这个问题,将总的堆内存大小增加到40GB,减小-XX:CMSInitiatingOccupancyFraction的值到80,更快地开始老年代回收。尽管-XX:CMSInitiatingOccupancyFraction的值减小了,增大堆内存可以避免不断的老年代GC。在本阶段,我们获得了70ms新生代回收停顿和百分之99.9延迟80ms。

6. 优化GC工作线程的任务分配

  进一步缩短新生代停顿时间,我们决定研究优化与GC线程绑定任务的选项。

  -XX:ParGCCardsPerStrideChunk 选项控制GC工作线程的任务粒度,可以在不使用补丁的情况下帮助获得最佳性能,这个补丁用来优化新生代垃圾回收的卡表扫描时间有趣的是新生代GC时间随着老年代空间的增加而延长。将这个选项值设为32678,新生代回收停顿时间降低到平均50ms。此时百分之99.9应用延迟60ms。

  也有其他选项将任务映射到GC线程,如果OS允许的话,-XX:+BindGCTaskThreadsToCPUs选项绑定GC线程到个别的CPU核。-XX:+UseGCTaskAffinity使用affinity参数将任务分配给GC工作线程。然而,我们的应用并没有从这些选项发现任何益处。实际上,一些调查显示这些选项在Linux系统不起作用[1,2]。

7. 了解GC的CPU和内存开销

  并发GC通常会增加CPU的使用。我们观察了运行良好的CMS默认设置,并发GC和G1垃圾回收器共同工作引起的CPU使用增加显著降低了应用的吞吐量和延迟。与CMS相比,G1可能占用了应用更多的内存开销。对于低吞吐量的非计算密集型应用,GC的高CPU使用率可能不需要担心。


图2 ParNew/CMS和G1的CPU使用百分数%:相对来说CPU使用率变化明显的节点使用G1
选项-XX:G1RSetUpdatingPauseTimePercent=20


图3 ParNew/CMS和G1每秒服务的请求数:吞吐量较低的节点使用G1
选项-XX:G1RSetUpdatingPauseTimePercent=20

 

8. 为GC优化系统内存和I/O管理

 

  通常来说,GC停顿发生在:(1) 低用户时间,高系统时间和高时钟时间;(2) 低用户时间,低系统时间和高时钟时间。这意味着基础的进程/OS设置存在问题。情况(1)可能说明Linux从JVM偷页,情况(2)可能说明清除磁盘缓存时Linux启动GC线程,等待I/O时线程陷入内核。在这些情况下如何设置参数可以参考该PPT

  为避免运行时性能损失,启动应用时使用JVM选项-XX:+AlwaysPreTouch访问和清零页面。设置vm.swappiness为零,除非在绝对必要时,OS不会交换页面。

  可能你会使用mlock将JVM页pin在内存中,使OS不换出页面。但是,如果系统用尽了所有的内存和交换空间,OS通过kill进程来回收内存。通常情况下,Linux内核会选择高驻留内存占用但还没有长时间运行的进程(OOM情况下killing进程的工作流)。对我们而言,这个进程很有可能就是我们的应用程序。一个服务具备优雅降级(适度退化)的特点会更好,服务突然故障预示着不太好的可操作性——因此,我们没有使用mlock而是vm.swappiness避免可能的交换惩罚。

 

LinkedIn动态信息数据平台的GC优化

 

  对于该平台原型系统,我们使用Hotspot JVM的两个算法优化垃圾回收:

  • 新生代垃圾回收使用ParNew,老年代垃圾回收使用CMS。
  • 新生代和老年代使用G1。G1用来解决堆大小为6GB或者更大时存在的低于0.5秒稳定的、可预测停顿时间的问题。在我们用G1实验过程中,尽管调整了各种参数,但没有得到像ParNew/CMS一样的GC性能或停顿时间的可预测值。我们查询了使用G1发生内存泄漏相关的一个bug[3],但还不能确定根本原因。

  使用ParNew/CMS,我们看到应用在每三秒中有一次40-60ms的新生代停顿,在每小时中有一次的CMS周期。我们使用的JVM选项如下:

[plain] view plain copy
 
 在CODE上查看代码片派生到我的代码片
  1. // JVM sizing options  
  2. -server -Xms40g -Xmx40g -XX:MaxDirectMemorySize=4096m -XX:PermSize=256m -XX:MaxPermSize=256m    
  3. // Young generation options  
  4. -XX:NewSize=6g -XX:MaxNewSize=6g -XX:+UseParNewGC -XX:MaxTenuringThreshold=2 -XX:SurvivorRatio=8 -XX:+UnlockDiagnosticVMOptions -XX:ParGCCardsPerStrideChunk=32768  
  5. // Old generation  options  
  6. -XX:+UseConcMarkSweepGC -XX:CMSParallelRemarkEnabled -XX:+ParallelRefProcEnabled -XX:+CMSClassUnloadingEnabled  -XX:CMSInitiatingOccupancyFraction=80 -XX:+UseCMSInitiatingOccupancyOnly    
  7. // Other options  
  8. -XX:+AlwaysPreTouch -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps -XX:+PrintTenuringDistribution -XX:+PrintGCApplicationStoppedTime -XX:-OmitStackTraceInFastThrow  

使用这些选项,对于几千次读请求的吞吐量,应用99.9%的延迟降低到60ms。

 

 

 

 

分享到:
评论

相关推荐

    高吞吐低延迟Java应用的垃圾回收优化.zip

    本文将深入探讨如何对Java应用的垃圾回收进行优化,以实现高吞吐、低延迟的目标。 一、理解垃圾回收 1. 垃圾回收原理:垃圾回收器会识别并清理不再使用的对象,释放内存资源。主要目标是确保无内存泄漏,并避免...

    个人总结之—JVM性能调优实战

    本总结旨在分享作者在实践中不断探索与总结的经验,为读者提供一份全面而实用的JVM调优指南。 #### 关键知识点 ##### 1. JVM基础知识 - **JVM结构与工作原理**:了解JVM的基本组成及其工作流程对于进行有效的性能...

    第四讲-JVM调优原理深度剖析、服务线上优化实践.pdf

    JVM提供不同的垃圾回收器来实现这些算法,例如串行GC、并行GC、并发Mark Sweep(CMS)、G1和ZGC等,每种GC器都有其适用场景和优缺点,选择合适的垃圾回收器是JVM调优的重要部分。 线上服务的JVM调优实践通常会根据...

    JVM的调优机制 初始入门

    JVM调优是一个优化Java虚拟机性能的过程。调优的目标通常是减少应用程序的延迟,增加吞吐量,以及降低内存占用。入门JVM调优不需要高深的基础,但需要理解一些核心概念,如垃圾回收算法、内存管理、JVM参数等。 2. ...

    JVM体系结构与GC调优

    根据应用需求,比如低延迟或高吞吐,可以调整相关参数来优化性能。 例如,如果追求低延迟,可以选择G1 GC,它能够预测并控制GC暂停时间。而如果关注整体吞吐量,CMS或ZGC可能更合适,因为它们能够在大多数时间里...

    Java内存与垃圾回收调优.docx

    Java内存管理是Java开发中的核心话题,特别是对于大型和高性能应用而言,良好的内存管理和垃圾回收调优至关重要。本文将深入探讨Java内存结构、垃圾回收机制以及调优策略。 首先,Java内存主要分为堆内存和非堆内存...

    从常用的垃圾回收到JVM相关调优.pdf

    Java虚拟机(JVM)中的垃圾回收(GC)机制是管理内存的一...理解JVM内存布局和垃圾回收算法对于开发高性能的Java应用程序是十分重要的,通过调整和优化这些参数,可以提升应用的响应速度和吞吐量,减少内存溢出的风险。

    JVM之垃圾回收器

    总结来说,JVM的垃圾回收器选择和调优是一项复杂的工作,需要根据应用类型、内存大小、响应时间要求等因素综合考虑。理解各种GC的工作原理和特点,结合实际应用进行选择,是提升Java应用性能的关键步骤。在实践中,...

    java垃圾回收

    总的来说,Java垃圾回收是JVM中不可或缺的一部分,它帮助我们解决了内存管理的复杂性,但同时也需要我们根据应用的特性和需求进行适当的调优。深入理解垃圾回收的工作机制,能够帮助我们编写出更加高效、稳定的应用...

    高性能java系统实现与调优

    - **JVM调优**:合理设置堆大小、垃圾回收策略等,减少资源浪费。 - **数据库调优**:优化查询语句、索引设计等。 - **操作系统调优**:调整内核参数以适应不同的应用场景。 #### 架构设计原则 - **分而治之**:将...

    java内存参数调优技巧

    Java内存参数调优是优化Java应用程序性能的关键环节,特别是对于大型和高负载的应用,合理的内存配置可以有效地降低垃圾收集(Garbage Collection, GC)带来的压力,提高应用的响应速度和系统吞吐量。以下是一些关于...

    如何调优JVM - 优化Java虚拟机(大全+实例).pdf

    JVM调优涉及到堆内存设置、垃圾收集器选择等多个方面。以下是一些关键的知识点: 1. **堆内存设置**: - `-Xmx` 和 `-Xms` 参数分别用于设置JVM的最大堆内存和初始堆内存。例如,`-Xmx3550m` 和 `-Xms3550m` 表示...

    垃圾回收垃圾回收垃圾回收

    - **ZGC 和 Shenandoah**:这两款是新生代的低延迟垃圾回收器,它们的目标是在大内存应用中实现极低的暂停时间,适合实时性要求高的系统。 垃圾回收的参数调整是JVM调优的重要部分,包括设置堆大小、新生代与老年代...

    【译】Java 14 Hotspot 虚拟机垃圾回收调优指南(csdn)————程序.pdf

    Java 14 Hotspot 虚拟机的垃圾...选择合适的垃圾收集器取决于应用的特定需求,如是否需要低延迟、高吞吐量或是低内存占用。理解每种收集器的特性,并结合应用的实际情况进行调优,是优化Java应用程序性能的关键步骤。

    (主讲视频)JVM原理、内存模型、性能调优

    2. **选择合适的垃圾回收器**:如果应用对响应时间有较高要求,则可以选择低延迟的垃圾回收器,如G1。 3. **减少对象创建**:对于一些频繁创建和销毁的对象,考虑使用对象池技术来重用对象。 4. **优化代码逻辑**:...

    用于测试jvm gc调优-share-jvm-gc.zip

    在Java应用程序中,尤其是对于大型系统或高并发环境,进行JVM GC调优是提升性能、减少系统停顿时间的关键步骤。"用于测试jvm gc调优-share-jvm-gc.zip"这个压缩包文件很可能包含了一些工具、脚本或教程,用于帮助...

    30+个视频+深入理解Java虚拟机(jvm优化+内存模型+虚拟机原理)

    不同版本的JVM可能会采用不同的垃圾回收策略来平衡吞吐量和延迟时间。 ### JVM性能优化技巧 1. **选择合适的垃圾回收器**: 不同的应用场景适合不同的GC策略。例如,对于响应时间要求高的应用来说,可以考虑使用G1...

    深入java虚拟机

    - **Shenandoah**:另一种低延迟的垃圾回收器,能够在保持高吞吐量的同时降低停顿时间。 #### 八、参考资料 对于想要深入了解JVM调优的人来说,可以参考以下资料: - [《深入理解Java虚拟机》]...

    JVM参数优化及JVM解析.docx

    GC的主要目标是达到低延迟和高吞吐量。GC的触发条件通常包括堆内存满、方法区满或系统要求。垃圾回收的过程包括标记、清除、压缩等步骤,以确保内存的有效利用。 JVM参数的优化对于提升Java应用程序的性能至关重要...

    Java性能调优

    电信应用程序往往需要高吞吐量(例如,每秒处理的VoIP呼叫连接数)和低延迟(例如,快速的呼叫建立)。尽管Java语言因其结构化、强类型和面向对象等特点而广受欢迎,但其依赖于虚拟机执行字节码的特性以及内置的垃圾...

Global site tag (gtag.js) - Google Analytics