`

深入理解G1垃圾收集器

 
阅读更多

G1 GC是Jdk7的新特性之一、Jdk7+版本都可以自主配置G1作为JVM GC选项;作为JVM GC算法的一次重大升级、DK7u后G1已相对稳定、且未来计划替代CMS、所以有必要深入了解下:

不同于其他的分代回收算法、G1将堆空间划分成了互相独立的区块。每块区域既有可能属于O区、也有可能是Y区,且每类区域空间可以是不连续的(对比CMS的O区和Y区都必须是连续的)。这种将O区划分成多块的理念源于:当并发后台线程寻找可回收的对象时、有些区块包含可回收的对象要比其他区块多很多。虽然在清理这些区块时G1仍然需要暂停应用线程、但可以用相对较少的时间优先回收包含垃圾最多区块。这也是为什么G1命名为Garbage First的原因:第一时间处理垃圾最多的区块。

 

平时工作中大多数系统都使用CMS、即使静默升级到JDK7默认仍然采用CMS、那么G1相对于CMS的区别在:

  1. G1在压缩空间方面有优势
  2. G1通过将内存空间分成区域(Region)的方式避免内存碎片问题
  3. Eden, Survivor, Old区不再固定、在内存使用效率上来说更灵活
  4. G1可以通过设置预期停顿时间(Pause Time)来控制垃圾收集时间避免应用雪崩现象
  5. G1在回收内存后会马上同时做合并空闲内存的工作、而CMS默认是在STW(stop the world)的时候做
  6. G1会在Young GC中使用、而CMS只能在O区使用

就目前而言、CMS还是默认首选的GC策略、可能在以下场景下G1更适合:

  1. 服务端多核CPU、JVM内存占用较大的应用(至少大于4G)
  2. 应用在运行过程中会产生大量内存碎片、需要经常压缩空间
  3. 想要更可控、可预期的GC停顿周期;防止高并发下应用雪崩现象

一次完整G1GC的详细过程:

G1在运行过程中主要包含如下4种操作方式:

  1. YGC(不同于CMS)
  2. 并发阶段
  3. 混合模式
  4. full GC (一般是G1出现问题时发生)

YGC:

下面是一次YGC前后内存区域是示意图:

G1-1

G1-2

图中每个小区块都代表G1的一个区域(Region),区块里面的字母代表不同的分代内存空间类型(如[E]Eden,[O]Old,[S]Survivor)空白的区块不属于任何一个分区;G1可以在需要的时候任意指定这个区域属于Eden或是O区之类的。
G1 YoungGC在Eden充满时触发,在回收之后所有之前属于Eden的区块全变成空白。然后至少有一个区块是属于S区的(如图半满的那个区域),同时可能有一些数据移到了O区。

目前淘系的应用大都使用PrintGCDetails参数打出GC日志、这个参数对G1同样有效、但日志内容颇为不同;下面是一个Young GC的例子:

23.430: [GC pause (young), 0.23094400 secs]
...
[Eden: 1286M(1286M)->0B(1212M)
Survivors: 78M->152M Heap: 1454M(4096M)->242M(4096M)]
[Times: user=0.85 sys=0.05, real=0.23 secs]

上面日志的内容解析:Young GC实际占用230毫秒、其中GC线程占用850毫秒的CPU时间
E:内存占用从1286MB变成0、都被移出
S:从78M增长到了152M、说明从Eden移过来74M
Heap:占用从1454变成242M、说明这次Young GC一共释放了1212M内存空间
很多情况下,S区的对象会有部分晋升到Old区,另外如果S区已满、Eden存活的对象会直接晋升到Old区,这种情况下Old的空间就会涨

并发阶段:

一个并发G1回收周期前后内存占用情况如下图所示:

G1-3

G1-4

从上面的图表可以看出以下几点:
1、Young区发生了变化、这意味着在G1并发阶段内至少发生了一次YGC(这点和CMS就有区别),Eden在标记之前已经被完全清空,因为在并发阶段应用线程同时在工作、所以可以看到Eden又有新的占用
2、一些区域被X标记,这些区域属于O区,此时仍然有数据存放、不同之处在G1已标记出这些区域包含的垃圾最多、也就是回收收益最高的区域
3、在并发阶段完成之后实际上O区的容量变得更大了(O+X的方块)。这时因为这个过程中发生了YGC有新的对象进入所致。此外,这个阶段在O区没有回收任何对象:它的作用主要是标记出垃圾最多的区块出来。对象实际上是在后面的阶段真正开始被回收

G1并发标记周期可以分成几个阶段、其中有些需要暂停应用线程。第一个阶段是初始标记阶段。这个阶段会暂停所有应用线程-部分原因是这个过程会执行一次YGC、下面是一个日志示例:

50.541: [GC pause (young) (initial-mark), 0.27767100 secs]
[Eden: 1220M(1220M)->0B(1220M)
Survivors: 144M->144M Heap: 3242M(4096M)->2093M(4096M)]
[Times: user=1.02 sys=0.04, real=0.28 secs]

上面的日志表明发生了YGC、应用线程为此暂停了280毫秒,Eden区被清空(71MB从Young区移到了O区)。
日志里面initial-mark的字样表明后台的并发GC阶段开始了。因为初始标记阶段本身也是要暂停应用线程的,
G1正好在YGC的过程中把这个事情也一起干了。为此带来的额外开销不是很大、增加了20%的CPU,暂停时间相应的略微变长了些。

接下来,G1开始扫描根区域、日志示例:

50.819: [GC concurrent-root-region-scan-start]
51.408: [GC concurrent-root-region-scan-end, 0.5890230]

一共花了580毫秒,这个过程没有暂停应用线程;是后台线程并行处理的。这个阶段不能被YGC所打断、因此后台线程有足够的CPU时间很关键。如果Young区空间恰好在Root扫描的时候
满了、YGC必须等待root扫描之后才能进行。带来的影响是YGC暂停时间会相应的增加。这时的GC日志是这样的:

350.994: [GC pause (young)
351.093: [GC concurrent-root-region-scan-end, 0.6100090]
351.093: [GC concurrent-mark-start],0.37559600 secs]

GC暂停这里可以看出在root扫描结束之前就发生了,表明YGC发生了等待,等待时间大概是100毫秒。
在root扫描完成后,G1进入了一个并发标记阶段。这个阶段也是完全后台进行的;GC日志里面下面的信息代表这个阶段的开始和结束:

111.382: [GC concurrent-mark-start]
....
120.905: [GC concurrent-mark-end, 9.5225160 sec]

并发标记阶段是可以被打断的,比如这个过程中发生了YGC就会。这个阶段之后会有一个二次标记阶段和清理阶段:

120.910: [GC remark 120.959:
[GC ref-PRC, 0.0000890 secs], 0.0718990 secs]
[Times: user=0.23 sys=0.01, real=0.08 secs]
120.985: [GC cleanup 3510M->3434M(4096M), 0.0111040 secs]
[Times: user=0.04 sys=0.00, real=0.01 secs]

这两个阶段同样会暂停应用线程,但时间很短。接下来还有额外的一次并发清理阶段:

120.996: [GC concurrent-cleanup-start]
120.996: [GC concurrent-cleanup-end, 0.0004520]

到此为止,正常的一个G1周期已完成–这个周期主要做的是发现哪些区域包含可回收的垃圾最多(标记为X),实际空间释放较少。

混合GC:

接下来G1执行一系列的混合GC。这个时期因为会同时进行YGC和清理上面已标记为X的区域,所以称之为混合阶段,下面是一个混合GC执行的前后示意图:

G1-5

G1-6

像普通的YGC那样、G1完全清空掉Eden同时调整survivor区。另外,两个标记也被回收了,他们有个共同的特点是包含最多可回收的对象,因此这两个区域绝对部分空间都被释放了。这两个区域任何存活的对象都被移到了其他区域(和YGC存活对象晋升到O区类似)。这就是为什么G1的堆比CMS内存碎片要少很多的原因–移动这些对象的同时也就是在压缩对内存。下面是一个混合GC的日志:

79.826: [GC pause (mixed), 0.26161600 secs]
....
[Eden: 1222M(1222M)->0B(1220M)
Survivors: 142M->144M Heap: 3200M(4096M)->1964M(4096M)]
[Times: user=1.01 sys=0.00, real=0.26 secs]

上面的日志可以注意到Eden释放了1222MB、但整个堆的空间释放内存要大于这个数目。数量相差看起来比较少、只有16MB,但是要考虑同时有survivor区的对象晋升到O区;另外,每次混合GC只是清理一部分的O区内存,整个GC会一直持续到几乎所有的标记区域垃圾对象都被回收,这个阶段完了之后G1会重新回到正常的YGC阶段。周期性的,当O区内存占用达到一定数量之后G1又会开启一次新的并行GC阶段.

分享到:
评论

相关推荐

    深入理解G垃圾收集器.docx

    《深入理解G1垃圾收集器》 G1垃圾收集器是Java 7引入的一个重要特性,自那时起,它在JDK 7及更高版本中可用,并逐渐成为替代CMS垃圾收集器的优选方案。G1的主要创新在于其将堆空间划分为多个独立的区域(Region),...

    深入理解JVM&G1; GC

    《深入理解JVM & G1 GC》一书深入剖析了Java虚拟机(JVM)的工作原理,特别是针对垃圾收集器(GC)中的G1(Garbage-First)算法进行了详尽的探讨。JVM是Java程序运行的基础,它负责解析、编译、执行Java代码,并管理...

    Java垃圾收集器推荐.pdf

    G1垃圾收集器是专为大内存设计的垃圾收集器,它能够处理跨多个区域的垃圾收集,并且能够预测停顿时间。 针对特定应用程序的性能优化,开发者需要根据应用特性来选择合适的垃圾收集器,并结合JVM参数调整来实现。...

    Java的垃圾收集器(GC)

    总之,垃圾收集器是Java生态系统中不可或缺的一部分,深入理解和合理运用GC机制,对于构建高效、稳定的Java应用程序至关重要。随着Java技术的不断演进,GC也将持续优化,为开发者带来更加便捷的开发体验。

    性能工程师指南:玩转OpenJDK HotSpot垃圾收集器

    ### 性能工程师指南:玩转OpenJDK HotSpot垃圾收集器 #### 一、性能工程概述 在软件开发过程中,性能工程是一个重要的环节,它不仅涵盖了对软件性能的需求定义与测试计划制定,还包括了软件的开发、实施及后续的...

    深入理解JVM & G1 GC

    《深入理解JVM & G1 GC》这篇文章和相关压缩包文件主要聚焦于Java虚拟机(JVM)的内存管理,特别是垃圾收集器(GC)的优化,特别是G1(Garbage-First)垃圾收集器的深度解析。下面将详细阐述JVM、GC的基本概念,...

    JVM垃圾收集器全面详解

    了解这些垃圾收集器后,开发者可以根据应用需求选择合适的组合,如使用ParNew与CMS搭配,或者在需要低延迟时选用G1或ZGC。此外,调整JVM参数也是优化性能的关键,例如设置新生代与老年代的比例、设置并行线程数等。 ...

    GCViewer,Tagtraum Industries的GCviewer之叉。tagtraum在2008年停止了开发,我的目标是改进对sun/oracle的java 1.6+垃圾收集器日志(包括g1收集器)的支持。.zip

    通过深入理解GCViewer提供的信息,开发者可以调整JVM的内存配置、选择合适的垃圾收集器,或者优化代码,以提升应用的整体性能。对于大型Java项目,GC优化是提高系统稳定性和性能的关键环节。因此,GCViewer是每一个...

    Java垃圾收集器知识.pdf

    理解并熟练掌握Java垃圾收集器的工作原理和特性对于开发高性能、稳定的Java应用至关重要,尤其是在处理大量对象和大数据量的场景下。通过深入学习和实践,开发者可以更好地优化程序的内存使用,减少垃圾收集对应用...

    【深入Java虚拟机(8)】Java垃圾收集机制编程开发技

    - **G1(Garbage-First)GC**:新一代垃圾收集器,目标是减少垃圾收集的暂停时间,适用于大型应用。 5. **垃圾收集策略** - **Minor GC**:主要清理新生代。 - **Major GC/Full GC**:清理整个堆,包括新生代和...

    JVM&g1gc;带书签,完整版本

    带书签,完整版本"的学习资料提供了深入了解JVM内存管理和G1垃圾收集器的详细内容。通过对G1的理解和实践,开发者可以更好地优化Java应用的性能,降低垃圾收集对应用运行的影响,实现更高效的内存管理。这份资料不仅...

    理解JAVA虚拟机-内存管理、垃圾收集器.pptx

    在深入理解JVM内存管理和垃圾收集器之前,我们需要先了解JVM内存模型的基本结构。 内存模型主要包括以下几个部分: 1. **Java堆**:这是JVM管理的最大的内存区域,所有线程共享,主要用于存储类实例和数组。堆内存...

    JVM初探内存分配GC原理与垃圾收集器共16页.pdf.z

    深入理解JVM内存分配、垃圾收集(Garbage Collection, GC)原理以及垃圾收集器的工作方式对于优化程序性能至关重要。 首先,我们要了解JVM内存结构。在Java中,内存主要分为以下几个区域: 1. **堆内存(Heap)**...

    Java垃圾收集必备手册

    在实战中,调优可能涉及到调整新生代和老年代的堆内存大小,设置合理的垃圾收集器参数(如-XX:+UseG1GC启用G1垃圾收集器),以及根据应用程序的特性调整GC日志记录的级别。例如,对于响应时间要求高的系统,可以使用...

    垃圾回收器(csdn)————程序.pdf

    本文将深入探讨垃圾回收器的重要指标、发展历程以及各种经典的垃圾收集器。 首先,垃圾回收器有两个核心指标:吞吐量和暂停时间。吞吐量是指应用程序运行时间与总运行时间的比例,其中总运行时间包括垃圾收集时间。...

    自己的系统的gc参数学习

    本教程将深入探讨GC参数的学习,特别是针对G1垃圾收集器的系统配置。 一、垃圾收集器概述 Java虚拟机(JVM)中的垃圾收集器是内存管理的关键组成部分,它自动识别并清理不再被程序引用的对象。不同的JVM版本提供了...

    Java垃圾收集必备手册.rar

    4. G1(Garbage-First):新一代垃圾收集器,目标是达到可预测的暂停时间模型。 五、垃圾收集的性能指标 1. 吞吐量:程序运行时间与总运行时间的比例,高吞吐量意味着程序运行更高效。 2. 延迟时间:垃圾收集导致的...

    深入理解Java虚拟机JVM高级特性与最佳实践1

    随着JDK 1.7的推出,JVM迎来了许多新特性,如G1垃圾收集器和InvokeDynamic指令。新版书籍对此进行了更新,增加了对这些特性的介绍,并加强了对OpenJDK源码分析的讲解,让读者有机会深入源码层面理解JVM的实现细节。 ...

    圣思园张龙 深入理解jvm

    当一个对象不再被任何变量引用时,该对象就会被视为垃圾,随后会被垃圾收集器回收。常见的垃圾收集算法包括标记-清除算法、复制算法、标记-整理算法等。 #### 3.2 垃圾收集器种类 - **Serial收集器**:单线程收集器...

    【Java技术资料】-Java垃圾收集必备手册

    4. **垃圾收集器**:Java提供了多种垃圾收集器,如Serial、Parallel、CMS(Concurrent Mark Sweep)、G1(Garbage-First)和ZGC(Z Garbage Collector)。每种收集器有其特点和适用场景,理解它们的工作原理有助于...

Global site tag (gtag.js) - Google Analytics