`

垃圾回收算法和垃圾回收器

 
阅读更多

一、如何回收?

1.1 垃圾收集算法:

(1)标记-清除(Mark-Sweep)算法

这是最基础的算法,就像它名字一样,算法分为“标记”和“清除”两个阶段:首先标记处所有需要回收的对象(如哪些内存需要回收所描述的对象),对标记完成后统一回收所有被标记的对象,如下图所示:

 

缺点:一个是效率问题,标记和清除两个过程的效率都不高;另一个是空间问题,标记清除后悔产生大量的不连续的内存碎片,可能会导致后续无法分配大对象而导致再一次触发垃圾收集动作。

(2)复制算法

为了针对标记-清除算法的不足,复制算法将可用内存容量划分为大小相等的两块,每次只使用一块。当一块的内存用完了,就将还存活的对象复制到另一块上面去。然后把已使用过的内存空间一次清理掉,如下图所示:

 

缺点:使用内存比原来缩小了一半。

现在的商业虚拟机都采用这种收集算法来回收新生代,有企业分析的得出其实并不需求将内存按1:1的比例划分,因为新生代中的对象大部分都是“朝生夕死”的。所以,HotSpot虚拟机默认的Eden和Survivor的大小比例是8:1。一块Eden和两块Survivor,每次使用一块Eden和一块Survivor,也就是说只有10%是浪费的。如果另一块Survivor都无法存放上次垃圾回收的对象时,那这些对象将通过“担保机制”进入老年代了。

(3)标记-整理(Mark-Compact)算法

复制算法一般是对对象存活率较低的一种回收操作,但对于对象存活率较高的内存区域(老年代)来说,效果就不是那么理想了,标记-整理算法因此诞生了。标记-整理算法和标记-清除算法差不多,都是一开始对回收对象进行标记,但后续不是直接对对象清理,而是让所有存活的对象都向一端移动,然后直接清理掉端边界以外的内存,如下图所示:

 

(4)分代收集算法

分代收集算法是目前大部分JVM的垃圾收集器采用的算法。它的核心思想是根据对象存活的生命周期将内存划分为若干个不同的区域。一般情况下将堆区划分为老年代(Tenured Generation)和新生代(Young Generation),老年代的特点是每次垃圾收集时只有少量对象需要被回收,而新生代的特点是每次垃圾回收时都有大量的对象需要被回收,那么就可以根据不同代的特点采取最适合的收集算法。

1.2 垃圾收集器:

(1)七种垃圾收集器:

  1. Serial(串行GC)-复制
  2. ParNew(并行GC)-复制
  3. Parallel Scavenge(并行回收GC)-复制
  4. Serial Old(MSC)(串行GC)-标记-整理
  5. CMS(并发GC)-标记-清除
  6. Parallel Old(并行GC)--标记-整理
  7. G1(JDK1.7update14才可以正式商用)

说明:

  1. 1~3用于年轻代垃圾回收:年轻代的垃圾回收称为minor GC
  2. 4~6用于年老代垃圾回收(当然也可以用于方法区的回收):年老代的垃圾回收称为full GC
  3. G1独立完成"分代垃圾回收"
  4. ParNew Parallel Scavenge两者都是复制算法,都是并行处理,但是不同的是,paralel scavenge 可以设置最大gc停顿时间(-XX:MaxGCPauseMills)以及gc时间占比(-XX:GCTimeRatio)

注意:并行与并发

  1. 并行:多条垃圾回收线程同时操作
  2. 并发:垃圾回收线程与用户线程一起操作

(2)常用五种组合:

  1. Serial/Serial Old
  2. ParNew/Serial Old:与上边相比,只是比年轻代多了多线程垃圾回收而已
  3. ParNew/CMS:当下比较高效的组合
  4. Parallel Scavenge/Parallel Old:自动管理的组合
  5. G1:最先进的收集器,但是需要JDK1.7update14以上

(2.1)Serial/Serial Old:

 

特点:

  • 年轻代Serial收集器采用单个GC线程实现"复制"算法(包括扫描、复制)
  • 年老代Serial Old收集器采用单个GC线程实现"标记-整理"算法
  • Serial与Serial Old都会暂停所有用户线程(即STW)

说明:

STW(stop the world):编译代码时为每一个方法注入safepoint(方法中循环结束的点、方法执行结束的点),在暂停应用时,需要等待所有的用户线程进入safepoint,之后暂停所有线程,然后进行垃圾回收。

适用场合:

  • CPU核数<2,物理内存<2G的机器(简单来讲,单CPU,新生代空间较小且对STW时间要求不高的情况下使用)
  • -XX:UseSerialGC:强制使用该GC组合
  • -XX:PrintGCApplicationStoppedTime:查看STW时间
  • 由于它实现相对简单,没有线程相关的额外开销(主要指线程切换与同步),因此非常适合运行于客户端PC的小型应用程序,或者桌面应用程序(比如swing编写的用户界面程序),以及我们平时的开发、调试、测试等。

(2.2)ParNew/Serial Old:

 

说明:

ParNew除了采用多GC线程来实现复制算法以外,其他都与Serial一样,但是此组合中的Serial Old又是一个单GC线程,所以该组合是一个比较尴尬的组合,在单CPU情况下没有Serial/Serial Old速度快(因为ParNew多线程需要切换),在多CPU情况下又没有之后的三种组合快(因为Serial Old是单GC线程),所以使用其实不多。

-XX:ParallelGCThreads:指定ParNew GC线程的数量,默认与CPU核数相同,该参数在于CMS GC组合时,也可能会用到

(2.3)Parallel Scavenge/Parallel Old:

 

特点:

  1. 年轻代Parallel Scavenge收集器采用多个GC线程实现"复制"算法(包括扫描、复制)
  2. 年老代Parallel Old收集器采用多个GC线程实现"标记-整理"算法
  3. Parallel Scavenge与Parallel Old都会暂停所有用户线程(即STW)

说明:

  1. 吞吐量:CPU运行代码时间/(CPU运行代码时间+GC时间)
  2. CMS主要注重STW的缩短(该时间越短,用户体验越好,所以主要用于处理很多的交互任务的情况)
  3. Parallel Scavenge/Parallel Old主要注重吞吐量(吞吐量越大,说明CPU利用率越高,所以主要用于处理很多的CPU计算任务而用户交互任务较少的情况)

参数设置:

  1. -XX:+UseParallelOldGC:使用该GC组合
  2. -XX:GCTimeRatio:直接设置吞吐量大小,假设设为19,则允许的最大GC时间占总时间的1/(1 +19),默认值为99,即1/(1+99)
  3. -XX:MaxGCPauseMillis:最大GC停顿时间,该参数并非越小越好
  4. -XX:+UseAdaptiveSizePolicy:开启该参数,-Xmn/-XX:SurvivorRatio/-XX:PretenureSizeThreshold这些参数就不起作用了,虚拟机会自动收集监控信息,动态调整这些参数以提供最合适的的停顿时间或者最大的吞吐量(GC自适应调节策略),而我们需要设置的就是-Xmx,-XX:+UseParallelOldGC或-XX:GCTimeRatio两个参数就好(当然-Xms也指定上与-Xmx相同就好)

适用场合:

  1. 很多的CPU计算任务而用户交互任务较少的情况
  2. 不想自己去过多的关注GC参数,想让虚拟机自己进行调优工作
  3. 对吞吐量要求较高,或需要达到一定的量。

(2.4)ParNew/CMS:

 

说明:

  1. 以上只是年老代CMS收集的过程,年轻代ParNew看"2.2、ParNew/Serial Old"就好
  2. CMS是多回收线程的,不要被上图误导,默认的线程数:(CPU数量+3)/4
  3. CMS主要注重STW的缩短(该时间越短,用户体验越好,所以主要用于处理很多的交互任务的情况)

特点:

1.年轻代ParNew收集器采用多个GC线程实现"复制"算法(包括扫描、复制)

2.年老代CMS收集器采用多线程实现"标记-清除"算法

  • 初始标记:标记与根集合节点直接关联的节点。时间非常短,需要STW
  • 并发标记:遍历之前标记到的关联节点,继续向下标记所有存活节点。时间较长。
  • 重新标记:重新遍历trace并发期间修改过的引用关系对象。时间介于初始标记与并发标记之间,通常不会很长。需要STW
  • 并发清理:直接清除非存活对象,清理之后,将该线程占用的CPU切换给用户线程

3.初始标记与重新标记都会暂停所有用户线程(即STW),但是时间较短;并发标记与并发清理时间较长,但是不需要STW

关于并发标记期间怎样记录发生变动的引用关系对象,在重新标记期间怎样扫描这些对象

缺点:

  • 并发标记与并发清理:按照说明的第二点来讲,假设有2个CPU,那么其中有一个CPU会用于垃圾回收,而另一个用于用户线程,这样的话,之前是两CPU运行用户线程,现在是一个,那么效率就会急剧下降。也就是说,降低了吞吐量(即降低了CPU使用率)。
  • 并发清理:在这一过程中,产生的垃圾无法被清理(因为发生在重新标记之后)
  • 并发标记与并发清理:由于是与用户线程并发的,所以用户线程可能会分配对象,这样既可能对象直接进入年老代(例如,大对象),也可能进入年轻代后,年轻代发生minor GC,这样的话,实际上要求我们的年老代需要预留一定空间,也就是说要在年老代还有一定空间的情况下就要进行垃圾回收,留出一定内存空间来供其他线程使用,而不能等到年老代快爆满了才进行垃圾回收,通过-XX:CMSInitiatingOccupancyFraction来指定当年老代空间满了多少后进行垃圾回收
  • 标记-清理算法:会产生内存碎片,由于是在老年代,可能会提前触发Full GC(这正是我们要尽量减少的)

参数设置:

  • -XX:+UseConcMarkSweepGC:使用该GC组合
  • -XX:CMSInitiatingOccupancyFraction:指定当年老代空间满了多少后进行垃圾回收
  • -XX:+UseCMSCompactAtFullCollection:(默认是开启的)在CMS收集器顶不住要进行FullGC时开启内存碎片整理过程,该过程需要STW
  • -XX:CMSFullGCsBeforeCompaction:指定多少次FullGC后才进行整理
  • -XX:ParallelCMSThreads:指定CMS回收线程的数量,默认为:(CPU数量+3)/4

适用场合:

用于处理很多的交互任务的情况

方法区的回收一般使用CMS,配置两个参数:-XX:+CMSPermGenSweepingEnabled与-XX:+CMSClassUnloadingEnabled

适用于一些需要长期运行且对相应时间有一定要求的后台程序

(2.5)G1

 

说明:

  • 从上图来看,G1与CMS相比,仅在最后的"筛选回收"部分不同(CMS是并发清除),实际上G1回收器的整个堆内存的划分都与其他收集器不同。
  • CMS需要配合ParNew,G1可单独回收整个空间

原理:

  • G1收集器将整个堆划分为多个大小相等的Region
  • G1跟踪各个region里面的垃圾堆积的价值(回收后所获得的空间大小以及回收所需时间长短的经验值),在后台维护一张优先列表,每次根据允许的收集时间,优先回收价值最大的region,这种思路:在指定的时间内,扫描部分最有价值的region(而不是扫描整个堆内存),并回收,做到尽可能的在有限的时间内获取尽可能高的收集效率。

运作流程:

  • 初始标记:标记出所有与根节点直接关联引用对象。需要STW
  • 并发标记:遍历之前标记到的关联节点,继续向下标记所有存活节点。在此期间所有变化引用关系的对象,都会被记录在Remember Set Logs中
  • 最终标记:标记在并发标记期间,新产生的垃圾。需要STW
  • 筛选回收:根据用户指定的期望回收时间回收价值较大的对象(看"原理"第二条)。需要STW

优点:

  1. 停顿时间可以预测:我们指定时间,在指定时间内只回收部分价值最大的空间,而CMS需要扫描整个年老代,无法预测停顿时间
  2. 无内存碎片:垃圾回收后会整合空间,CMS采用"标记-清理"算法,存在内存碎片
  3. 筛选回收阶段:
  • 由于只回收部分region,所以STW时间我们可控,所以不需要与用户线程并发争抢CPU资源,而CMS并发清理需要占据一部分的CPU,会降低吞吐量。
  • 由于STW,所以不会产生"浮动垃圾"(即CMS在并发清理阶段产生的无法回收的垃圾)

适用范围:

  • 追求STW短:若ParNew/CMS用的挺好,就用这个;若不符合,用G1
  • 追求吞吐量:用Parallel Scavenge/Parallel Old,而G1在吞吐量方面没有优势
分享到:
评论

相关推荐

    java C#垃圾回收算法分析

    本文将深入探讨Java和C#中的垃圾回收算法,帮助开发者理解其工作原理和优化策略。 首先,我们要明确垃圾回收的基本概念。在程序运行过程中,会动态分配内存来存储对象。当一个对象不再被引用时,它就变成了垃圾。...

    JVM面试资料:JVM结构、JVM调优、四大垃圾回收算法、七大垃圾回收器

    四大垃圾回收算法:复制算法、标记-清除算法、标记-整理算法、分代收集算法 七大垃圾回收器:Serial、Serial Old、ParNew、CMS、Parallel、Parallel Old、G1 JVM调优:命令行指令,设置堆内存大小的参数

    JVM之基本的垃圾回收算法汇总

    并发收集则是在应用线程运行的同时进行GC,尽可能减少对应用性能的影响,如CMS(Concurrent Mark Sweep)和G1(Garbage-First)垃圾回收器。 7. G1垃圾回收器 G1是Oracle JDK 1.6引入的一种新的垃圾回收器,它结合...

    垃圾回收算法与实现

    垃圾回收算法是实现垃圾回收的关键,它直接影响到程序的性能和资源利用效率。本书《垃圾回收的算法与实现》深入探讨了垃圾回收的算法和实际应用,是程序员理解和应用垃圾回收技术的重要参考书籍。 垃圾回收算法篇...

    垃圾回收算法与实现,Turling

    《垃圾回收算法与实现》是IT领域中关于内存管理和优化的重要话题,主要关注的是如何自动地识别并释放不再使用的内存,以确保程序的稳定运行。在这个主题中,Turing垃圾回收算法是一个重要的研究方向,它在Java等语言...

    垃圾回收相关算法.pdf

    总的来说,垃圾回收算法的选择和实现取决于JVM的具体实现、应用的需求以及内存管理策略。理解这些算法可以帮助开发者更好地优化程序性能,避免不必要的内存问题。在实际开发中,应结合JVM提供的工具,如MAT和...

    垃圾回收算法

    每种垃圾回收算法都有其适用场景和局限性。选择哪种算法取决于具体的应用需求和环境限制。例如,对于需要快速响应的应用程序,可能更倾向于使用引用计数算法,因为它可以即时回收不再使用的对象。而对于长时间运行的...

    垃圾回收机制面试题·.docx

    - **空闲时间**:在系统空闲时,垃圾回收器会选择性地进行垃圾回收。 - **内存紧张**:当系统内存不足时,垃圾回收器会被强制启动。 #### 六、垃圾回收的方法调用 虽然Java中的垃圾回收是由虚拟机自动完成的,但在...

    JVM入门实战/arthas实战/垃圾回收算法/垃圾回收器/jvm内存模型分析

    第四节:垃圾回收算法 1.1标记清除算法 1.2复制算法 1.3 标记整理(标记压缩)算法 第五节:垃圾回收器 1.1Serial/Serial Old收集器 1.2 ParNew收集器 1.3Parallel Scavenge收集器 1.4Parallel Old收集器 1.5CMS...

    java高级之垃圾回收机制

    通过深入理解JVM内存模型以及不同的垃圾回收算法,可以帮助我们更好地优化程序性能,提高代码质量。在实际开发过程中,合理利用JVM提供的工具和技术,可以有效地避免内存泄漏等问题,提升系统的稳定性和可靠性。

    分布式垃圾回收算法分析.pdf

    分布式垃圾回收算法的分析对于理解和改进分布式系统中的内存管理机制至关重要。 在分布式垃圾回收概述中,垃圾回收(Garbage Collection,简称GC)是自动回收内存中不再使用的对象的机制,该机制可以减少编程人员的...

    关于javal垃圾回收机制的一些文档

    在"java垃圾回收机制介绍.doc"文档中,可能还会深入讨论如何监控和调试垃圾回收,包括使用JConsole、VisualVM等工具,以及分析GC日志,以理解垃圾回收的性能和行为,从而优化应用程序的内存使用。 了解和掌握Java...

    Java垃圾回收新算法刍探.pdf

    2. 垃圾回收算法:垃圾回收算法是垃圾回收器实现的核心,决定了垃圾回收的方式和效率。 本文提出了一种新的垃圾回收算法,该算法可以一定程度上改善和提高Java垃圾回收的性能。 Java与C/C++的对比: 1. 内存管理...

    Java中的垃圾回收机制(GC):深入理解与代码实践

    开发者需要掌握垃圾回收机制的工作原理、垃圾回收算法和垃圾回收器的选择,以及如何进行调优和优化,以提高程序的性能和稳定性。同时,还需要注意避免内存泄漏和内存溢出等问题的发生,确保程序的健壮性和可靠性。

    垃圾回收算法有几种类型? 他们对应的优缺点又是什么?(csdn)————程序.pdf

    垃圾回收是计算机编程,尤其是Java和许多其他现代编程语言中的一个关键概念,它自动管理程序的内存,...在优化程序性能时,了解这些垃圾回收算法及其特点至关重要,因为它直接影响到应用程序的运行速度和内存使用效率。

    11 垃圾回收算法.md,学习代码

    《垃圾回收算法详解》 在Java编程语言中,内存管理是一项关键任务,它涉及到程序运行时的内存分配和释放。...同时,随着JVM技术的不断发展,新的垃圾回收算法和工具也在不断涌现,为开发者提供了更多优化选择。

    C#垃圾回收机制GC

    主流的垃圾回收算法有Reference Counting、Mark Sweep和Copy Collection,其中.NET采用的是Mark-Compact算法。 Mark-Compact算法分为两步: 1. Mark-Sweep(标记清除):首先假设所有对象都可回收,然后从根开始...

    垃圾回收扫描算法程序

    根据给定文件的信息,我们可以总结出以下相关的IT知识点: ...通过以上分析可以看出,这份代码涵盖了文件操作、数据结构、算法设计等多个方面的知识点,对于学习和理解垃圾收集路径优化问题具有一定的参考价值。

    JVM调优总结(三)基本垃圾回收算法.pdf

    垃圾回收算法是Java虚拟机(JVM)中的一种机制,用于回收无用的对象以释放内存空间。垃圾回收算法可以从不同的角度划分,下面是常见的垃圾回收算法: 1. 引用计数(Reference Counting) 引用计数是一种古老的垃圾...

Global site tag (gtag.js) - Google Analytics