`

垃圾回收器判断对象是否存活

 
阅读更多

转载自:http://blog.csdn.net/ochangwen/article/details/51406779

 

本文是基于周志明的《深入理解Java虚拟机》

    堆中几乎存放着Java世界中所有的对象实例,垃圾收集器在对堆回收之前,第一件事情就是要确定这些对象哪些还“存活”着,哪些对象已经“死去”(即不可能再被任何途径使用的对象)

1、引用计数算法(Reference Counting)

    很多教科书判断对象是否存活的算法是这样的:给对象中添加一个引用计数器,每当有一个地方引用它时,计数器值加1;当引用失效时,计数器减1;任何时刻计数器都为0的对象就是不可能再被使用的。
    引用计数算法的实现简单,判断效率也很高,在大部分情况下它都是一个不错的算法。但是Java语言中没有选用引用计数算法来管理内存,其中最主要的一个原因是它很难解决对象之间相互循环引用的问题。
    例如:
    在testGC()方法中,对象objA和objB都有字段instance,赋值令objA.instance=objB及objB.instance=objA,除此之外这两个对象再无任何引用,实际上这两个对象都已经不能再被访问,但是它们因为相互引用着对象方,异常它们的引用计数都不为0,于是引用计数算法无法通知GC收集器回收它们。

[java] view plain copy
 
 在CODE上查看代码片派生到我的代码片
  1. /** 
  2.  * 执行后,objA和objB会不会被GC呢? 
  3.  */  
  4. public class ReferenceCountingGC {  
  5.     public Object instance = null;  
  6.   
  7.     private static final int _1MB = 1024 * 1024;  
  8.   
  9.     /** 
  10.      * 这个成员属性的唯一意义就是占点内存,以便能在GC日志中看清楚是否被回收过 
  11.      */  
  12.     private byte[] bigSize = new byte[2 * _1MB];  
  13.   
  14.     public static void main(String[] args) {  
  15.         ReferenceCountingGC objA = new ReferenceCountingGC();  
  16.         ReferenceCountingGC objB = new ReferenceCountingGC();  
  17.         objA.instance = objB;  
  18.         objB.instance = objA;  
  19.   
  20.         objA = null;  
  21.         objB = null;  
  22.   
  23.         //假设在这行发生了GC,objA和ojbB是否被回收  
  24.         System.gc();  
  25.     }  
  26. }  
0.193: [GC 4418K->256K(61504K), 0.0046018 secs]
0.198: [Full GC 256K->160K(61504K), 0.0125962 secs]

    在运行结果中可以看到GC日志中包含"4418K->256K",老年代从4418K(大约4M,其实就是objA与objB)变为了141K,意味着虚拟并没有因为这两个对象相互引用就不回收它们,这也证明虚拟并不是通过通过引用计数算法来判断对象是否存活的。大家可以看到对象进入了老年代,但是大家都知道,对象刚创建的时候是分配在新生代中的,要进入老年代默认年龄要到了15才行,但这里objA与objB却进入了老年代。这是因为Java堆区会动态增长,刚开始时堆区较小,对象进入老年代还有一规则,当Survior空间中同一代的对象大小之和超过Survior空间的一半时,对象将直接进行老年代。
---------------------------------------------------------------------------------------------------------

2、可达性分析算法(GC Roots Analysis):主流用这个判断

    在主流的商用程序语言中(Java和C#),都是使用可达性分析算法判断对象是否存活的。这个算法的基本思路就是通过一系列名为"GC Roots"的对象作为起始点,从这些节点开始向下搜索,搜索所走过的路径称为引用链(Reference Chain),当一个对象到GC Roots没有任何引用链相连时,则证明此对象是不可用的,下图对象object5, object6, object7虽然有互相判断,但它们到GC Roots是不可达的,所以它们将会判定为是可回收对象。

  在Java语言里,可作为GC Roots对象的包括如下几种:
    a.虚拟机栈(栈桢中的本地变量表)中的引用的对象
    b.方法区中的类静态属性引用的对象
    c.方法区中的常量引用的对象
    d.本地方法栈中JNI的引用的对象 
--------------------------------------------------------------------------------------------------------------

3、finalize()方法最终判定对象是否存活

    即使在可达性分析算法中不可达的对象,也并非是“非死不可”的,这时候它们暂时处于“缓刑”阶段,要真正宣告一个对象死亡,至少要经历再次标记过程。
    标记的前提是对象在进行可达性分析后发现没有与GC Roots相连接的引用链。
  1).第一次标记并进行一次筛选。
    筛选的条件是此对象是否有必要执行finalize()方法。
    当对象没有覆盖finalize方法,或者finzlize方法已经被虚拟机调用过,虚拟机将这两种情况都视为“没有必要执行”,对象被回收。

  2).第二次标记
    如果这个对象被判定为有必要执行finalize()方法,那么这个对象将会被放置在一个名为:F-Queue的队列之中,并在稍后由一条虚拟机自动建立的、低优先级的Finalizer线程去执行。这里所谓的“执行”是指虚拟机会触发这个方法,但并不承诺会等待它运行结束。这样做的原因是,如果一个对象finalize()方法中执行缓慢,或者发生死循环(更极端的情况),将很可能会导致F-Queue队列中的其他对象永久处于等待状态,甚至导致整个内存回收系统崩溃。
    Finalize()方法是对象脱逃死亡命运的最后一次机会,稍后GC将对F-Queue中的对象进行第二次小规模标记,如果对象要在finalize()中成功拯救自己----只要重新与引用链上的任何的一个对象建立关联即可,譬如把自己赋值给某个类变量或对象的成员变量,那在第二次标记时它将移除出“即将回收”的集合。如果对象这时候还没逃脱,那基本上它就真的被回收了。
流程图如下:

 

[java] view plain copy
 
 在CODE上查看代码片派生到我的代码片
  1. /** 
  2.  * 此代码演示了两点 
  3.  * 1、对象可以在被GC时自我拯救 
  4.  * 2、这种自救的机会只有一次,因为一个对象的finalize()方法最多只能被系统自动调用一次。 
  5.  */  
  6. public class FinalizeEscapeGC {  
  7.     public static FinalizeEscapeGC SAVE_HOOK = null;  
  8.   
  9.     public void isAlive() {  
  10.         System.out.println("yes, I am still alive");  
  11.     }  
  12.   
  13.     protected void finalize() throws Throwable {  
  14.         super.finalize();  
  15.         System.out.println("finalize method executed!");  
  16.         FinalizeEscapeGC.SAVE_HOOK = this;  
  17.     }  
  18.   
  19.     public static void main(String[] args) throws InterruptedException {  
  20.         SAVE_HOOK = new FinalizeEscapeGC();  
  21.   
  22.         //对象第一次成功拯救自己  
  23.         SAVE_HOOK = null;  
  24.         System.gc();  
  25.   
  26.         //因为finalize方法优先级很低,所有暂停0.5秒以等待它  
  27.         Thread.sleep(500);  
  28.         if (SAVE_HOOK != null) {  
  29.             SAVE_HOOK.isAlive();  
  30.         } else {  
  31.             System.out.println("no ,I am dead QAQ!");  
  32.         }  
  33.   
  34.         //-----------------------  
  35.         //以上代码与上面的完全相同,但这次自救却失败了!!!  
  36.         SAVE_HOOK = null;  
  37.         System.gc();  
  38.   
  39.         //因为finalize方法优先级很低,所有暂停0.5秒以等待它  
  40.         Thread.sleep(500);  
  41.         if (SAVE_HOOK != null) {  
  42.             SAVE_HOOK.isAlive();  
  43.         } else {  
  44.             System.out.println("no ,I am dead QAQ!");  
  45.         }  
  46.     }  
  47. }  
finalize method executed!
yew, I am still alive
no ,I am dead QAQ!

    从结果可以看出,SAVE_HOOK对象的finalize()方法确实被GC收集器触发过,并且在被收集前成功逃脱了。
注意:任何一个对象的finalize()方法都只会被系统自动调用一次,如果对象面临下一次回收,它的finalize()方法不会被再次执行,因此第二段代码的自救行动失败了。 并且建议大家尽量避免使用它   

 

Eclipse设置GC日志输出:
1.右键项目,选择properties。
2.选择run/debug setting, 在要执行的类点Edit,并如下图设置

这个方法是测试main方法用的

 

1、在eclipse根目录下的eclipse.ini配置文件中添加以下参数:
-verbose:gc (开启打印垃圾回收日志)
-Xloggc:eclipse_gc.log (设置垃圾回收日志打印的文件,文件名称可以自定义)
-XX:+PrintGCTimeStamps (打印垃圾回收时间信息时的时间格式)
-XX:+PrintGCDetails (打印垃圾回收详情)
添加完以上参数后当启动Eclipse后就能在Eclipse根目录看到一个eclipse_gc.log的gc日志文件
2、设置eclipse初始堆、非堆内存大小以及年轻代
-Xms50m –Xmx200m -XX:PermSize=30m -XX:MaxPermSize=60m
3、添加JVM监控参数
-Djava.rmi.server.hostname=127.0.0.1 -Dcom.sun.management.jmxremote.port=6688 -Dcom.sun.management.jmxremote.ssl=false -Dcom.sun.management.jmxremote.authenticate=false

gc日志:

Java HotSpot(TM) Client VM (25.25-b02) for windows-x86 JRE (1.8.0_25-b18), built on Oct  7 2014 14:31:05 by "java_re" with MS VC++ 10.0 (VS2010)
Memory: 4k page, physical 8340720k(3545144k free), swap 8787248k(2501780k free)
CommandLine flags: -XX:InitialHeapSize=268435456 -XX:MaxHeapSize=943718400 -XX:+PrintGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:-UseLargePagesIndividualAllocation
4.458: [GC (Allocation Failure) 4.458: [DefNew: 69952K->8704K(78656K), 0.0681410 secs] 69952K->22643K(253440K), 0.0690407 secs] [Times: user=0.06 sys=0.02, real=0.08 secs]
5.741: [Full GC (Metadata GC Threshold) 5.741: [Tenured: 13939K->33208K(174784K), 0.1036054 secs] 48618K->33208K(253440K), [Metaspace: 11442K->11442K(12672K)], 0.1041130 secs] [Times: user=0.11 sys=0.00, real=0.11 secs]
12.427: [GC (Allocation Failure) 12.427: [DefNew: 70016K->8704K(78720K), 0.0821340 secs] 103224K->55838K(253504K), 0.0822684 secs] [Times: user=0.08 sys=0.00, real=0.09 secs]
12.787: [Full GC (Metadata GC Threshold) 12.787: [Tenured: 47134K->56307K(174784K), 0.1662610 secs] 59785K->56307K(253504K), [Metaspace: 19215K->19215K(20864K)], 0.1663899 secs] [Times: user=0.16 sys=0.00, real=0.16 secs]
17.018: [GC (Allocation Failure) 17.018: [DefNew: 70016K->8704K(78720K), 0.0475891 secs] 126323K->68567K(253504K), 0.0477196 secs] [Times: user=0.03 sys=0.02, real=0.06 secs]
21.047: [GC (Allocation Failure) 21.047: [DefNew: 78720K->8704K(78720K), 0.0752255 secs] 138583K->83739K(253504K), 0.0753766 secs] [Times: user=0.08 sys=0.00, real=0.06 secs]
21.320: [Full GC (Metadata GC Threshold) 21.320: [Tenured: 75035K->61015K(174784K), 0.2800589 secs] 87423K->61015K(253504K), [Metaspace: 31969K->31969K(34176K)], 0.2802057 secs] [Times: user=0.28 sys=0.00, real=0.29 secs]

GC日志说明:
GC打印时间: [垃圾回收类型回收时间: [收集器名称: 年轻代回收前占用大小->年轻代回收后占用大小(年轻代当前容量),
年轻代局部GC时JVM暂停处理的时间] 堆空间GC前占用的空间->堆空间GC后占用的空间(堆空间当前容量)
,GC过程中JVM暂停处理的时间]。
垃圾回收类型:分为GC和Full GC.
GC一般为堆空间某个区发生了垃圾回收,
Full GC基本都是整个堆空间及持久代发生了垃圾回收,通常优化的目标之一是尽量减少GC和Full GC的频率。
收集器名称:一般都为收集器的简称或别名,通过收集器名称基本都能判断出那个区发生了GC。
DefNew:年轻代(新生代)发生了GC (若为DefNew可知当前JVM年轻代使用的串行收集器)
ParNew:年轻代(新生代)发生了GC (若为ParNew可知当前JVM年轻代使用了并行收集器)
Tenured:老年代发生了GC
Perm:持久代发生了GC

 

四、引用 

   无论是通过引用计数算法判断对象的引用数量,还是通过根搜索算法判断对象的引用链是否可达,判定对象是否存活都与“引用”有关。在JDK 1.2之前,Java中的引用的定义很传统:如果reference类型的数据中存储的数值代表的是另外一块内存的起始地址,就称这块内存代表着一个引用。这种定义很纯粹,但是太过狭隘,一个对象在这种定义下只有被引用或者没有被引用两种状态,对于如何描述一些“食之无味,弃之可惜”的对象就显得无能为力。我们希望能描述这样一类对象:当内存空间还足够时,则能保留在内存之中;如果内存在进行垃圾收集后还是非常紧张,则可以抛弃这些对象。很多系统的缓存功能都符合这样的应用场景。
    在JDK 1.2之后,Java对引用的概念进行了扩充,将引用分为强引用(Strong Reference)、软引用(Soft Reference)、弱引用(Weak Reference)、虚引用(Phantom Reference)四种,这四种引用强度依次逐渐减弱。  
    强引用就是指在程序代码之中普遍存在的,类似“Object obj = new Object()”这类的引用,只要强引用还存在,垃圾收集器永远不会回收掉被引用的对象。
    软引用用来描述一些还有用,但并非必需的对象。对于软引用关联着的对象,在系统将要发生内存溢出异常之前,将会把这些对象列进回收范围之中并进行第二次回收。如果这次回收还是没有足够的内存,才会抛出内存溢出异常。在JDK 1.2之后,提供了SoftReference类来实现软引用。
   弱引用也是用来描述非必需对象的,但是它的强度比软引用更弱一些,被弱引用关联的对象只能生存到下一次垃圾收集发生之前。当垃圾收集器工作时,无论当前内存是否足够,都会回收掉只被弱引用关联的对象。在JDK 1.2之后,提供了WeakReference类来实现弱引用。
    虚引用也称为幽灵引用或者幻影引用,它是最弱的一种引用关系。一个对象是否有虚引用的存在,完全不会对其生存时间构成影响,也无法通过虚引用来取得一个对象实例。为一个对象设置虚引用关联的唯一目的就是希望能在这个对象被收集器回收时收到一个系统通知。在JDK 1.2之后,提供了PhantomReference类来实现虚引用。

分享到:
评论

相关推荐

    java垃圾回收器代码举例

    - **可达性分析**:垃圾回收器通过一系列称为“根”(如局部变量、静态变量和JVM栈中的对象引用)的对象,来判断哪些对象是可达的,哪些是不可达的。不可达的对象被视为垃圾。 - **标记-清除算法**:这是最基础的...

    JVM与性能优化知识点整理.pdf

    1. Java中是值传递还是引用传递,影响垃圾回收器判断对象是否存活。 2. 基本垃圾回收算法包括标记-清除、复制、标记-整理、分代收集等。 3. 分代处理垃圾采用年轻代和老年代的不同回收策略。 4. 常见的GC类型分为...

    垃圾回收器的相关知识点总结

    可达性分析则是通过确定哪些对象可以通过根对象(如全局变量、活动栈帧等)访问到,来判断对象是否活跃。只有那些无法从根对象到达的对象才会被标记为可回收。 在JavaScript中,由于其运行环境的特性,如V8引擎,...

    JVM垃圾回收机制

    - 可达性分析算法:这种方法通过确定对象的引用链来判断对象是否可达。GC根对象包括虚拟机栈中引用的对象、方法区中类静态属性引用的对象、方法区中常量引用的对象、本地方法栈中native方法引用的对象。如果一个对象...

    JVM之垃圾回收器

    - **可达性分析**:通过判断对象是否能从根节点(如静态变量、线程栈、JVM内部引用)访问到,来确定对象是否存活。 - **内存碎片整理**:除了回收无用对象,GC还需要整理内存,减少碎片,提高内存利用率。 3. **...

    Java垃圾回收原理

    垃圾回收器通过可达性分析算法来判断对象是否还被引用。如果一个对象没有任何引用指向它,那么这个对象就可以被视为垃圾,并可被垃圾回收器回收。 #### 三、Java中的垃圾回收器 ##### 3.1 Serial Collector Serial...

    垃圾回收相关算法.pdf

    它通过从一组称为GC Roots的对象开始,遍历整个引用链,判断对象是否可达。如果对象无法从GC Roots到达,那么它就是不可达的,可以被视为垃圾。GC Roots包括虚拟机栈中引用的对象、本地方法栈内的JNI引用、方法区的...

    谈谈你对垃圾回收机制的了解?.docx

    垃圾回收机制通过特定的算法来判断对象是否可回收,进而清理内存。 首先,垃圾收集的原理和概念主要包括引用计数算法和可达性分析。引用计数算法为每个对象分配一个计数器,每当有一个引用指向该对象时,计数器加一...

    Java垃圾回收精粹-Part4Java开发Java经验技

    1. 避免全局变量和长生命周期对象:这可能导致对象长时间存活在内存中,增加垃圾回收难度。 2. 使用`System.gc()`谨慎:虽然可以显式触发垃圾回收,但不推荐,因为其性能影响难以预测。 3. 尽量减少对象创建:过多...

    Java软件开发实战 Java基础与案例开发详解 2-6 java的垃圾回收器 共4页.pdf

    - **垃圾回收**:一旦识别出垃圾对象,垃圾回收器就会释放这些对象占用的内存,使其可以被再次使用。 #### 4. 垃圾回收策略 Java的垃圾回收器有多种不同的实现策略,包括但不限于: - **标记-清除(Mark-Sweep)*...

    java 垃圾回收的机制

    1. **对象的可达性分析**:这是垃圾回收的第一步,通过一系列的“引用”关系来判断对象是否还被程序所使用。如果一个对象没有任何引用链与之相连,那么这个对象就被认为是“不可达”的,进而被视为垃圾。 2. **标记...

    垃圾回收-GC简单总结.pdf

    垃圾回收的关键在于如何判断对象是否是垃圾。 1. 引用计数法:该算法通过为对象添加引用计数器来判断对象是否存活。每当一个对象被引用,它的引用计数器就会增加。当引用失效时,计数器减少。当引用计数器为零时,...

    笔记,2、内存分配与回收策略~深入理解垃圾回收器1

    判断对象是否可回收的方法有两种:引用计数法和可达性分析。前者在对象相互引用时可能无法准确判断,因此Java使用后者,通过从GC Roots开始遍历引用链来确定对象是否存活。GC Roots包括虚拟机栈中的本地变量表、方法...

    牛客-数据存储与垃圾回收

    新生区垃圾回收通过Scavenge复制新生区数据,并分成对象区域和空闲区域,通过对象晋升策略,将存活时间长的数据转到老生区。老生区垃圾回收通过标记清除数据会产生内存碎片,需结合标记整理来实现。 JavaScript中的...

    笔记,2、垃圾回收器和内存分配策略1

    二、判断对象存活的算法 1. 引用计数法:每个对象都有一个计数器,每当有一个引用指向它时,计数器加1,引用消失时减1。当计数器为0时,对象被视为可回收。这种方法简单快速,但在处理循环引用时会出现问题。 2. ...

    笔记,2、垃圾回收器和内存分配策略3

    2. 可达性分析:这是Java中常用的判断对象存活的方法。通过GC Roots(如虚拟机栈、方法区、本地方法栈等)出发,遍历引用链,若对象无法从GC Roots到达,即认为该对象不可达,可以被回收。 三、四种引用类型 1. 强...

    JDK5垃圾回收机制资料大全

    有两种主要的判断对象是否可收集的方法:引用计数和对象引用遍历。 1. **引用计数** 是一种简单的方法,它为每个对象维护一个引用计数,每当有一个引用指向该对象,计数加一,引用失效时,计数减一。当对象的引用...

Global site tag (gtag.js) - Google Analytics