`
lyn111
  • 浏览: 13665 次
  • 性别: Icon_minigender_1
  • 来自: 北京
最近访客 更多访客>>
社区版块
存档分类
最新评论

java垃圾回收和内存泄露的精解

阅读更多
分享一篇很不错的文章,用Java语言做开发的程序员朋友都要仔细品读!



1.垃圾收集算法的核心思想

Java语言建立了垃圾收集机制,用以跟踪正在使用的对象和发现并回收不再使用(引用)的对象.该机制可以有效防范动态内存分配中可能发生的两个危险:因内存垃圾过多而引发的内存耗尽,以及不恰当的内存释放所造成的内存非法引用.

垃圾收集算法的核心思想是:对虚拟机可用内存空间,即堆空间中的对象进行识别,如果对象正在被引用,那么称其为存活对象,反之,如果对象不再被引用,则为垃圾对象,可以回收其占据的空间,用于再分配.垃圾收集算法的选择和垃圾收集系统参数的合理调节直接影响着系统性能,因此需要开发人员做比较深入的了解.

2.触发主GC(Garbage Collector)的条件

JVM进行次GC的频率很高,但因为这种GC占用时间极短,所以对系统产生的影响不大.更值得关注的是主GC的触发条件,因为它对系统影响很明显.总的来说,有两个条件会触发主GC:

①当应用程序空闲时,即没有应用线程在运行时,GC会被调用.因为GC在优先级最低的线程中进行,所以当应用忙时,GC线程就不会被调用,但以下条件除外.

②Java堆内存不足时,GC会被调用.当应用线程在运行,并在运行过程中创建新对象,若这时内存空间不足,JVM就会强制地调用GC线程,以便回收内存用于新的分配.若GC一次之后仍不能满足内存分配的要求,JVM会再进行两次GC作进一步的尝试,若仍无法满足要求,则  JVM将报"out of memory"的错误,Java应用将停止.

由于是否进行主GC由JVM根据系统环境决定,而系统环境在不断的变化当中,所以主GC的运行具有不确定性,无法预计它何时必然出现,但可以确定的是对一个长期运行的应用来说,其主GC是反复进行的.

3.减少GC开销的措施

根据上述GC的机制,程序的运行会直接影响系统环境的变化,从而影响GC的触发.若不针对GC的特点进行设计和编码,就会出现内存驻留等一系列负面影响.为了避免这些影响,基本的原则就是尽可能地减少垃圾和减少GC过程中的开销.具体措施包括以下几个方面:

(1)不要显式调用System.gc()

此函数建议JVM进行主GC,虽然只是建议而非一定,但很多情况下它会触发主GC,从而增加主GC的频率,也即增加了间歇性停顿的次数.

(2)尽量减少临时对象的使用

临时对象在跳出函数调用后,会成为垃圾,少用临时变量就相当于减少了垃圾的产生,从而延长了出现上述第二个触发条件出现的时间,减少了主GC的机会.

(3)对象不用时最好显式置为Null

一般而言,为Null的对象都会被作为垃圾处理,所以将不用的对象显式地设为Null,有利于GC收集器判定垃圾,从而提高了GC的效率.

(4)尽量使用StringBuffer,而不用String来累加字符串(详见blog另一篇文章JAVA中String与StringBuffer)

由于String是固定长的字符串对象,累加String对象时,并非在一个String对象中扩增,而是重新创建新的String对象,如Str5=Str1+Str2+Str3+Str4,这条语句执行过程中会产生多个垃圾对象,因为对次作"+"操作时都必须创建新的String对象,但这些过渡对象对系统来说是没有实际意义的,只会增加更多的垃圾.避免这种情况可以改用StringBuffer来累加字符串,因StringBuffer是可变长的,它在原有基础上进行扩增,不会产生中间对象.

(5)能用基本类型如Int,Long,就不用Integer,Long对象

基本类型变量占用的内存资源比相应对象占用的少得多,如果没有必要,最好使用基本变量.

(6)尽量少用静态对象变量

静态变量属于全局变量,不会被GC回收,它们会一直占用内存.

(7)分散对象创建或删除的时间

集中在短时间内大量创建新对象,特别是大对象,会导致突然需要大量内存,JVM在面临这种情况时,只能进行主GC,以回收内存或整合内存碎片,从而增加主GC的频率.集中删除对象,道理也是一样的.它使得突然出现了大量的垃圾对象,空闲空间必然减少,从而大大增加了下一次创建新对象时强制主GC的机会.

4.gc与finalize方法

⑴gc方法请求垃圾回收

使用System.gc()可以不管JVM使用的是哪一种垃圾回收的算法,都可以请求Java的垃圾回收.需要注意的是,调用System.gc()也仅仅是一个请求.JVM接受这个消息后,并不是立即做垃圾回收,而只是对几个垃圾回收算法做了加权,使垃圾回收操作容易发生,或提早发生,或回收较多而已.

⑵finalize方法透视垃圾收集器的运行

在JVM垃圾收集器收集一个对象之前 ,一般要求程序调用适当的方法释放资源,但在没有明确释放资源的情况下,Java提供了缺省机制来终止化该对象释放资源,这个方法就是finalize().它的原型为:

protected void finalize() throws Throwable

在finalize()方法返回之后,对象消失,垃圾收集开始执行.原型中的throws Throwable表示它可以抛出任何类型的异常.

因此,当对象即将被销毁时,有时需要做一些善后工作.可以把这些操作写在finalize()方法里.

protected void finalize()

{

// finalization code here

}

⑶代码示例

class Garbage

{

int index;

static int count;

Garbage()

{

count++;

System.out.println("object "+count+" construct");

setID(count);

}

void setID(int id)

{

index=id;

}

protected void finalize()  //重写finalize方法

{

System.out.println("object "+index+" is reclaimed");

}

public static void main(String[] args)

{

new Garbage();

new Garbage();

new Garbage();

new Garbage();

System.gc();  //请求运行垃圾收集器

}

}

5.Java 内存泄漏

由于采用了垃圾回收机制,任何不可达对象(对象不再被引用)都可以由垃圾收集线程回收.因此通常说的Java 内存泄漏其实是指无意识的、非故意的对象引用,或者无意识的对象保持.无意识的对象引用是指代码的开发人员本来已经对对象使用完毕,却因为编码的错误而意外地保存了对该对象的引用(这个引用的存在并不是编码人员的主观意愿),从而使得该对象一直无法被垃圾回收器回收掉,这种本来以为可以释放掉的却最终未能被释放的空间可以认为是被"泄漏了".

考虑下面的程序,在ObjStack类中,使用push和pop方法来管理堆栈中的对象.两个方法中的索引(index)用于指示堆栈中下一个可用位置.push方法存储对新对象的引用并增加索引值,而pop方法减小索引值并返回堆栈最上面的元素.在main方法中,创建了容量为64的栈,并64次调用push方法向它添加对象,此时index的值为64,随后又32次调用pop方法,则index的值变为32,出栈意味着在堆栈中的空间应该被收集.但事实上,pop方法只是减小了索引值,堆栈仍然保持着对那些对象的引用.故32个无用对象不会被GC回收,造成了内存渗漏.

public class ObjStack {

private Object[] stack;

private int index;

ObjStack(int indexcount) {

stack = new Object[indexcount];

index = 0;

}

public void push(Object obj) {

stack[index] = obj;

index++;

}

public Object pop() {

index--;

return stack[index];

}

}

public class Pushpop {

public static void main(String[] args) {

int i = 0;

Object tempobj;

ObjStack stack1 = new ObjStack(64);//new一个ObjStack对象,并调用有参构造函数.分配stack Obj数组的空间大小为64,可以存64个对象,从0开始存储.

while (i < 64)

{

tempobj = new Object();//循环new Obj对象,把每次循环的对象一一存放在stack Obj数组中.

stack1.push(tempobj);

i++;

System.out.println("第" + i + "次进栈" + "/t");

}

while (i > 32)

{

tempobj = stack1.pop();//这里造成了空间的浪费.

//正确的pop方法可改成如下所指示,当引用被返回后,堆栈删除对他们的引用,因此垃圾收集器在以后可以回收他们.

/*

* public Object pop() {index - -;Object temp = stack [index];stack [index]=null;return temp;}

*/

i--;

System.out.println("第" + (64 - i) + "次出栈" + "/t");

}

}

}

如何消除内存泄漏

虽然Java虚拟机(JVM)及其垃圾收集器(garbage collector,GC)负责管理大多数的内存任务,Java软件程序中还是有可能出现内存泄漏.实际上,这在大型项目中是一个常见的问题.避免内存泄漏的第一步是要弄清楚它是如何发生的.本文介绍了编写Java代码的一些常见的内存泄漏陷阱,以及编写不泄漏代码的一些最佳实践.一旦发生了内存泄漏,要指出造成泄漏的代码是非常困难的.因此本文还介绍了一种新工具,用来诊断泄漏并指出根本原因.该工具的开销非常小,因此可以使用它来寻找处于生产中的系统的内存泄漏.

垃圾收集器的作用

虽然垃圾收集器处理了大多数内存管理问题,从而使编程人员的生活变得更轻松了,但是编程人员还是可能犯错而导致出现内存问题.简单地说,GC循环地跟踪所有来自"根"对象(堆栈对象、静态对象、JNI句柄指向的对象,诸如此类)的引用,并将所有它所能到达的对象标记为活动的.程序只可以操纵这些对象;其他的对象都被删除了.因为GC使程序不可能到达已被删除的对象,这么做就是安全的.

虽然内存管理可以说是自动化的,但是这并不能使编程人员免受思考内存管理问题之苦.例如,分配(以及释放)内存总会有开销,虽然这种开销对编程人员来说是不可见的.创建了太多对象的程序将会比完成同样的功能而创建的对象却比较少的程序更慢一些(在其他条件相同的情况下).

而且,与本文更为密切相关的是,如果忘记"释放"先前分配的内存,就可能造成内存泄漏.如果程序保留对永远不再使用的对象的引用,这些对象将会占用并耗尽内存,这是因为自动化的垃圾收集器无法证明这些对象将不再使用.正如我们先前所说的,如果存在一个对对象的引用,对象就被定义为活动的,因此不能删除.为了确保能回收对象占用的内存,编程人员必须确保该对象不能到达.这通常是通过将对象字段设置为null或者从集合(collection)中移除对象而完成的.但是,注意,当局部变量不再使用时,没有必要将其显式地设置为null.对这些变量的引用将随着方法的退出而自动清除.

概括地说,这就是内存托管语言中的内存泄漏产生的主要原因:保留下来却永远不再使用的对象引用.

典型泄漏

既然我们知道了在Java中确实有可能发生内存泄漏,就让我们来看一些典型的内存泄漏及其原因.

全局集合

在大的应用程序中有某种全局的数据储存库是很常见的,例如一个JNDI树或一个会话表.在这些情况下,必须注意管理储存库的大小.必须有某种机制从储存库中移除不再需要的数据.

这可能有多种方法,但是最常见的一种是周期性运行的某种清除任务.该任务将验证储存库中的数据,并移除任何不再需要的数据.

另一种管理储存库的方法是使用反向链接(referrer)计数.然后集合负责统计集合中每个入口的反向链接的数目.这要求反向链接告诉集合何时会退出入口.当反向链接数目为零时,该元素就可以从集合中移除了.

缓存

缓存是一种数据结构,用于快速查找已经执行的操作的结果.因此,如果一个操作执行起来很慢,对于常用的输入数据,就可以将操作的结果缓存,并在下次调用该操作时使用缓存的数据.

缓存通常都是以动态方式实现的,其中新的结果是在执行时添加到缓存中的.典型的算法是:

检查结果是否在缓存中,如果在,就返回结果.

如果结果不在缓存中,就进行计算.

将计算出来的结果添加到缓存中,以便以后对该操作的调用可以使用.

该算法的问题(或者说是潜在的内存泄漏)出在最后一步.如果调用该操作时有相当多的不同输入,就将有相当多的结果存储在缓存中.很明显这不是正确的方法.

为了预防这种具有潜在破坏性的设计,程序必须确保对于缓存所使用的内存容量有一个上限.因此,更好的算法是:

检查结果是否在缓存中,如果在,就返回结果.

如果结果不在缓存中,就进行计算.

如果缓存所占的空间过大,就移除缓存最久的结果.

将计算出来的结果添加到缓存中,以便以后对该操作的调用可以使用.

通过始终移除缓存最久的结果,我们实际上进行了这样的假设:在将来,比起缓存最久的数据,最近输入的数据更有可能用到.这通常是一个不错的假设.

新算法将确保缓存的容量处于预定义的内存范围之内.确切的范围可能很难计算,因为缓存中的对象在不断变化,而且它们的引用包罗万象.为缓存设置正确的大小是一项非常复杂的任务,需要将所使用的内存容量与检索数据的速度加以平衡.

解决这个问题的另一种方法是使用java.lang.ref.SoftReference类跟踪缓存中的对象.这种方法保证这些引用能够被移除,如果虚拟机的内存用尽而需要更多堆的话.

ClassLoader

Java ClassLoader结构的使用为内存泄漏提供了许多可乘之机.正是该结构本身的复杂性使ClassLoader在内存泄漏方面存在如此多的问题.ClassLoader的特别之处在于它不仅涉及"常规"的对象引用,还涉及元对象引用,比如:字段、方法和类.这意味着只要有对字段、方法、类或ClassLoader的对象的引用,ClassLoader就会驻留在JVM中.因为ClassLoader本身可以关联许多类及其静态字段,所以就有许多内存被泄漏了.

确定泄漏的位置

通常发生内存泄漏的第一个迹象是:在应用程序中出现了OutOfMemoryError.这通常发生在您最不愿意它发生的生产环境中,此时几乎不能进行调试.有可能是因为测试环境运行应用程序的方式与生产系统不完全相同,因而导致泄漏只出现在生产中.在这种情况下,需要使用一些开销较低的工具来监控和查找内存泄漏.还需要能够无需重启系统或修改代码就可以将这些工具连接到正在运行的系统上.可能最重要的是,当进行分析时,需要能够断开工具而保持系统不受干扰.

虽然OutOfMemoryError通常都是内存泄漏的信号,但是也有可能应用程序确实正在使用这么多的内存;对于后者,或者必须增加JVM可用的堆的数量,或者对应用程序进行某种更改,使它使用较少的内存.但是,在许多情况下,OutOfMemoryError都是内存泄漏的信号.一种查明方法是不间断地监控GC的活动,确定内存使用量是否随着时间增加.如果确实如此,就可能发生了内存泄漏.
分享到:
评论

相关推荐

    JAVA EE WEB开发实例精解

    JAVA EE WEB开发实例精解

    《JAVA办公自动化项目方案精解》光盘

    本书采用当今最流行的Java语言...本书可作为高校计算机软件专业的学生学习使用Java语言,也可作为系统开发人员和工程技术人员的参考书。本书易学易用,每个例子的程序和方法都可以直接引用,是程序员非常好的伴侣。...

    Java编程案例精解源代码

    "Java编程案例精解源代码"提供了丰富的实例,帮助学习者深入理解和掌握Java编程技术。这个压缩包文件包含了与书本配套的完整源代码,为读者提供了实践操作的机会,以加深对理论知识的理解。 首先,我们要了解Java的...

    Java网络编程精解(孙卫琴)电子教案

    总的来说,《Java网络编程精解》全面覆盖了Java网络编程的各个方面,对于想要深入理解和掌握Java网络编程的开发者来说,是一本不可多得的参考资料。通过学习本书,你可以构建起扎实的网络编程基础,并具备开发高效、...

    Java集成开发实例精解

    Java集成开发实例精解Java集成开发实例精解Java集成开发实例精解Java集成开发实例精解Java集成开发实例精解Java集成开发实例精解Java集成开发实例精解Java集成开发实例精解Java集成开发实例精解Java集成开发实例精解...

    Java 集成开发实例精解

    1. **Java虚拟机(JVM)**:Java程序的运行基础,负责解释执行字节码,提供了垃圾回收机制,确保内存管理的高效与安全。理解JVM的工作原理,如类加载机制、内存模型和性能优化,对于提升程序性能至关重要。 2. **...

    Java典型模块精解:电子相册

    在这个Java典型模块精解中,我们将深入探讨如何构建一个功能完备且用户体验良好的电子相册系统。 1. **Java基础**:电子相册的开发离不开Java语言的基础知识,包括类、对象、继承、多态等面向对象编程概念。Java的...

    java编程案例精解

    本资源“Java编程案例精解”旨在通过实际案例深入解析Java编程的各个方面,帮助学习者掌握Java编程的核心技术和实战技巧。 首先,我们要了解Java编程的基础。Java是一种面向对象的编程语言,它的设计目标是具有简单...

    Java知识体系精解

    Java的对象清理主要依靠垃圾回收机制来实现,开发者可以通过System.gc()方法来建议JVM进行垃圾回收,但其执行时机是由JVM决定的。Java的集合框架提供了用于存储和操作对象集合的接口和类。 文件流方面,Java提供了...

    Java编程案例精解

    《Java编程案例精解》是一本深入探讨Java编程实践的书籍,其光盘资料包含了丰富的实例代码和教学资源,旨在帮助读者深入理解Java语言的核心概念和技术。这份资料涵盖了从基础语法到高级特性的广泛内容,适合初学者和...

    Java EE Web开发实例精解完整光盘

    JAVA EE Web应用系统从逻辑上可划分为表现层、业务层和持久层,为了使读者对JAVA EE编程技术获得全面系统的了解,《Java EE Web开发实例精解》以JAVA EE Web应用系统的逻辑加构为主线,通过多个典型工程实例对上述三...

    java网络精解源码

    这份"java网络精解源码"提供了深入理解和实践这些概念的机会。以下将详细阐述Java网络编程的一些关键知识点: 1. **Java网络API**: Java提供了一系列的API用于网络编程,包括Socket、ServerSocket、DatagramSocket...

    Java编程案例精解素材.rar

    本资源“Java编程案例精解素材.rar”包含了一系列实用的Java编程示例,旨在帮助学习者深入理解和掌握Java的核心概念与技术。 1. **使用邮件客户端工具**:JavaMail API是Java中用于处理电子邮件的库,它允许开发者...

    Java 集成开发实例精解源码

    《Java集成开发实例精解源码》是一本深入探讨Java集成开发实践的资源集合,它包含了一系列实际项目中的源代码示例,旨在帮助开发者更好地理解和掌握Java在实际工程中的应用。通过对这些源码的分析和学习,开发者可以...

    java中操作oracle的CLOB字段精解

    Java 中操作 Oracle 的 CLOB 字段精解 Java 中操作 Oracle 的 CLOB 字段是一种常见的操作,在实际开发中,我们经常需要在 Oracle 数据库中存储和读取大型文本数据,这时就需要使用 CLOB(Character Large OBject)...

    Java数据类型精解

    资源:Java数据类型精解 作者:Shenkxiao 版本:1.0 pdf 主要内容: Java数据类型 1.1 基本数据类型 1.2 对象数据类型 1.3 引用数据类型 1.4 数组数据类型 上传理由:基础文档共享,对Java初学者有很大的...

Global site tag (gtag.js) - Google Analytics