前言
在平时工作过程中,有时会遇到 OutOfMemoryError ,我们知道遇到 Error 一般表明程序存在着严重问题,可能是灾难性的。所以找出是什么原因造成 OutOfMemoryError 非常重要。现在向大家引荐 Eclipse Memory Analyzer tool(MAT) ,来化解我们遇到的难题。如未说明,本文均使用 Java 5.0 on Windows XP SP3 环境。
为什么用 MAT
之前的观点,我认为使用实时 profiling/monitoring 之类的工具,用一种非常实时的方式来分析哪里存在内存泄漏是很正确的。年初使用了某 profiler 工具测试消息中间件中存在的内存泄漏,发现在吞吐量很高的时候 profiler 工具自己也无法响应,这让人很头痛。后来了解到这样的工具本身就要消耗性能,且在某些条件下还发现不了泄漏。所以,分析离线数据就非常重要了, MAT 正是这样一款工具。
为何会内存溢出
我们知道 JVM 根据 generation( 代 ) 来进行 GC ,根据下图所示,一共被分为 young generation( 年轻代 ) 、 tenured generation( 老年代 ) 、 permanent generation( 永久代 , perm gen) , perm gen (或称 Non-Heap 非堆)是个异类,稍后会讲到。注意, heap 空间不包括 perm gen 。
绝大多数的对象都在 young generation 被分配,也在 young generation 被收回,当 young generation 的空间被填满, GC 会进行 minor collection( 次回收 ) ,这次回收不涉及到 heap 中的其他 generation , minor collection 根据 weak generational hypothesis( 弱年代假设 ) 来假设 young generation 中大量的对象都是垃圾需要回收, minor collection 的过程会非常快。 young generation 中未被回收的对象被转移到 tenured generation ,然而 tenured generation 也会被填满,最终触发 major collection( 主回收 ) ,这次回收针对整个 heap ,由于涉及到大量对象,所以比 minor collection 慢得多。
JVM 有三种垃圾回收器,分别是 throughput collector ,用来做并行 young generation 回收,由参数 -XX:+UseParallelGC 启动; concurrent low pause collector ,用来做 tenured generation 并发回收,由参数 -XX:+UseConcMarkSweepGC 启动; incremental low pause collector ,可以认为是默认的垃圾回收器。不建议直接使用某种垃圾回收器,最好让 JVM 自己决断,除非自己有足够的把握。
Heap 中各 generation 空间是如何划分的?通过 JVM 的 -Xmx=n 参数可指定最大 hea p 空间,而 -Xms=n
则是指定
最小 heap 空间。在 JVM 初始化的时候,如果最小 heap 空间小于最大 heap 空间的话,如上图所示 JVM 会把未用到的空间标注为 Vi rtual 。除了这两个参数还有 -XX:MinHeapFreeRatio=n 和 -XX:MaxHeapFreeRatio=n 来分别控制最大、最小的剩余空间与活动对象之比例。在 32 位 Solaris SPARC 操作系统下,默认值如下,在 32 位 windows xp 下,默认值也差不多。
参数 |
默认值 |
MinHeapFreeRatio |
40 |
MaxHeapFreeRatio |
70 |
-Xms |
3670k |
-Xmx |
64m |
由于 tenured generation 的 major collection 较慢,所以 tenured generation 空间小于 young generation 的话,会造成频繁的 major collection ,影响效率。 Server JVM 默认的 young generation 和 tenured generation 空间比例为 1:2 ,也就是说 young generation 的 eden 和 survivor 空间之和是整个 heap (当然不包括 perm gen )的三分之一,该比例可以通过 -XX:NewRatio=n 参数来控制,而 Client JVM 默认的 -XX:NewRatio 是 8 。至于调整 young generation 空间大小的 NewSize=n 和 MaxNewSize=n 参数就不讲了,请参考后面的资料。
young generation 中幸存的对象被转移到 tenured generation ,但不幸的是 concurrent collector 线程在这里进行 major collection ,而在回收任务结束前空间被耗尽了,这时将会发生 Full Collections(Full GC) ,整个应用程序都会停止下来直到回收完成。 Full GC 是高负载生产环境的噩梦 ……
现在来说说异类 perm gen ,它是 JVM 用来存储无法在 Java 语言级描述的对象,这些对象分别是类和方法数据(与 class loader 有关)以及 interned strings( 字符串驻留 ) 。一般 32 位 OS 下 perm gen 默认 64m ,可通过参数 -XX:MaxPermSize=n 指定, JVM Memory Structure 一文说,对于这块区域,没有更详细的文献了,神秘。
回到问题“为何会内存溢出?”。
要回答这个问题又要引出另外一个话题,既什么样的对象 GC 才会回收?当然是 GC 发现通过任何 reference chain( 引用链 ) 无法访问某个对象的时候,该对象即被回收。名词 GC Roots 正是分析这一过程的起点,例如 JVM 自己确保了对象的可到达性 ( 那么 JVM 就是 GC Roots) ,所以 GC Roots 就是这样在内存中保持对象可到达性的,一旦不可到达,即被回收。通常 GC Roots 是一个在 current thread( 当前线程 ) 的 call stack( 调用栈 ) 上的对象(例如方法参数和局部变量),或者是线程自身或者是 system class loader( 系统类加载器 ) 加载的类以及 native code( 本地代码 ) 保留的活动对象。所以 GC Roots 是分析对象为何还存活于内存中的利器。 知道了什么样的对象 GC 才会回收后,再来学习下对象引用都包含哪些吧。
从最强到最弱,不同的引用(可到达性)级别反映了对象的生命周期。
l Strong Ref( 强引用 ) :通常我们编写的代码都是 Strong Ref ,于此对应的是强可达性,只有去掉强可达,对象才被回收。
l Soft Ref( 软引用 ) :对应软可达性,只要有足够的内存,就一直保持对象,直到发现内存吃紧且没有 Strong Ref 时才回收对象。一般可用来实现缓存,通过 java.lang.ref.SoftReference 类实现。
l Weak Ref( 弱引用 ) :比 Soft Ref 更弱,当发现不存在 Strong Ref 时,立刻回收对象而不必等到内存吃紧的时候。通过 java.lang.ref.WeakReference 和 java.util.WeakHashMap 类实现。
l Phantom Ref( 虚引用 ) :根本不会在内存中保持任何对象,你只能使用 Phantom Ref 本身。一般用于在进入 finalize() 方法后进行特殊的清理过程,通过 java.lang.ref.PhantomReference 实现。
有了上面的种种我相信很容易就能把 heap 和 perm gen 撑破了吧,是的利用 Strong Ref ,存储大量数据,直到 heap 撑破;利用 interned strings (或者 class loader 加载大量的类)把 perm gen 撑破。
关于 shallow size 、 retained size
Shallow size 就是对象本身占用内存的大小,不包含对其他对象的引用,也就是对象头加成员变量(不是成员变量的值)的总和 。在 32 位系统上,对象头占用 8 字节, int 占用 4 字节,不管成员变量(对象或数组)是否引用了其他对象(实例)或者赋值为 null 它始终占用 4 字节。故此,对于 String 对象实例来说,它有三个 int 成员( 3*4=12 字节)、一个 char[] 成员( 1*4=4 字节)以及一个对象头( 8 字节),总共 3*4 +1*4+8=24 字节。根据这一原则,对 String a=”rosen jiang” 来说,实例 a 的 shallow size 也是 24 字节(很多人对此有争议,请看官甄别并留言给我) 。
Retained size 是该对象自己的 shallow size ,加上从该对象能直接或间接访问到对象的 shallow size 之和。换句话说, retained size 是该对象被 GC 之后所能回收到内存的总和 。为了更好的理解 retained size ,不妨看个例子。
把内存中的对象看成下图中的节点,并且对象和对象之间互相引用。这里有一个特殊的节点 GC Roots ,正解!这就是 reference chain 的起点。
从 obj1 入手,上图中蓝色节点代表仅仅只有通过 obj1 才能直接或间接访问的对象。因为可以通过 GC Roots 访问,所以左图的 obj3 不是蓝色节点;而在右图却是蓝色,因为它已经被包含在 retained 集合内。
所以对于左图, obj1 的 retained size 是 obj1 、 obj2 、 obj4 的 shallow size 总和;右图的 retained size 是 obj1 、 obj2 、 obj3 、 obj4 的 shallow size 总和 。 obj2 的 retained size 可以通过相同的方式计算。
Heap Dump
heap dump 是特定时间点, java 进程的内存快照 。有不同的格式来存储这些数据,总的来说包含了快照被触发时 java 对象和类在 heap 中的情况。由于快照只是一瞬间的事情,所以 heap dump 中无法包含一个对象在何时、何地(哪个方法中)被分配这样的信息。
在不同平台和不同 java 版本有不同的方式获取 heap dump ,而 MAT 需要的是 HPROF 格式的 heap dump 二进制文件。想无需人工干预的话,要这样配置 JVM 参数: -XX:-HeapDumpOnOutOfMemoryError ,当错误发生时,会自动生成 heap dump ,在生产环境中,只有用这种方式。如果你想自己控制什么时候生成 heap dump ,在 Windows+JDK6 环境中可利用 JConsole 工具,而在 Linux 或者 Mac OS X 环境下均可使用 JDK5 、 6 自带的 jmap 工具。当然,还可以配置 JVM 参数: -XX:+HeapDumpOnCtrlBreak ,也就是在控制台使用 Ctrl+Break 键来生成 heap dump 。由于我是 windows+JDK5 ,所以选择了 -XX:-HeapDumpOnOutOfMemoryError 这种方式,更多配置请参考 MAT Wiki 。
参考资料
Strong,Soft,Weak,Phantom Reference
Tuning Garbage Collection with the 5.0 Java[tm] Virtual Machine
Understanding Weak References译文
请注意!引用、转贴本文应注明原作者:Rosen Jiang 以及出处: http://www.blogjava.net/rosen
相关推荐
为了分析内存泄露,需要准备 heap dump 文件。下面是一个简单的例子,使用了 Pilot 类和 OOMHeapTest 类。Pilot 类是一个简单的 Java 类,具有两个字段:name 和 age。OOMHeapTest 类是用于撑破 heap dump 的,它会...
MAT是分析Java堆内存的一个工具,全称是 The Eclipse Memory Analyzer Tool,用来帮助分析内存泄漏和减少内存消耗。使用MAT分析Java堆快照,可以快速计算出对象的保留大小(Retained Sizes),查找到阻止对象被回收...
MAT(Memory Analyzer Tool)是IBM开发的一款强大的Java内存分析工具,专用于诊断和解决Java应用程序中的内存泄漏问题。MAT JVM内存分析工具可以帮助开发者深入理解Java虚拟机(JVM)的内存管理机制,通过分析堆内存...
通过深入分析内存分配,MAT能找出可能存在的内存泄漏点和不必要的对象引用,从而帮助开发者改善应用的性能和稳定性。 描述中提到的与“AS的.hprof文件配合使用”,这里的“AS”通常指的是Android Studio,它是...
MAT(Memory Analyzer Tool)是由Eclipse基金会开发的一款强大的Java内存分析工具,它专门用于检测和分析Java应用的内存泄漏问题。 MAT提供了多种功能来帮助开发者诊断和解决内存泄漏问题。首先,MAT可以生成详细的...
MAT是IBM开发的一款专门用于分析Java heap dump的工具,它可以帮助开发者深入理解内存分配、对象生命周期以及内存泄漏的原因。以下我们将逐步介绍如何运用MAT进行分析: 1. **获取堆内存快照** 当Tomcat出现内存...
MAT,全称Memory Analyzer Tool,是由IBM开发的一款强大的Java堆内存分析工具,尤其适用于解决Java应用程序中的内存泄漏和性能优化问题。在Windows 64位操作系统环境下,MAT提供了深入洞察内存消耗情况的能力,帮助...
"mac_mat android内存泄漏分析工具"就是这样一个针对Android平台的工具,特别适合在Mac环境下对应用进行内存泄漏检测。 MAT(Memory Analyzer Tool)是由Eclipse基金会开发的一个强大的Java内存分析工具。尽管主要...
MAT,全称Memory Analyzer Tool,是IBM开发的一款强大的Java堆内存分析工具,它主要用于诊断Java应用程序的内存泄漏问题,以及优化内存使用效率。MAT通过深入分析堆转储(heap dump)文件,帮助开发者识别和解决可能...
"MAT分析内存优化包"是一个专门针对内存管理的工具集合,它包含了MAT(Memory Analyzer Tool)的64位版本以及相关的内存泄漏示例和HProf内存分析工具文件。下面我们将详细探讨这些工具及其在内存优化中的应用。 MAT...
MAT(Memory Analyzer Tool)是Eclipse项目开发的一款强大的Java内存分析工具,主要用于诊断Java应用程序的内存泄漏和性能问题。在标题中提到的“Eclipse Memory Analyzer Version 1.7.0.rar”是一个压缩包,其中...
总结起来,MAT作为一款强大的Java内存分析工具,具备了深度分析、自动化检测内存泄漏、直观的内存结构展示等功能,是Java开发者必备的调试利器。无论是排查生产环境的内存问题,还是在开发阶段优化代码,MAT都能提供...
MAT是Eclipse项目的一部分,它是一款免费且开源的工具,专门用于分析Java堆转储(Heap Dump)文件,帮助开发者识别内存泄漏、分析内存占用情况以及优化内存使用。MAT提供了丰富的功能和视图,使得复杂的内存问题变得...
MAT(Memory Analyzer Tool)是IBM开发的一款强大的Java虚拟机(JVM)内存分析工具,它可以帮助开发者诊断和解决Java应用程序的内存泄漏问题,优化内存使用效率。MAT以其丰富的功能、直观的用户界面以及详尽的分析...
MAT(Memory Analyzer Tool)是一款功能强大且易于使用的内存分析工具,它基于Eclipse平台,主要用于帮助开发人员定位和解决Java应用程序中的内存泄漏问题。MAT能够快速地分析Java堆中的对象分布、对象间的引用关系...
MAT(Memory Analyzer Tool)是由Eclipse基金会开发的一款强大的Java堆内存分析工具,虽然在Android Studio中内置了内存分析功能,但若需要更深入的内存泄漏检测和性能优化,MAT提供了更为专业的解决方案。MAT工具...
总之,MAT是一款强大的Java内存分析工具,2016年12月15日的版本是当时较新的版本,对于优化Java应用的内存管理,防止内存泄漏,提高应用性能有着重要作用。了解和熟练使用MAT,对Java开发者来说是提高工作效率和保证...
MAT(Memory Analyzer Tool)是Eclipse基金会开发的一款强大的Java内存分析工具,专为解决Java应用程序的内存泄漏和性能优化问题而设计。它提供了丰富的功能,包括堆dump分析、对象引用链追踪、内存消耗报告等,使得...
4. **泄露嫌疑人报告**:MAT会根据分析结果生成一份详细的报告,列出最有可能导致内存泄漏的嫌疑对象及其引用链。 5. **碎片分析**:检查堆内是否存在大量的不可达对象,这些对象由于各种引用导致无法被垃圾回收,...
这有助于找出内存泄漏的原因,因为如果一个对象被大量其他对象所引用,即使它不再被程序使用,也无法被垃圾收集器回收。 4. ** Leak Suspects报告**:MAT自动生成的Leak Suspects报告会列出可能的内存泄漏源,包括...