Java性能优化之垃圾回收(GC)
事先声明一下:虽说SUN公司已经被Oracle吞并了,但是出于习惯,同时也为了偷懒节省打字,以下仍然称之为SUN公司。
JVM的内 存
在Java虚拟机规范中(具体章节请看http://java.sun.com/docs/books/jvms/second_edition/html/Overview.doc.html#1732 ),提及了如下几种类型的内存空间:
栈内存(Stack):每个线程私有的。
堆 内存(Heap):所有线程公用的。
方法区 (MethodArea):有点像以前常说的“进程代码段”,这里面存放了每个加载类的反射信息、类函 数的代码、编译时常量等信息。
原生方法栈 (NativeMethodStack):主要用于JNI中的原生代码,平时很少涉及。
关 于栈内存(Stack)和堆内存(Heap),已经在上次的帖子中扫盲过了,大伙儿应该有点印象。由于今天咱们要讨论的“垃圾回收”话题,主要是和堆内存 (Heap)有关。其它的几个玩意儿不是今天讨论的重点。等以后有空了,或许可以单独聊一下。
垃圾回收机制简介
其实Java虚 拟 机规范中并未规定垃圾回收的相关细节。垃圾回收具体该怎么搞,完全取决于各个JVM的设计者。所以,不同的JVM之间,GC的行为可能会有一定的差异。下 面咱拿SUN官方的JVM来简单介绍一下GC的机制。
啥时候进行垃圾回收?
一般情况下,当JVM发现堆内存比较紧张、不太够用时,它就 会 着手进行垃圾回收工作。但是大伙儿要认清这样一个残酷的事实:JVM进行GC的时间点是无法准确预知的。因为GC启动的时刻会受到各种运行环境因素的影 响,随机性太大。
虽说咱们无法准确预知,但如果你想知道每次垃圾回收执行的情况,还是蛮方便的。可以通过JVM的命令行参数 “-XX:+PrintGC”把相关信息打印出来。
另外,调用System.gc()只是建议JVM进行GC。至于JVM到底会不会做,那就不好 说啦。通常不建议自己手动调用System.gc(),还是让JVM自行决定比较好。另外,使用JVM命令行参数 “-XX:+DisableExplicitGC”可以让System.gc()不起作用。
谁来负责垃圾回收?
一般情况下,JVM会有一 个或多个专门的垃圾回收线程,由它们负责清理回收垃圾内存。
如何发现垃圾对象?
垃圾回收线程会从“根集(RootSet)”开始进行对 象 引用的遍历。所谓的“根集”,就是正在运行的线程中,可以访问的引用变量的集合(比如所有线程当前函数的参数和局部变量、当前类的成员变量等等)。垃圾回 收线程先找出被根集直接引用的所有对象(不妨叫集合1),然后再找出被集合1直接引用的所有对象(不妨叫集合2),然后再找出被集合2直接引用的所有对 象......如此循环往复,直到把能遍历到的对象都遍历完。
凡是从根集通过上述遍历可以到达的对象,都称为可达对象或有效对象;反之,则是不 可 达对象或失效对象(也就是垃圾)。
如何清理/回收垃圾?
通过上述阶段,就把垃圾对象都找出来。然后垃圾回收线程会进行相应的清理和回 收工 作,包括:把垃圾内存重新变为可用内存、进行内存的整理以消除内存碎片、等等。这个过程会涉及到若干算法,有兴趣的同学可以参见“这里”。限于篇幅,咱就 不深入聊了。
分代
早期的JVM是不采用分代技术的,所有被GC管 理的对象都存放在同一个堆里面。这么做的缺点比较明显:每次进行GC都要 遍历所有对象,开销很大。其实大部分的对象生命周期都很短(短命对象),只有少数对象比较长寿;在这些短命对象中,又只有少数对象占用的内存空间大;其它 大量的短命对象都属于小对象(很符合二八原理)。
有鉴于此,从JDK1.2之后,JVM开始使用分代的垃圾回收 (GenerationalGarbageCollection)。JVM把GC相关的内存分为年老代(Tenured)和年轻代(Nursery)、持 久代(Permanent,对应于JVM规范的方法区)。大部分对象在刚创建时,都位于年轻代。如果某对象经历了几轮GC还活着(大龄对象),就把它移到 年老代。另外,如果某个对象在创建时比较大,可能就直接被丢到年老代。经过这种策略,使得年轻代总是保存那些短命的小对象。在空间尺寸上,年轻代相对较 小,而年老代相对较大。
因为有了分代技术,JVM的GC也相应分为两种:主要收集(MajorCollection)和次要收集 (MinorCollection)。主要收集同时清理年老代和年轻代,因此开销很大,不常进行;次要收集仅仅清理年轻代,开销很小,经常进行。
GC 对性能会有啥影响?
刚才介绍了GC的大致原理,那GC对性能会造成哪些影响捏?主要有如下几个方面:
造成当前运行线程的停顿
早 期 的GC比较弱智。在它工作期间,所有其它的线程都被暂停(以免影响垃圾回收工作)。等到GC干完活,其它线程再继续运行。所以,早期JDK的GC一旦开始 工作,整个程序就会陷入假死状态,失去各种响应。
经过这些年的技术改进(包括采用分代技术),从JDK1.4开始,GC已经比较精明了。在它干 活 期间,只是偶尔暂停一下其它线程的运行(从长时间假死变为暂时性休克)。
遍历对象引用的开销
试想如果JVM中的对象很多,那遍历完所 有可 达对象肯定是比较费劲的工作,这个开销可不小。
清理和回收垃圾的开销
遍历完对象引用之后,对垃圾的清理和回收也有较大的开销。这部 分开销 可能包括复制内存块、更新对象引用等等。
几种收集器
两个性能指标
因为今天聊的是性能的话题,必然会提到衡量GC 性能的两 个重要指标:吞吐量(Throughput)和停顿时间(PauseTime)。吞吐量这个词不是很直观,解释一下:就是JVM不用于GC的时间占总时间 的比率。吞吐量是越大越好,停顿时间是越小越好。
不同的应用程序对这两个指标的关注点不一样(后面具体会说),也就是所谓的“众口难调”。很多 JVM厂商为了迎合“众口”,不得不提供多种几种垃圾收集器供使用者选择。不同的收集器,采用的收集策略是不一样的,下面具体介绍。
串行收集器 (SerialCollector)
使用命令行选项“-XX:+UseSerialGC”指定。
这种收集器是最传统的收集器。它使用单 线 程进行垃圾回收,对于单CPU机器比较合适。另外,小型应用或者对上述两个指标没有特殊要求的,可以使用串行收集器。
并行收集器 (ParallelThroughputCollector)
顾名思义,这种收集器使用多个线程进行垃圾回收以达到高吞吐量。垃圾回收线程的数量 通过命令行选项“-XX:ParallelGCThreads=n”指定。可以设置该数值以便充分利用多CPU/多核。
当使用命令行选项 “-XX:+UseParallelGC”时:它会针对年轻代使用多个垃圾回收线程,对年老代依然使用单个线程的串行方式。此选项最早在JDK1.5引 入。
当使用命令行选项“-XX:+UseParallelOldGC”时:它针对年轻代和年老代都使用多个垃圾回收线程的方式。不过此选项从 JDK1.6才开始引入。
并发收集器(ConcurrentLowPauseCollector)
使用命令行选项 “-XX:+UseConcMarkSweepGC”指定。
这种收集器优先保证程序的响应。它会尽量让垃圾回收线程和应用自身的线程同时运行,从 而降低停顿时间。此选项从JDK1.4.1开始支持。
增量收集器(IncrementalCollector)
自从JDK1.4.2以 来,SUN官方就停止维护该收集器了。所以俺就节省点口水,不多说了。
如何降低GC的影响?
尽量减少堆内存的使用
由于 GC是针对存储在堆内存的对象进行的。咱们如果在程序中减少引用对象的分配(也就相应降低堆内存分配),那对于提高GC的性能是很有帮助滴。上次“字符串 过滤实战”的帖子给出了一个例子,示范了如何通过降低堆内存的分配次数来提升性能。
设置合适的堆内存大小
JVM的堆内存是有讲 究 的,不能太大也不能太小。如果堆内存太小,JVM老是感觉内存不够用,可能会导致频繁进行垃圾回收,影响了性能;如果堆内存太大,以至于操作系统的大部分 物理内存都被JVM自个儿霸占了,那可能会影响其它应用程序甚至操作系统本身的性能。
另外,年轻代的大小(或者说年轻代与年老代的比值)对于 GC 的性能也有明显影响。如果年轻代太小,可能导致次要收集很频繁;如果年轻代太大,导致次要收集的停顿很明显。
JVM提供了若干和堆内存大小 相关的 命令行选项,具体如下:
------------------------------
-Xms设置初始堆内存
-Xmx 设置最大 堆内存
-Xmn设置年轻代的大小
-XX:NewRatio=n设置年轻代与年老代的比例为“n”
-XX:NewSize=n 设置 年轻代大小为“n”
------------------------------
一般情况下,JVM的默认参数值已经够用。所以 没事儿 别轻易动用上述选项。如果你非调整不可,一定要做深入的性能对比测试,保证调整后的性能确实优于默认参数值。
吞吐量和停顿的取舍
前 面提到了不同应用的众口难调。常见的口味有两种:(1)看重吞吐量,对停顿时间无所谓;(2)侧重于停顿时间。
对于某些在后台的、单纯运算密集 型 的应用,属于第一种。比如某些科学计算的应用。这时候建议使用并行收集器。
对于涉及用户UI交互的、实时性要求比较高、程序需要快速响应的, 属于 第二种。比如某些桌面游戏、某些电信交换系统。这时候建议使用并发收集器。
相关的参考资料
GC调优资料
SUN官方 提供了 若干关于JVM垃圾回收调优的说明文档,JDK1.4.2请看“这里”;JDK1.5 请看“这里”;JDK1.6请看“这里”。
JVM命令行选项 说明
这是SUN公司内的某个有心人整理的各种命令行参数大全,在 “这里”。包括有每个参数所适用的JDK版本。
虚拟机规范
“这里 ”是SUN官方的JVM规范。
转自:http://blog.sina.com.cn/s/blog_6d003f3f0100lmkn.html
分享到:
相关推荐
其中,垃圾回收机制(Garbage Collection, GC)是Java虚拟机(JVM)的一项重要特性,它能够自动检测并回收不再使用的对象占用的内存空间,从而有效避免了内存泄漏问题。本文将详细介绍Java中的垃圾回收机制及其工作原理...
本文将介绍Java虚拟机的使用和优化,包括Java虚拟机的特性、垃圾回收机制、性能优化方法等。 Java虚拟机的特性 Java虚拟机是Java语言的核心组件之一,它负责将Java源代码编译成字节码,并在不同的平台上解释执行...
### Java与C#的垃圾回收机制 #### 一、引言 在现代编程语言中,内存管理是一项重要的功能,能够显著提升程序的稳定性和效率。本文将深入对比Java与C#这两种广泛使用的编程语言中的垃圾回收机制,帮助开发者更好地...
垃圾回收机制是Java语言与生俱来的特性之一,与C/C++等语言相比,Java的内存管理更简单、更安全。 Java虚拟机规范还定义了类加载机制,即在JVM启动时或运行过程中动态加载类到内存中。类加载器在运行Java程序时按需...
Java作为一种广泛使用的编程语言,其垃圾回收机制是其重要的特性之一,能够自动管理内存,大大简化了开发者的负担。本文将深入探讨Java中的垃圾回收机制,包括其工作原理、常用算法以及实际应用中的注意事项。 ####...
《深入Java虚拟机》这本书是Java开发者深入了解JVM(Java Virtual Machine)的必备经典之作。它详尽地探讨了Java虚拟机的工作原理、内存管理、类加载机制、字节码执行以及性能优化等多个核心主题,旨在帮助开发者...
此外,JVM还实现了垃圾回收机制,自动管理内存,避免了程序员手动管理内存的麻烦。 JVM还有许多优化技术,如分代垃圾收集、并行/并发GC、压缩引用、逃逸分析等,这些都对提升Java应用的性能起到了关键作用。对于...
《Java虚拟机规范(JavaSE7版)》是理解Java虚拟机(JVM)运作机制的基石,由Tim Lindholm、Frank Yellin、Gilad Bracha和Alex Buckley等人撰写,后由周志明、吴璞渊和冶秀刚翻译成中文版。该规范不仅对Java开发者至...
而在Java中,这种内存管理的工作由Java虚拟机(JVM)内置的垃圾回收机制自动完成,极大地简化了程序员的工作。 垃圾收集的基本原理在于识别并自动回收那些不再被任何引用指向的对象所占用的内存空间。当一个对象...
Java虚拟机(JVM)的垃圾回收(Garbage Collection,简称GC)机制是Java编程中的一个重要组成部分,它自动管理程序的内存,确保无用的对象能够被有效地释放,从而避免内存泄漏。本文将深入探讨Java垃圾回收的基本...
Java的垃圾回收机制(Garbage Collection,GC)是Java虚拟机(JVM)的一个重要组成部分,它负责自动管理内存的分配和释放,以减轻程序员在内存管理方面的负担,并防止内存泄漏和内存溢出等问题。本文将详细探讨GC的...
垃圾收集(Garbage Collection,简称GC)是Java虚拟机(JVM)自动管理内存的重要功能之一。通过自动识别并回收不再使用的对象所占用的内存空间,GC极大地简化了开发者的编程工作,避免了手动内存管理可能带来的内存...
通过深入学习《Java虚拟机(第二版)》,开发者不仅可以理解Java程序的运行机制,还能掌握性能优化、问题排查等高级技巧,提升自己的编程水平。这本书通常会详细讲解上述知识点,并提供丰富的示例和实践指导,帮助...
《Java虚拟机规范》是Java技术的核心文档之一,它详细描述了Java虚拟机(JVM)的行为,包括其内部结构、数据类型、执行模型、指令集、运行时数据区、垃圾回收机制和安全管理等内容。该规范是Java平台实现的基石,对...