`

理论与实践: 用弱引用堵住内存泄漏

    博客分类:
  • java
阅读更多
<!---->
理论与实践: 用弱引用堵住内存泄漏
agamem 转贴   更新:2005-12-30 08:50:31  版本: 1.0   
<!---->

  虽然用 Java? 语言编写的程序在理论上是不会出现“内存泄漏”的,但是有时对象在不再作为程序的逻辑状态的一部分之后仍然不被垃圾收集。本月,负责保障应用程序健康的工程师 Brian Goetz 探讨了无意识的对象保留的常见原因,并展示了如何用弱引用堵住泄漏。

  要让垃圾收集(GC)回收程序不再使用的对象,对象的逻辑 生命周期(应用程序使用它的时间)和对该对象拥有的引用的实际 生命周期必须是相同的。在大多数时候,好的软件工程技术保证这是自动实现的,不用我们对对象生命周期问题花费过多心思。但是偶尔我们会创建一个引用,它在内存中包含对象的时间比我们预期的要长得多,这种情况称为无意识的对象保留(unintentional object retention)。

  全局 Map 造成的内存泄漏

  无意识对象保留最常见的原因是使用 Map 将元数据与临时对象(transient object)相关联。假定一个对象具有中等生命周期,比分配它的那个方法调用的生命周期长,但是比应用程序的生命周期短,如客户机的套接字连接。需要将一些元数据与这个套接字关联,如生成连接的用户的标识。在创建 Socket 时是不知道这些信息的,并且不能将数据添加到 Socket 对象上,因为不能控制 Socket 类或者它的子类。这时,典型的方法就是在一个全局 Map 中存储这些信息,如清单 1 中的 SocketManager 类所示:

  清单 1. 使用一个全局 Map 将元数据关联到一个对象

public class SocketManager {
    private Map<Socket,User> m = new HashMap<Socket,User>();

    public void setUser(Socket s, User u) {
        m.put(s, u);
    }
    public User getUser(Socket s) {
        return m.get(s);
    }
    public void removeUser(Socket s) {
        m.remove(s);
    }
}

SocketManager socketManager;
...
socketManager.setUser(socket, user);

  这种方法的问题是元数据的生命周期需要与套接字的生命周期挂钩,但是除非准确地知道什么时候程序不再需要这个套接字,并记住从 Map 中删除相应的映射,否则,Socket 和 User 对象将会永远留在 Map 中,远远超过响应了请求和关闭套接字的时间。这会阻止 Socket 和 User 对象被垃圾收集,即使应用程序不会再使用它们。这些对象留下来不受控制,很容易造成程序在长时间运行后内存爆满。除了最简单的情况,在几乎所有情况下找出什么时候 Socket 不再被程序使用是一件很烦人和容易出错的任务,需要人工对内存进行管理。

  找出内存泄漏

  程序有内存泄漏的第一个迹象通常是它抛出一个 OutOfMemoryError,或者因为频繁的垃圾收集而表现出糟糕的性能。幸运的是,垃圾收集可以提供能够用来诊断内存泄漏的大量信息。如果以 -verbose:gc 或者 -Xloggc 选项调用 JVM,那么每次 GC 运行时在控制台上或者日志文件中会打印出一个诊断信息,包括它所花费的时间、当前堆使用情况以及恢复了多少内存。记录 GC 使用情况并不具有干扰性,因此如果需要分析内存问题或者调优垃圾收集器,在生产环境中默认启用 GC 日志是值得的。

  有工具可以利用 GC 日志输出并以图形方式将它显示出来,JTune 就是这样的一种工具(请参阅 参考资料)。观察 GC 之后堆大小的图,可以看到程序内存使用的趋势。对于大多数程序来说,可以将内存使用分为两部分:baseline 使用和 current load 使用。对于服务器应用程序,baseline 使用就是应用程序在没有任何负荷、但是已经准备好接受请求时的内存使用,current load 使用是在处理请求过程中使用的、但是在请求处理完成后会释放的内存。只要负荷大体上是恒定的,应用程序通常会很快达到一个稳定的内存使用水平。如果在应用程序已经完成了其初始化并且负荷没有增加的情况下,内存使用持续增加,那么程序就可能在处理前面的请求时保留了生成的对象。

  清单 2 展示了一个有内存泄漏的程序。MapLeaker 在线程池中处理任务,并在一个 Map 中记录每一项任务的状态。不幸的是,在任务完成后它不会删除那一项,因此状态项和任务对象(以及它们的内部状态)会不断地积累。

  清单 2. 具有基于 Map 的内存泄漏的程序

public class MapLeaker {
    public ExecutorService exec = Executors.newFixedThreadPool(5);
    public Map<Task, TaskStatus> taskStatus
        = Collections.synchronizedMap(new HashMap<Task, TaskStatus>());
    private Random random = new Random();

    private enum TaskStatus { NOT_STARTED, STARTED, FINISHED };

    private class Task implements Runnable {
        private int[] numbers = new int[random.nextInt(200)];

        public void run() {
            int[] temp = new int[random.nextInt(10000)];
            taskStatus.put(this, TaskStatus.STARTED);
            doSomeWork();
            taskStatus.put(this, TaskStatus.FINISHED);
        }
    }

    public Task newTask() {
        Task t = new Task();
        taskStatus.put(t, TaskStatus.NOT_STARTED);
        exec.execute(t);
        return t;
    }
}

  图 1 显示 MapLeaker GC 之后应用程序堆大小随着时间的变化图。上升趋势是存在内存泄漏的警示信号。(在真实的应用程序中,坡度不会这么大,但是在收集了足够长时间的 GC 数据后,上升趋势通常会表现得很明显。)



  图 1. 持续上升的内存使用趋势

  确信有了内存泄漏后,下一步就是找出哪种对象造成了这个问题。所有内存分析器都可以生成按照对象类进行分解的堆快照。有一些很好的商业堆分析工具,但是找出内存泄漏不一定要花钱买这些工具 ?? 内置的 hprof 工具也可完成这项工作。要使用 hprof 并让它跟踪内存使用,需要以 -Xrunhprof:heap=sites 选项调用 JVM.

  清单 3 显示分解了应用程序内存使用的 hprof 输出的相关部分。(hprof 工具在应用程序退出时,或者用 kill -3 或在 Windows 中按 Ctrl+Break 时生成使用分解。)注意两次快照相比,Map.Entry、Task 和 int[] 对象有了显著增加。

  请参阅 清单 3.

  清单 4 展示了 hprof 输出的另一部分,给出了 Map.Entry 对象的分配点的调用堆栈信息。这个输出告诉我们哪些调用链生成了 Map.Entry 对象,并带有一些程序分析,找出内存泄漏来源一般来说是相当容易的。

  清单 4. HPROF 输出,显示 Map.Entry 对象的分配点

TRACE 300446:
 java.util.HashMap$Entry.<init>(<Unknown Source>:Unknown line)
 java.util.HashMap.addEntry(<Unknown Source>:Unknown line)
 java.util.HashMap.put(<Unknown Source>:Unknown line)
 java.util.Collections$SynchronizedMap.put(<Unknown Source>:Unknown line)
 com.quiotix.dummy.MapLeaker.newTask(MapLeaker.java:48)
 com.quiotix.dummy.MapLeaker.main(MapLeaker.java:64)

  弱引用来救援了

  SocketManager 的问题是 Socket-User 映射的生命周期应当与 Socket 的生命周期相匹配,但是语言没有提供任何容易的方法实施这项规则。这使得程序不得不使用人工内存管理的老技术。幸运的是,从 JDK 1.2 开始,垃圾收集器提供了一种声明这种对象生命周期依赖性的方法,这样垃圾收集器就可以帮助我们防止这种内存泄漏 ?? 利用弱引用。

  弱引用是对一个对象(称为 referent)的引用的持有者。使用弱引用后,可以维持对 referent 的引用,而不会阻止它被垃圾收集。当垃圾收集器跟踪堆的时候,如果对一个对象的引用只有弱引用,那么这个 referent 就会成为垃圾收集的候选对象,就像没有任何剩余的引用一样,而且所有剩余的弱引用都被清除。(只有弱引用的对象称为弱可及(weakly reachable)。)

  WeakReference 的 referent 是在构造时设置的,在没有被清除之前,可以用 get() 获取它的值。如果弱引用被清除了(不管是 referent 已经被垃圾收集了,还是有人调用了 WeakReference.clear()),get() 会返回 null.相应地,在使用其结果之前,应当总是检查 get() 是否返回一个非 null 值,因为 referent 最终总是会被垃圾收集的。

  用一个普通的(强)引用拷贝一个对象引用时,限制 referent 的生命周期至少与被拷贝的引用的生命周期一样长。如果不小心,那么它可能就与程序的生命周期一样 ?? 如果将一个对象放入一个全局集合中的话。另一方面,在创建对一个对象的弱引用时,完全没有扩展 referent 的生命周期,只是在对象仍然存活的时候,保持另一种到达它的方法。

  弱引用对于构造弱集合最有用,如那些在应用程序的其余部分使用对象期间存储关于这些对象的元数据的集合 ?? 这就是 SocketManager 类所要做的工作。因为这是弱引用最常见的用法,WeakHashMap 也被添加到 JDK 1.2 的类库中,它对键(而不是对值)使用弱引用。如果在一个普通 HashMap 中用一个对象作为键,那么这个对象在映射从 Map 中删除之前不能被回收,WeakHashMap 使您可以用一个对象作为 Map 键,同时不会阻止这个对象被垃圾收集。清单 5 给出了 WeakHashMap 的 get() 方法的一种可能实现,它展示了弱引用的使用:

  清单 5. WeakReference.get() 的一种可能实现

public class WeakHashMap<K,V> implements Map<K,V> {

    private static class Entry<K,V> extends WeakReference<K>
      implements Map.Entry<K,V> {
        private V value;
        private final int hash;
        private Entry<K,V> next;
        ...
    }

    public V get(Object key) {
        int hash = getHash(key);
        Entry<K,V> e = getChain(hash);
        while (e != null) {
            K eKey= e.get();
            if (e.hash == hash && (key == eKey || key.equals(eKey)))
                return e.value;
            e = e.next;
        }
        return null;
    }

  调用 WeakReference.get() 时,它返回一个对 referent 的强引用(如果它仍然存活的话),因此不需要担心映射在 while 循环体中消失,因为强引用会防止它被垃圾收集。WeakHashMap 的实现展示了弱引用的一种常见用法 ?? 一些内部对象扩展 WeakReference.其原因在下面一节讨论引用队列时会得到解释。

  在向 WeakHashMap 中添加映射时,请记住映射可能会在以后“脱离”,因为键被垃圾收集了。在这种情况下,get() 返回 null,这使得测试 get() 的返回值是否为 null 变得比平时更重要了。

  用 WeakHashMap 堵住泄漏

  在 SocketManager 中防止泄漏很容易,只要用 WeakHashMap 代替 HashMap 就行了,如清单 6 所示。(如果 SocketManager 需要线程安全,那么可以用 Collections.synchronizedMap() 包装 WeakHashMap)。当映射的生命周期必须与键的生命周期联系在一起时,可以使用这种方法。不过,应当小心不滥用这种技术,大多数时候还是应当使用普通的 HashMap 作为 Map 的实现。

  清单 6. 用 WeakHashMap 修复 SocketManager

public class SocketManager {
    private Map<Socket,User> m = new WeakHashMap<Socket,User>();

    public void setUser(Socket s, User u) {
        m.put(s, u);
    }
    public User getUser(Socket s) {
        return m.get(s);
    }
}

  引用队列

  WeakHashMap 用弱引用承载映射键,这使得应用程序不再使用键对象时它们可以被垃圾收集,get() 实现可以根据 WeakReference.get() 是否返回 null 来区分死的映射和活的映射。但是这只是防止 Map 的内存消耗在应用程序的生命周期中不断增加所需要做的工作的一半,还需要做一些工作以便在键对象被收集后从 Map 中删除死项。否则,Map 会充满对应于死键的项。虽然这对于应用程序是不可见的,但是它仍然会造成应用程序耗尽内存,因为即使键被收集了,Map.Entry 和值对象也不会被收集。

  可以通过周期性地扫描 Map,对每一个弱引用调用 get(),并在 get() 返回 null 时删除那个映射而消除死映射。但是如果 Map 有许多活的项,那么这种方法的效率很低。如果有一种方法可以在弱引用的 referent 被垃圾收集时发出通知就好了,这就是引用队列 的作用。

  引用队列是垃圾收集器向应用程序返回关于对象生命周期的信息的主要方法。弱引用有两个构造函数:一个只取 referent 作为参数,另一个还取引用队列作为参数。如果用关联的引用队列创建弱引用,在 referent 成为 GC 候选对象时,这个引用对象(不是 referent)就在引用清除后加入 到引用队列中。之后,应用程序从引用队列提取引用并了解到它的 referent 已被收集,因此可以进行相应的清理活动,如去掉已不在弱集合中的对象的项。(引用队列提供了与 BlockingQueue 同样的出列模式 ?? polled、timed blocking 和 untimed blocking.)

  WeakHashMap 有一个名为 expungeStaleEntries() 的私有方法,大多数 Map 操作中会调用它,它去掉引用队列中所有失效的引用,并删除关联的映射。清单 7 展示了 expungeStaleEntries() 的一种可能实现。用于存储键-值映射的 Entry 类型扩展了 WeakReference,因此当 expungeStaleEntries() 要求下一个失效的弱引用时,它得到一个 Entry.用引用队列代替定期扫描内容的方法来清理 Map 更有效,因为清理过程不会触及活的项,只有在有实际加入队列的引用时它才工作。

  清单 7. WeakHashMap.expungeStaleEntries() 的可能实现

    private void expungeStaleEntries() {
 Entry<K,V> e;
        while ( (e = (Entry<K,V>) queue.poll()) != null) {
            int hash = e.hash;

            Entry<K,V> prev = getChain(hash);
            Entry<K,V> cur = prev;
            while (cur != null) {
                Entry<K,V> next = cur.next;
                if (cur == e) {
                    if (prev == e)
                        setChain(hash, next);
                    else
                        prev.next = next;
                    break;
                }
                prev = cur;
                cur = next;
            }
        }
    }

  结束语

  弱引用和弱集合是对堆进行管理的强大工具,使得应用程序可以使用更复杂的可及性方案,而不只是由普通(强)引用所提供的“要么全部要么没有”可及性。下个月,我们将分析与弱引用有关的软引用,将分析在使用弱引用和软引用时,垃圾收集器的行为。
分享到:
评论

相关推荐

    Java理论与实践:用弱引用堵住内存泄漏

    【Java理论与实践:用弱引用堵住内存泄漏】这篇文章除了介绍弱引用的概念,还探讨了如何使用弱引用来防止内存泄漏的问题。在Java编程中,内存泄漏并非像C++那样由忘记释放内存引起,而是由于对象生命周期与引用生命...

    Java 理论与实践:用弱引用堵住内存泄漏

    本月,负责保障应用程序健康的工程师 Brian Goetz 探讨了无意识的对象保留的常见原因,并展示了如何用弱引用堵住泄漏。  要让垃圾收集(GC)回收程序不再使用的对象,对象的逻辑 生命周期(应用程序使用它的时间...

    Java弱引用与WeakHashMap

     《Java 理论与实践: 用弱引用堵住内存泄漏》一文也指出了使用全局的Map作为缓存容器时发生的内存泄露问题,介绍了如何使用hprof工具来找出内存泄露,并分析了如何使用弱引用来防止内存泄露,还分析了

    堵住电流泄漏:摩尔定律在晶体管发展中继续有效

    总的来说,堵住电流泄漏和解决晶体管尺寸缩小带来的问题,是推动晶体管持续发展、维持摩尔定律生命力的关键。随着新材料、新技术的出现和应用,未来的信息技术将不断突破现有极限,实现更高的性能和更低的能耗。

    堵住泄漏:当心电容器漏电!

    "堵住泄漏:当心电容器漏电!"这个标题提醒我们,电容的选择不当可能会导致电路性能下降,甚至引发故障。 电容器的基本结构由两片电极板和中间的绝缘介质组成。电容值C由相对介电常数εr、电极面积A和间距d共同决定...

    家庭消防安全常识.docx

    1. **避免多种燃料混用**:液化石油气与煤炉、煤油炉等不能同时使用,以防泄漏引发爆炸。 2. **检测燃气泄漏**:使用肥皂水涂抹可能泄漏的地方,如有气泡则表示漏气,及时关闭阀门。 3. **煤气罐着火处理**:保持...

    堵住电流泄漏:摩尔定律在晶体管发展中继续有效

    【晶体管技术与摩尔定律】 摩尔定律是由戈登·摩尔在1965年提出的,预测集成电路上可容纳的晶体管数量每两年会翻一番,这一规律长期以来一直是信息技术进步的驱动力。从最初的笨拙集成电路到现在的纳米级晶体管,...

    堵住十大安全漏洞 避免Web应用程序的安全风险

    ### 堵住十大安全漏洞避免Web应用程序的安全风险 随着信息技术的发展,Web应用程序因其灵活性和易用性成为了许多企业的首选。然而,随着Web应用程序数量的增长,相应的安全问题也日益凸显。为了帮助企业及其开发者...

    餐饮企业成本控制体系与实践.doc

    《餐饮企业成本控制体系与实践》 餐饮行业的竞争日益激烈,如何在保证服务质量的同时有效控制成本,成为餐饮企业持续发展的关键。本文将深入探讨餐饮企业成本控制体系的构建及其实践方法。 首先,成本控制体系的...

    检查并堵住网站的eWebEditor漏洞

    检查并堵住网站的eWebEditor漏洞

    2021年人教版三年级上册《道德与法治》第二次月考考试题(真题).pdf

    - 社区关系:与邻居和谐相处,同时在受到伤害时应学会寻求解决办法。 - 火灾安全:强调火灾时的自我保护和逃生知识。 - 家乡特色:培养对家乡文化的理解和尊重。 - 时间观念:引用古诗词强调时间的宝贵,鼓励...

    中级瑜伽理论考试题.pdf

    中级瑜伽理论涵盖了一系列复杂的呼吸控制法、瑜伽体式与体育锻炼的区别,以及冥想和相关技法的介绍。这些知识对于深化瑜伽实践者的理论理解至关重要。 首先,瑜伽的呼吸控制法,也称为“普拉纳雅玛”,是瑜伽修行的...

    汽车修理工技师理论知识考试题判断.doc

    17. **齿轮表面麻点**:与湿式汽缸套外壁麻点成因相同,可能是磨损或铸造缺陷。 18. **故障诊断**:不只是找出原因和部位,还包括修复过程。 19. **水温传感器**:损坏可能导致发动机温度读数不准确,而非升高。 ...

    敏捷软件过程的研究与实践.pdf

    ### 敏捷软件过程的研究与实践 #### 一、引言 随着信息技术的快速发展和市场竞争的日益激烈,软件开发行业面临着越来越大的挑战。传统的软件开发方法往往无法满足现代软件项目对于灵活性、响应速度以及质量的需求...

    码头泄漏火灾爆炸现场处置方案.docx

    - 控制泄漏源,如堵住溢油源,使用围油栏、吸油材料回收泄漏物料,同时排除可能的火源。 - 扑救火灾时,关闭相关阀门,启动泡沫炮等灭火设备,必要时指挥船舶撤离危险区域。 8. **大范围火灾应对**: - 当火势...

    新小学三年级道德与法治(上册)月考试题及答案(各版本).pdf

    19. 解决问题的策略:针对邻居车辆堵住车库的问题,需要孩子们学会沟通、协商和寻求合理解决方案。 20. 关爱父母的实践:关爱父母可以从日常生活的小事做起,如主动帮忙家务、关心父母健康等。 21. 帮助他人的注意...

    修改注册表堵住资源共享隐患 论文

    【网络安全与注册表修改】 在当今的信息化社会,网络安全已经成为我们日常生活中不可或缺的一部分。Windows操作系统,尤其是Windows 2003系统,由于其广泛的使用,成为了黑客和恶意攻击者的首要目标。他们通过寻找...

    堵住孩子身边的安全漏洞.docx

    3. **溺水**:夏季是儿童溺水的高峰期,家长应严禁孩子单独或与伙伴去野外水域游泳。在带有喷泉或无护栏水系的住宅区,要密切关注孩子的安全。游泳时,家长应保持在孩子一臂距离内,以便及时救助。 4. **烧烫伤**:...

    四年级下册语文部编版期末模拟冲刺卷2(答案).pdf

    通过文档内容,“上甘岭舍身堵住枪口”这一表述可能与某个历史事件或文学作品中的情节有关,提示学生需要有基本的文学常识和历史背景知识。另外,“君子以自强不息”则出自《周易》,要求学生能够理解并引用传统文化...

    经验分享:使用墨盒应该注意三个问题.pdf

    - 灌装墨水的风险:灌装墨水的质量不可控,可能与原墨水反应,产生有害物质,同时其物理性能差异可能导致打印问题,如堵住喷嘴、断墨等,长期使用还可能损害打印机其他部件。 3. **打印头的保养**: - 防止堵塞:...

Global site tag (gtag.js) - Google Analytics