今天花了一整天在跟踪一个问题,每次感觉已经快找到原因的时候发现现象又变了,我觉得从中吸取的教训可以给大家分享一下。
为了重现这个现象,我写了一个简单的例子。在本例中,先初始化了一个map,然后用一个无限循环将一些键值对插入到map里面:
class Wrapper { public static void main(String args[]) throws Exception { Map map = System.getProperties(); Random r = new Random(); while (true) { map.put(r.nextInt(), "value"); } } }
你可能也猜到了,这段代码编译执行后无法正常结束。当我用这组参数启动的话:
java -Xmx100m -XX:+UseParallelGC Wrapper
我会在终端中看到java.lang.OutOfMemoryError: GC overhead limit exceeded的异常信息。不过如果我调整一下堆大小或者是GC的类型的话,在我的Mac OS X 10.9.2 系统上用Oracle Hotspot JDK 1.7.0_45来运行,就会出现不同的情况。
比如说,我用一个较小的堆来运行这个程序,就像下面这样:
java -Xmx10m -XX:+UseParallelGC Wrapper
应用程序会抛出一段大家更熟悉的错误信息然后挂掉:java.lang.OutOfMemoryError: Java heap space。
如果你换成ParallelGC以外的GC策略的话,比如说-XX:+UseConcMarkSweepGC or -XX:+UseG1GC,你将会看到由默认的异常处理器所抛出的异常,并且你看不到堆栈信息了,因为堆已经没有空间了,甚至连异常的堆栈信息都没法填充了,因此它在创建异常的时候就挂掉了:
My Precious:examples vladimir$ java -Xmx100m -XX:+UseConcMarkSweepGC Wrapper
Exception: java.lang.OutOfMemoryError thrown from the UncaughtExceptionHandler in thread "main"
这说明了什么?当资源紧缺的时候,你根本没法判断你的应用程序是怎么挂掉的,因此不要指望能出现你所预期的一系列错误提示。从上面这个例子中可以看到,你的程序可能会以三种完全不同的方式挂掉:
GC的安全性检查失败:一旦GC花费的时间占到98%以上的话,JVM就会宣告投降了: java.lang.OutOfMemoryError: GC overhead limit exceeded。
无法为下一个操作分配足够的内存:如果无法满足下一条指令所需要分配的内存的话,你会收到一条”java.lang.OutOfMemoryError: Java heap space” 的错误信息。
你可能也总结出来了,还有一种情况是你的内存已经紧张到连JVM创建一条OutOfMemoryError异常,填充堆栈信息,打印到屏幕上这点要求都满足不了了。这种情况UncaughtExceptionHandler会捕获到这个错误,而不再走通常的错误流程。这个处理器恰如其名,当线程由于某个异常快要挂掉的时候,它开始出来收场了。出现这种情况的话,JVM会找到线程对应的 UncaughtExceptionHandler,然后调用它的uncaughtException方法。
因此当你捕获到内存不足的异常并自以为已经胸有成竹时,请再多思考一下 。系统已经处于崩溃的边缘,你原认为你能依赖的信息很可能会消失或者改变。留给你的只有一脸茫然,正如我前面那12个小时中那样。
如果你已经耐心读到这了,我推荐你关注下我们的twitter帐号。我们每周都会发一些工作中碰到的一些性能调优的问题。
相关推荐
在线上Java程序中经常遇到进程程挂掉,一些状态没有正确的保存下来,这时候需要在JVM关掉的时候执行一些清理现场的代码。Java中得ShutdownHook提供了比较好的方案。 JDK在1.3之后提供了Java Runtime....
而且一个微不足道的小问题,可以导致整个应用挂掉(高层还总是唠叨我们) 也是辛苦大家那段时间每夜每夜的加班工作了! 在听微服务之前,因为学员层次不一,希望大家有了解到至少一个单体架构的web项目开发经验或...
在Java开发中,数据库连接池是一种重要的资源管理工具,它允许开发者高效地管理和复用数据库连接,从而提高系统的性能和稳定性。数据库连接池的基本原理是预先创建一定数量的数据库连接,当应用程序需要访问数据库时...
一旦发现异常,比如线程因异常退出或者挂起,监控线程会介入处理,这可能涉及到清理资源、记录日志,以及最重要的一点——重启挂掉的线程。 实现监控线程原型时,有几个关键点需要注意: 1. **异常处理**:监控...
我们需要思考这里要做什么,要测试这七个函数,调用 GIF 文件产生 Native Crash,那么代表测试的进程会挂掉,如何能够让测试程序自动的继续进行下去? 六、总结 挖掘 Android Native 层文件解析漏洞需要了解 ...
在Linux中,我们可以使用以下几种同步机制来解决这个问题: 1. **信号量(Semaphore)**:信号量是一种计数型同步原语,可以用来保护共享资源。生产者在添加数据前检查信号量,如果信号量大于零,则表示缓冲区有...
在调试过程中,如果遇到“通信猫挂掉”的情况,通常意味着MQTT连接中断或者服务器出现问题。此时,简单的解决方法是重启COMNET或重新连接到MQTT服务器。 在实际使用中,MQTT有以下几个核心概念: 1. **主题(Topic...
JAR:Java档案文件(一种用于applet和相关文件的压缩文件) JAVA:Java源文件 JFF,JFIF,JIF:JPEG文件 JPE,JPEG,JPG:JPEG图形文件 JS:javascript源文件 JSP:HTML网页,其中包含有对一个Java servlet...
在新的编程思想中,指针基本上被禁止使用(JAVA中就是这样),至少也是被限制使用。而在我们交换机的程序中大量使用指针,并且有增无减。 2、防止指针/数组操作越界 【案例1.2.1】 在香港项目测试中,发现ISDN话机...
JVM内存模型主要分为以下几个部分:堆区、栈区、方法区、本地方法栈以及程序计数器。 1. **堆区**:堆区是JVM管理的最大一块内存区域,主要用于存储对象实例和数组。所有的对象实例都在这里创建,并且在堆区分配...
阅读设置中增加一个“文件缓存”选项,默认情况下是开启的,在NOKIA手机上会提高UMD等文件的表现,但由于测试并不充足,如果程序经常在阅读时出错,请关闭该选项(其它手机是否开启该选项并无明显的影响) ...