高并发环境下系统宕机案例分析

woodbird

浏览: 19153 次
性别:
来自: 成都

最近访客更多访客>>

julylin

you1huang

littleMonkey

woodding2008

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

总结

loadrunner java 多线程

在性能测试的时候，当并发数达到200时触发该问题

现象表现为，load达到200左右，CPU高达100%，内存使用正常，FullGC频率为1小时一次。虽然java进程正常，jvm并未崩溃，但是系统已经拒绝服务，可视为宕机。

该问题一直持续到第二天上班时。在发现问题后，我们停止了LoadRunner，同时也停止了apache，也就是可以保证系统不再接收任何请求。

可是系统并未因此恢复正常。经分析怀疑系统存在死循环之类耗CPU的操作。

通过top shift+h shift+p 命令，查看线程情况，发现出现上百个java线程，他们各占1%的cpu。

进一步确定是代码问题造成的本次故障。

通过jstack命令打印出java线程的快照到日志文件，对日志文件进行分析，发现大多java线程的快照如下

"http-bio-8080-exec-2957" daemon prio=10 tid=0x09d01800 nid=0x4841 runnable [0x69fd4000]
java.lang.Thread.State: RUNNABLE
at org.apache.commons.collections.map.AbstractHashedMap.getEntry(AbstractHashedMap.java:440)
at org.apache.commons.collections.map.LRUMap.get(LRUMap.java:174)
at com.hongli.pandora.item.manager.WeightScoreComputor.compute(WeightScoreComputor.java:29)
at com.hongli.pandora.item.manager.CargoManager$2.compare(CargoManager.java:462)
at com.hongli.pandora.item.manager.CargoManager$2.compare(CargoManager.java:458)
at java.util.Arrays.mergeSort(Arrays.java:1270)