- 浏览: 255712 次
- 性别:
- 来自: 南京
-
文章分类
最新评论
-
lixia0417:
如果代理是使用命令行选项启动的,那么代理类还有一个要使用的 a ...
BTrace系列之五:实现原理 -
java_cache:
不错,讲得挺详细,果断收藏
Eclipse Debug不为人知的秘密 -
zhupeijun23:
有点懂了
HttpClient重定向 -
tss0823:
非常好的文章!
BTrace实际案例分析 -
763863446:
好好好,尽量不要用debug.
Eclipse Debug不为人知的秘密
BTrace实际案例分析
问题表象 |
问题描述
1.最近有项目组的童鞋反馈,web页面频繁出现假死的状态。
2.web页面的假死出现是概率事件,且无法确定假死的引发原因。
3.是在一定的操作之后出现的,但是无法确定究竟是哪些操作引发这些操作。
问题分析 |
初步分析
我们都知道web容器一般都是单实例多线程的方式工作的,当页面发起请求后,tomcat发分配一个线程进行当前请求的处理,当出现页面假死,说明是由于某种原因导致了线程在等待某种资源,可以是IO、网络响应、数据库连接、等待锁等等,所以需要首先确定该线程是在等待什么资源。
经过初步分析,可以知道是线程阻塞导致web不能够及时返回给页面响应,导致页面出现假死的情况。所以首先确定导致线程阻塞的原因。
确定线程是由于什么原因导致的阻塞其实也是比较简单的,可以使用jstack工具,到出现阻塞现象后,使用jstack工具查看器堆栈,看下是等待什么。也可以使用Eclipse的debug功能,将当前线程suspend。在这里我采用第二种方式。
操作步骤
在本地以Debug方式启动Tomcat应用,模拟一些操作,尽量将假死项目重现,开发人员根据以往的映像去操作一些功能,过了若干时间后,果然出现了假死现象。由于是debug方式启动所以查看其debug视图,发现启动了3个http线程,下图中红色部分标示的位置。
通过右击suspend挂起线程,发现有一个线程确实被阻塞掉了
观察堆栈可以确定是到连接池中去获取连接,但是当前连接池中无可用的连接,导致线程阻塞出现页面假死现象。
进一步分析
很明显这个是由于连接泄露导致无可用连接,所引起的线程阻塞,页面假死。查看连接池配置:
driver=oracle.jdbc.driver.OracleDriver
url=jdbc:oracle:thin:@127.0.0.1:1521:orcl
username=****
password=****
active=20
minidle=20
maxidle=20
maxwait=-1
出现连接泄露问题是较为难定位的问题,因为问题的表象离问题的根源较远,并没有直接的联系,所以只能凭经验和感觉去分析,另外出现该情况应当尽量将连接池连接个数配置改小,这样可以有效的拉近问题表象和问题根源之间的距离,减小问题重现的成本和最大化问题重现的概率。然后根据BTrace来进行分析。但是我们这里有BTrace这个利器来进行动态诊断。
诊断思路
只要跟踪所有的调用过BasicDataSource.getConnection这个方法的地方,然后在看看那些方法调用以后没有关系连接,而关闭连接的地方并非是Connection的close方法,需要对连接池的工作原理有一定的了解。
如上图,连接池持有Connection代理的引用,用来维护Connection,而Connection代理实现了JDBC,通过Connection代理来操作驱动程序,在oracle中是oracle.jdbc.driver.T4CConnection。
实际上连接池主要是通过PoolableConnection作为代理类,持有T4CConnection的引用,完成对数据的操作,并且自己实现了java.sql.Connection接口,我们看下close方法的具体实现。
/**
* Returns me to my pool.
*/
public synchronized void close() throws SQLException {
if (_closed) {
// already closed
return;
}
boolean isUnderlyingConectionClosed;
try {
isUnderlyingConectionClosed = _conn.isClosed();
} catch (SQLException e) {
try {
_pool.invalidateObject(this); // XXX should be guarded to happen at most once
} catch(IllegalStateException ise) {
// pool is closed, so close the connection
passivate();
getInnermostDelegate().close();
} catch (Exception ie) {
// DO NOTHING the original exception will be rethrown
}
throw (SQLException) new SQLException("Cannot close connection (isClosed check failed)").initCause(e);
}
if (!isUnderlyingConectionClosed) {
// Normal close: underlying connection is still open, so we
// simply need to return this proxy to the pool
try {
_pool.returnObject(this); // XXX should be guarded to happen at most once
} catch(IllegalStateException e) {
// pool is closed, so close the connection
passivate();
getInnermostDelegate().close();
} catch(SQLException e) {
throw e;
} catch(RuntimeException e) {
throw e;
} catch(Exception e) {
throw (SQLException) new SQLException("Cannot close connection (return to pool failed)").initCause(e);
}
} else {
// Abnormal close: underlying connection closed unexpectedly, so we
// must destroy this proxy
try {
_pool.invalidateObject(this); // XXX should be guarded to happen at most once
} catch(IllegalStateException e) {
// pool is closed, so close the connection
passivate();
getInnermostDelegate().close();
} catch (Exception ie) {
// DO NOTHING, "Already closed" exception thrown below
}
throw new SQLException("Already closed.");
}
}
而获取连接的代码是通过PoolingDataSource的getConnection进行获取的代码如下:
/** * Return a {@link java.sql.Connection} from my pool, * according to the contract specified by {@link ObjectPool#borrowObject}. */ public Connection getConnection() throws SQLException { try { Connection conn = (Connection)(_pool.borrowObject()); if (conn != null) { conn = new PoolGuardConnectionWrapper(conn); } return conn; } catch(SQLException e) { throw e; } catch(NoSuchElementException e) { throw new SQLNestedException("Cannot get a connection, pool error " + e.getMessage(), e); } catch(RuntimeException e) { throw e; } catch(Exception e) { throw new SQLNestedException("Cannot get a connection, general error", e); } }
可以非常清楚的看到,就是通过该方法释放连接到连接池中,供后续的业务代码进行调用。
到这里基本的思路已经出来了,只要跟踪PoolingDataSource的getConnection方法和PoolableConnection的close方法就可以知道究竟哪些业务代码只调用了获取连接而没有调用close方法进行释放连接,导致连接泄露。
BTrace利器 |
通过编写BTrace脚本进行分析跟踪,只要业务代码在调用完getConnection方法后调用了close就说明没有问题,也就是getConnection方法和close方法成对出现,如果只调用了getConnection方法而没有调用close方法那就说明该业务代码有连接泄露。
import com.sun.btrace.annotations.*;
import static com.sun.btrace.BTraceUtils.*;
@BTrace public class BTraceConnection {
@Export private static long openedCount;
@Export private static long closedCount;
@OnMethod(clazz="/.*PoolingDataSource/", method="getConnection", location=@Location(kind.RETURN))
public static void m(@return Object obj) {
openedCount++;
println("One connection is opened!");
println(obj);
Threads.jstack();
}
@OnMethod(clazz="/.*PoolableConnection/", method="close")
public static void d(@Self Object obj) {
closedCount++;
println("One connection is closed!");
println(obj);
Threads.jstack();
}
@OnExit
public static void f(){
print("Total opened connection:");
println(openedCount);
print("Total closed connection:");
println(closedCount);
}
}
运行命令btrace <pid> BTraceConnection.java > trace.log
日志分析 |
输出结果
One connection is opened!
org.apache.commons.dbcp.PoolingDataSource$PoolGuardConnectionWrapper@1d6fc56
org.apache.commons.dbcp.BasicDataSource.getConnection(BasicDataSource.java:1044)
..................
com.***************************.dao.UserDAO.checkUserState(UserDAO.java:142)
..................
java.lang.Thread.run(Thread.java:619)
One connection is opened!
..................
Total opened connection:61
Total closed connection:57
部分无用内容有删减,发现总共获取了61次connection,释放了57次connection,com.***************************.dao.UserDAO.checkUserState(UserDAO.java:142)该方法没有释放连接,最终定位出了有问题的方法。
其他相关博文
BTrace工具简介http://mgoann.iteye.com/blog/1409667
BTrace实例应用http://mgoann.iteye.com/blog/1409676
BTrace实际案例分析http://mgoann.iteye.com/blog/1409685
评论
发表评论
-
BTrace工具实例应用
2012-02-17 17:18 3980BTrace工具使用简介 “Hello World” ... -
BTrace工具简介
2012-02-17 17:09 12585BTrace工具简介 What is Btrace? ... -
使用JDI调试多线程程序
2012-02-09 11:17 0前几天写了一篇Eclipse的debug技巧,引来不少童鞋的口 ... -
Eclipse Debug不为人知的秘密
2012-02-07 15:54 39255Debug视图 认识debug视图,红色部分框为线程堆栈视 ... -
PIM系统架构浅析
2010-06-20 15:43 2234PIM系统架构浅析 我们真的需要分 ... -
日志打印
2010-06-20 15:26 1773日志打印 ü 日志重要性 ü ... -
JSON简介
2010-06-20 15:22 2561JSON简介 ü JSON简介及其应用场景 ... -
Java编程中汉字问题的初探
2010-06-20 15:09 12731. 前言 在基于Java语言 ... -
接口模块的定义
2010-06-20 14:35 1217接口模块的定义 1 作为接口模块,必须要在设计时仔细逐 ... -
JDBC当中的批处理
2010-06-20 14:33 1529JDBC当中的批处理 在对数据库进行批量操作时,应分析操作的 ... -
大批量工具的思考
2010-06-20 14:32 937大批量工具的思考 大批量工具的思考:大批量处理工具,适用于数 ... -
Unicode、GBK、UTF-8、ASCII的编码简介
2010-06-20 14:30 3500Unicode、GBK、UTF-8、ASCII的编码简介 ... -
java中乱码问题解决方法
2010-02-04 13:01 1687通过TCP码流识别编码 前几天和北京的MM在联调时候出现一个 ... -
java中的编码简介
2010-01-16 16:48 1402Unicode、GBK、UTF-8、ASCII的编码简介 ... -
大批量工具的思考
2010-01-15 19:51 1013大批量工具的思考 大批量工具的思考:大批量处理工具,适用于数 ... -
java当中的批处理
2010-01-15 19:44 10738在对数据库进行批量操作时,应分析操作的前后相关性,如果属于大批 ... -
接口模块的定义
2010-01-15 19:34 13001 作为接口模块,必须要在设计时仔细逐一分析消息的类型。包括: ...
相关推荐
7. **案例分析**:通过实际案例,如性能分析、内存泄漏检测或线程死锁排查,深入理解BTrace在不同场景下的应用。 8. **与其他工具的集成**:BTrace可以与其他监控和诊断工具(如VisualVM、JMX等)结合使用,增强...
Java内存管理问题是Java开发者在软件运行过程中经常会遇到的挑战之一,尤其在大型分布式系统中,内存泄漏、内存溢出...通过本分享的案例学习,可以加深对Java内存管理的认识,并能在实际遇到内存问题时快速定位和解决。
代码级剖析工具,则可以通过分析代码执行的详细信息来帮助找出性能瓶颈,例如ContiPerf、BTrace等。 性能调优的知识不仅包括了工具的使用,还涉及性能基础理论知识。例如,了解常见接口性能压测、RPC框架、HTTPS...
以下是常见的C++笔试面试题及其核心知识点解析,帮助您系统复习
计算机短期培训教案.pdf
计算机二级Access笔试题库.pdf
下是一份关于C++毕业答辩的心得总结,内容涵盖技术准备、答辩技巧和注意事项,供参考
内容概要:本文档详细介绍了英特尔为苹果公司构建的基于智能处理单元(IPU)的Cassandra集群的技术验证(PoC)。主要内容涵盖IPU存储用例、已建存储PoC、MEV到MMG400的过渡、苹果构建IPU-Cassandra集群的动机以及PoC开发进展。文档还探讨了硬件配置、软件环境设置、性能调优措施及其成果,特别是针对延迟和吞吐量的优化。此外,文档展示了六节点Cassandra集群的具体架构和测试结果,强调了成本和复杂性的降低。 适合人群:对分布式数据库系统、NoSQL数据库、IPU技术感兴趣的IT专业人员和技术管理人员。 使用场景及目标:适用于希望了解如何利用IPU提升Cassandra集群性能的企业技术人员。主要目标是展示如何通过IPU减少服务器部署的成本和功耗,同时提高数据处理效率。 其他说明:文档中涉及的内容属于机密级别,仅供特定授权人员查阅。文中提到的技术细节和测试结果对于评估IPU在大规模数据中心的应用潜力至关重要。
计算机二级考试C语言题.pdf
计算机发展史.pdf
计算机仿真技术系统的分析方法.pdf
yolo编程相关资源,python编程与YOLO算法组成的坐姿检测系统,功能介绍: 一:实时检测学生错误坐姿人数 二:通过前端阿里云平台显示上传数据,实现数据可视化
办公室网安全监控uptime-kuma,docker镜像离线压缩包
计算机课程设计-网络编程项目源码.zip
将该dll包放入项目并引用,可以操作打印机
杰奇2.3内核淡绿唯美小说网站源码 PC+手机版 自动采集 全站伪静态,送10.1版本关关采集器
计算机辅助教学.pdf
内容概要:本文详细介绍了如何利用天文相机和其他相关硬件设备搭建一套高画质、高帧率的流星监控系统,以及针对红色精灵闪电这一特殊自然现象的捕捉方法。文中不仅涵盖了硬件的选择标准如CMOS靶面尺寸、量子效率等重要参数,还提供了基于Python和OpenCV实现的基本监控代码示例,包括亮度突变检测、运动检测算法等关键技术点。此外,对于安装位置的选择、供电方式、成本控制等方面也有具体的指导建议。 适用人群:对天文摄影感兴趣的爱好者,尤其是希望捕捉流星和红色精灵闪电等瞬时天文现象的专业人士或业余玩家。 使用场景及目标:适用于希望搭建个人天文观测站,用于科学研究或个人兴趣爱好的场景。目标是能够稳定可靠地捕捉到流星和红色精灵闪电等难以捉摸的天文现象,为研究提供高质量的数据资料。 其他说明:文中提到的一些技术和方法虽然较为复杂,但对于有一定编程基础和技术动手能力的人来说是非常实用的参考资料。同时,文中提供的省钱技巧也为预算有限的用户提供了一些有价值的建议。
时间序列分析-基于R(第2版)习题数据