1. 现象、问题描述
PISA B07系统测试时发现一个问题,CS在大批量进行业务定购流程时,会经常有数据库操作操作失败的日志出现。
<Error> [2006-06-27 23:12:49.647] [0:0] [cssercommon.cpp:4102] Error in FetchNext()! ErrNativeCode is [-911], ErrText is [[IBM][CLI Driver][DB2/LINUX] SQL0911N The current transaction has been rolled back because of a deadlock or timeout. Reason code "68". SQLSTATE=40001].
日志的含义还是比较明确的,DB2的错误码SQL0911N的意思是因为死锁或超时导致当前的事务回滚,其中的Reason code "68"表明是锁定后锁应用锁等待超时而导致的事务回滚(Reason code "2"表示是死锁导致的事务回滚)。
2. 关键过程、根本原因分析
第一步肯定是怀疑代码中的业务逻辑不合理,出现了较大的事务而长时间不提交,那么其他连接上的事务就会根据数据库的参数LOCKTIMEOUT设置,等待相应的秒数后就会超时回滚,B07测试用的数据库锁超时参数是10秒。
Lock timeout (sec) (LOCKTIMEOUT) = 10
但经谢红波检视代码没有发现代码有什么不合理的地方,这时候想到使用事件观察器进行跟踪。
db2 "create event monitor 监视器名 for STATEMENTS write to file '目录名'"
db2evmon -path 目录名
时间观察器的结果如下(省略了大部分不相关的结果)
305) Statement Event ...
Appl Handle: 255
Appl Id: *LOCAL.db2inst1.060626032804
Appl Seq number: 3294
Record is the result of a flush: FALSE
-------------------------------------------
Type : Dynamic
Operation: Execute
Section : 4
Creator : NULLID
Package : SYSSH200
Consistency Token : SYSLVL01
Package Version ID :
Cursor : SQL_CURSH200C4
Cursor was blocking: FALSE
Text : insert into ServiceOrder (UserID,ServiceID,OrderTime,CancelOrderTime,OrderState, LastChargeTime,ChargeFlag) values('+86134061000000',1,'20060626165547','00000000000000',0,'00000000000000',0)
353) Statement Event ...
Appl Handle: 255
Appl Id: *LOCAL.db2inst1.060626032804
Appl Seq number: 3305
Record is the result of a flush: FALSE
-------------------------------------------
Type : Dynamic
Operation: Prepare
Section : 4
Creator : NULLID
Package : SYSSH200
Consistency Token : SYSLVL01
Package Version ID :
Cursor : SQL_CURSH200C4
Cursor was blocking: FALSE
Text : select UserID, ServiceID, OrderTime, CancelOrderTime, OrderState, LastChargeTime, ChargeFlag from ServiceOrder where UserID = '+86134061000001' and ServiceID = 10
-------------------------------------------
从事件观察器可以发现发生锁等待超时的时候, ServiceOrder表上的只有两种SQL语句在操作,insert语句和select语句,分别是插入定购关系和查询已定购的业务。
insert into ServiceOrder(UserID, ServiceID, OrderTime, CancelOrderTime, OrderState, LastChargeTime, ChargeFlag) values('+86134061000000', 1, '20060626165547', '00000000000000', 0, '00000000000000', 0)
select UserID, ServiceID, OrderTime, CancelOrderTime, OrderState, LastChargeTime, ChargeFlag from ServiceOrder where UserID = '+86134061000001' and ServiceID = 10
而发生锁等待超时的正是select语句,根据之前开发的经验,似乎没有出现过这种情况,在insert的时候,应该是可以同步进行select操作的。同时申振国测试发现,虽然现在的库有问题,但另外一台246机器上有PISA B05的数据库,如果在其基础上升级到B07的库,并把B07数据库的数据完全导入,测试就没有问题。也就是说锁等待超时应该和代码以及数据库中的数据没有关系。
于是在246机器上建了一个SAMPLE数据库进行试验:
db2sampl
使用telnet方式建立两个连接,再使用db2 +c设置手动提交。在其中一个连接上执行相同的insert操作,在另一个连接上再执行select操作,此时却立刻能返回结果。
此时基本确定是数据库的参数问题,对比两个数据库的数据库参数和实例参数,发现几乎没有什么不同。经咨询IBM的支持工程师并做简单测试,发现是数据库的环境变量导致的问题。
下面介绍一下相关的几个DB2设置并行操作的参数。
Ø 关于DB2的几个并行参数设置
缺省的情况下,DB2在表扫描或索引扫描期间,扫描每一行时会首先执行行锁定,然后再判断该行是否符合查询的条件。这样当进行插入等操作时,其他的查询操作就会锁等待,因此业务量大的时候就可能出现锁等待超时。
为了提高数据库操作的并发性,DB2允许在某些情况下对游标稳定性(CS)或读稳定性(RS)进行隔离扫描延迟行锁定,直到知道一条记录满足查询的谓词为止。即为了提高扫描的并发性,可以延迟行锁定,直到确定某行符合查询要求为止。
这个功能需要打开如下几个注册表变量:
db2set DB2_EVALUNCOMMITTED=ON
db2set DB2_SKIPDELETED=ON
db2set DB2_SKIPINSERTED=ON
注:注册表变量是全局级的参数,使用db2set可查看已设置的注册表变量。
设置这些参数后,在表扫描期间会跳过未落实行。未落实的删除行则被视为已删除的行,而未落实的插入行则被视为尚未插入的行。启用这些参数会使得数据库得并发性更强,它是大部分应用程序的首选设置。
但这些参数也不是在所有情况下均适用的,需要区分场景,在某些应用场景下就不能使用这些参数。例如在如下情况下,DB2_SKIPINSERTED参数应该启用其默认值OFF。
Ÿ 假定两个应用程序使用一个表来在它们之间传递数据,第一个应用程序将数据插入到表中,第二个应用程序从表中读取数据。第二个应用程序必须按照数据在表中的显示顺序来处理数据,如果第一个应用程序正在插入要读取的下一行,则第二个应用程序必须等待直到插入被落实为止。
分享到:
相关推荐
在数据库管理领域,特别是针对IBM DB2数据库的应用场景中,锁等待是一个常见的性能瓶颈问题。当两个或多个事务请求对同一资源进行操作时,如果没有妥善处理这些请求间的相互依赖关系,则可能导致锁等待现象的发生,...
DB2锁问题处理最佳实践,是指在使用DB2数据库过程中,针对数据库锁相关问题的一系列预防、诊断和解决方法。数据库锁是数据库管理系统保证数据完整性和并发控制的重要机制,但不当的锁使用也会导致性能瓶颈和应用程序...
在DB2数据库中,重命名不同的索引可能会引发一种名为EOT(End of Table)锁等待问题,这在日常操作中并不常见,因此可能导致DBA在遇到时感到困惑。EOT锁是一种特定类型的行级锁定,它在某些情况下用于表的元数据管理...
在DB2数据库管理中,创建索引和进行联机备份是两种常见的操作,但它们可能存在冲突,导致锁等待问题。本文通过一个具体的案例分析,详细解释了这种冲突的原因及解决方法,帮助DB2管理员理解并避免类似问题。 首先,...
### DB2 Load锁表后解锁详解 #### 一、引言 在数据库管理与维护过程中,数据加载(Load)操作是常见的数据导入手段之一。在DB2环境下进行数据加载时,由于Load操作不生成事务日志,这可能导致加载完成后表被锁定的...
针对标题和描述中提到的“通过shell脚本自动检测DB2数据库锁等待”的知识点,我们...通过对这些知识点的掌握,可以有效地使用shell脚本自动化检测和分析DB2数据库中的锁等待问题,从而对数据库进行性能调优和问题排查。
db2锁的问题db2锁的问题db2锁的问题db2锁的问题db2锁的问题db2锁的问题
1. **设置环境变量**:首先通过命令`db2set DB2_CAPTURE_LOCKTIMEOUT=ON`来激活锁定超时报告的捕获功能。 2. **重启DB2服务**:由于这是一个运行时参数,所以需要先停止DB2服务(`db2stop`),然后重新启动(`db2...
3. **锁等待时间**:DB2允许设置锁等待的时间限制,超过该时间则回滚事务。 4. **锁优先级**:DB2根据事务的类型和重要性,为锁分配优先级。 #### 六、SQL语句中的锁 在DB2中,可以通过SQL语句来显式地控制锁的...
通过以上方法,我们可以有效地查询DB2数据库中的锁状态,从而帮助解决可能遇到的与锁相关的性能问题或死锁问题。这些信息对于理解数据库中并发控制的行为至关重要,并且对于数据库管理员来说是非常有价值的诊断工具...
### DB2 代码页设置详解 #### 一、引言 在DB2数据库管理系统中,字符编码(也称为代码页)对于确保数据正确存储和检索至关重要。本文将深入探讨DB2中的代码页设置方法,包括实例级别的代码页设置以及数据库级别的...
在多用户环境下,当多个事务请求访问同一资源时,DB2会根据访问模式自动施加不同类型的锁(如共享锁或排他锁),以协调并控制对数据库资源的并发访问。锁升级是指当数据库系统检测到同一资源上的锁冲突频繁发生时,...
DB2 环境配置说明是指在使用 DB2 数据库时,需要进行的一些基本配置和设置,以确保数据库的正常使用。在本文档中,我们将详细介绍 DB2 环境配置的步骤和注意事项。 一、安装 DB2 客户端 在安装 DB2 客户端时,需要...
关于db2锁说明,以表格对比的方式详细说明db2数据库中各个锁之间的区别。方便理解db2数据库关于锁的处理以及设计。
在数据库管理领域,死锁是常见的问题之一,尤其是在并发环境中。DB2,作为IBM的一款强大关系型数据库管理系统,也不例外。本文将深入探讨“DB2解决表死锁”这一主题,结合提供的资源“DB2解除表锁.doc”,我们将讨论...
- 设置合理的锁超时时间,例如通过设置`Locktimeout`参数。 - 默认值通常为10秒,可根据实际需要调整。 - **定位锁等待SQL**: - 使用如下SQL命令来查找导致锁等待的SQL语句: ```sql SELECT AGENT_ID, SUBSTR...