`

oracle死锁故障分析和诊断解决

阅读更多

如果在事务中执行了一条不满足条件的update语句,则执行全表扫描,把行级锁上升为表级锁,多个这样的事务执行后,就很容易产生死锁。

预备知识:
DDL(DATABASE DEFINITION LANGUAGE):数据库定义语言,如create table、drop table.....
DML(DATABASE MODIFICATION LANGUAGE):数据库修改语言,如insert、delete、update......
参考资料:
Oracle8 Administrator's Guide, Release 8.0
Oracle8 Tuning, Release 8.0
ORACLE锁具体分为以下几类:
1.按用户与系统划分,可以分为自动锁与显示锁
自动锁:当进行一项数据库操作时,缺省情况下,系统自动为此数据库操作获得所有有必要的锁。
显示锁:某些情况下,需要用户显示的锁定数据库操作要用到的数据,才能使数据库操作执行得更好,显示锁是用户为数据库对象设定的。
2.按锁级别划分,可分为共享锁与排它锁
共享锁:共享锁使一个事务对特定数据库资源进行共享访问——另一事务也可对此资源进行访问或获得相同共享锁。共享锁为事务提供高并发性,但如拙劣的事务设计+共享锁容易造成死锁或数据更新丢失。
排它锁:事务设置排它锁后,该事务单独获得此资源,另一事务不能在此事务提交之前获得相同对象的共享锁或排它锁。
3.按操作划分,可分为DML锁、DDL锁
+DML锁又可以分为,行锁、表锁、死锁
-行锁:当事务执行数据库插入、更新、删除操作时,该事务自动获得操作 表中操作行的排它锁。
-表级锁:当事务获得行锁后,此事务也将自动获得该行的表锁(共享锁),以 防止其它事务进行DDL语句影响记录行的更新。事务也可以在进行 过程中获得共享锁或排它锁,只有当事务显示使用LOCK TABLE语 句显示的定义一个排它锁时,事务才会获得表上的排它锁,也可使用
LOCK TABLE显示的定义一个表级的共享锁(LOCK TABLE具体用法请参 考相关文档)。
-死锁:当两个事务需要一组有冲突的锁,而不能将事务继续下去的话,就 出现死锁。
如事务1在表A行记录#3中有一排它锁,并等待事务2在表A中记录#4 中排它锁的释放,而事务2在表A记录行#4中有一排它锁,并等待事务 1在表A中记录#3中排它锁的释放,事务1与事务2彼此等待,因此就造 成了死锁。死锁一般是因拙劣的事务设计而产生。
死锁只能使用SQL下:alter system kill session 'sid,serial#';
或者使用相关操作系统kill进程的命令,如UNIX下kill -9 sid,或者 使用其它工具杀掉死锁进程。
+DDL锁又可以分为:排它DDL锁、共享DDL锁、分析锁
-排它DDL锁:创建、修改、删除一个数据库对象的DDL语句获得操作对象的 排它锁。
如使用alter table语句时,为了维护数据的完成性、一致性、
合法性,该事务获得一排它DDL锁。
-共享DDL锁:需在数据库对象之间建立相互依赖关系的DDL语句通常需共享
获得DDL锁。
如创建一个包,该包中的过程与函数引用了不同的数据库表,
当编译此包时,该事务就获得了引用表的共享DDL锁。
-分析锁:ORACLE使用共享池存储分析与优化过的SQL语句及PL/SQL程序,使
运行相同语句的应用速度更快。一个在共享池中缓存的对象获得
它所引用数据库对象的分析锁。分析锁是一种独特的DDL锁类型,
ORACLE使用它追踪共享池对象及它所引用数据库对象之间的依赖 关系。当一个事务修改或删除了共享池持有分析锁的数据库对象
时,ORACLE使共享池中的对象作废,下次在引用这条SQL/PLSQL语 句时,ORACLE重新分析编译此语句。
4.内部闩锁
内部闩锁:这是ORACLE中的一种特殊锁,用于顺序访问内部系统结构。
当事务需向缓冲区写入信息时,为了使用此块内存区域, ORACLE首先必须取得这块内存区域的闩锁,才能向此块内存写入
信息。

 

文章选项:

正如上面的实验,互锁或死锁时,ORACLE已经解除了这种锁,所以只要等待某一占有资源的进程打开锁(通过ROLLBACK/COMMIT)即可。

对于非正常终止进程占有的锁,把握以前在内部网站上法的一片贴子转贴在下面:

 

锁等待的诊断及排除
=====================================

在ORACLE中,为了保证数据的一致性,在对数据库中的数据进行操作时,系统会进行对数据相应的锁定。
当程序对所做的修改进行提交(commit)或回滚后(rollback)后,锁住的资源便会得到释放,从而允许其它用户进行操作。
但是,有时,由于程序中的原因,锁住资源后长时间未对其工作进行提交;或是由于用户的原因,如调出需要修改的数据后,未及时修改并提交,而是放置于一旁;或是由于客户服务器方式中客户端出现"死机",而服务器端却并未检测到,从而造成锁定的资源未被及时释放,影响到其它用户的操作。
这时,我们需要迅速地诊断出锁住资源的用户并解决其锁定。

1. 诊断系统中的锁
为了找出系统中那些用户锁住资源以及那些用户在等待相应的资源,可使用以下语句(其中的/*+ NO_MERGE(..) */千万不可省略, 否则会很慢):

-- looklock.sql
-- use the NO_MERGE hints can speed up the query
select /*+ NO_MERGE(a) NO_MERGE(b) NO_MERGE(c) */ 'Wait' "Status", a.username, a.machine, a.sid, a.serial#, a.last_call_et "Seconds", b.id1, c.sql_text "SQL"
from v$session a, v$lock b, v$sqltext c
where a.username is not null
and a.lockwait = b.kaddr
and c.hash_value =a.sql_hash_value
union
select /*+ NO_MERGE(a) NO_MERGE(b) NO_MERGE(c) */ 'Lock' "Status", a.username, a.machine, a.sid, a.serial#, a.last_call_et "Seconds", b.id1, c.sql_text "SQL"
from v$session a, v$lock b, v$sqltext c
where b.id1 in
(select /*+ NO_MERGE(d) NO_MERGE(e) */ distinct e.id1
from v$session d, v$lock e
where d.lockwait = e.kaddr)
and a.username is not null
and a.sid = b.sid
and b.request=0
and c.hash_value =a.sql_hash_value;

执行后的结果如下所示:
Stat USERNAME MACHINE SID SERIAL# Seconds ID1
---- ------------------------------ ---------------- --------- --------- --------- ---------
SQL
----------------------------------------------------------------
Lock CIQUSR CIQ\DULMACER 12 966 245 131089
select * from c_trade_mode for update

Wait CIQUSR CIQ\DULMACER 10 735 111 131089
update c_trade_mode set x_name = 'zzz' where x_code='5'

Wait CIQUSR CIQ\DULMACER 15 106 1094 131089
select * from c_trade_mode for update


其中:
Status有两种状态,LOCK表明该进程锁住了某个资源,WAIT表示该进程正在等待某个资源。
Username, Machine分别为ORACLE用户名及机器名
SID,SERIAL#可用于随后的解锁操作
Seconds表示该进程最后一次进行操作至当前的时间(秒)
ID1, 锁标识。某个LOCK状态的ID1与某个WAIT状态的ID1相同,可说明锁的正是另一个进程等待的。
SQL: 锁住资源的SQL语句

2. 解除锁

诊断出锁的状态后,若发现该阻塞其它用户进程的进程是正常操作中,则可通知该用户对其进行提交,从而达到释放锁资源的目的;若为非正常操作,即,其状态为"inactive",且其Seconds已为较多长时间,则可执行以下语句将该进程进行清除,系统会自动对其进行回滚,从而释放锁住的资源。

alter system kill session 'sid, serial#';

例如: 对于上例中显示的结果, 可用以下语句清除锁住资源的进程:
alter system kill session '12, 966';

 

 

关于你所说:在网络断掉(通过拔掉网线)或非正常终止进程(通过task manager强行关闭sql*plus)时,oracle在有限的时间内(我只观查了5-10分)内,oracle未能对该进程作任何处理。
这个处理与TCP协议有关,因为SQL NET在使用TCP/IP协议进行网络连接时是一种短连接,当ORACLE连接异常终止时,因为是异常终止,终止信号并没有通过网络通知server端,因此只有下次server有结果从服务器端返回需与client通信时,server才会发现此client已经端掉。因此出现你前面所提ORACLE处理异常终止进程延时情况.
死锁:你可以试验一条彼此存在依赖关系的update语句,ORACLE处理这种锁时不是很好。


查锁语句:查询产生锁的用户锁sql
select a.username username, a.sid sid, a.serial# serial,b.id1 id1, c.sql_text sqltext
from v$session a, v$lock b, v$sqltext c
where b.id1 in
   (select distinct e.id1
   from v$session d, v$lock e
   where d.lockwait = e.kaddr)
   and a.sid = b.sid
   and c.hash_value = a.sql_hash_value
   and b.request = 0;


死锁:当两个事务需要一组有冲突的锁,而不能将事务继续下去的话,就 出现死锁。
如事务1在表A行记录#3中有一排它锁,并等待事务2在表A中记录#4 中排它锁的释放,而事务2在表A记录行#4中有一排它锁,并等待事务 1在表A中记录#3中排它锁的释放,事务1与事务2彼此等待,因此就造 成了死锁。死锁一般是因拙劣的事务设计而产生

=========================================

记录死锁的视图主要有两个v$lock,v$locked_object
查询相关的锁时可以关联下表ALL_OBJECTS取出其中的表对象,
select a.SID,b.object_name from v$lock a,all_objects b where a.id1=b.object_id and a.block=1;

select sid, serial#, last_call_et, status, program , username   from v$session   where sid   in ( select sid from v$lock where block=1)

然后根据SID在V$SESSION视图里KILL掉就OK了
alter system kill session 'sid, serial#';

10:04 | 添加评论 | 阅读评论 (2) | 引用通告 (0) | 记录它
评论志逍遥 志逍遥
SQL> select
C.SID,   2   C.USERNAME,
DECOD   3   E(B.ID2, 0, A.OBJECT_NAME,
'Trans-'||   4   to_char(B.ID1)) OBJECT_NAME,
B.   5   TYPE,
DECODE(   6   B.LMODE,0,'--Waiting--',
1,'   7   Null',
2   8   ,'Row Share',
3,'Row Ex   9   cl',
4,'Share',
5, 10    11   'Sha Row Exc',
12   6,'Exclusive',
' 13   Other') "Lock Mode",
DECOD 14   E(B.REQUEST,0,' ',
1,'Nu 15   ll',
2,'Row Shar 16   e',
3,'Row Excl' 17   ,
4,'Share',
5, 18    19   'Sha Row Exc',
6,'Exclusi 20   ve',
'Ot 21   her') "Req Mode"
from DBA_O 22   BJECTS A, V$LOCK B, V$SESSION C
wh 23   ere A.OBJECT_ID(+) = B.ID1
24   and B.SID = C.SID and (b.block>0 or b.request>
25   and C.USERNAME is not null;

no rows selected
9月11日 9:28
(
http://enlysun.spaces.live.com/)

sanshao sanshao
再加一下与Lock 有关的查询:

select
C.SID,C.USERNAME,
DECODE(B.ID2, 0, A.OBJECT_NAME,
'Trans-'||to_char(B.ID1)) OBJECT_NAME,
B.TYPE,
DECODE(B.LMODE,0,'--Waiting--',
1,'Null',
2,'Row Share',
3,'Row Excl',
4,'Share',
5,'Sha Row Exc',
6,'Exclusive',
'Other') "Lock Mode",
DECODE(B.REQUEST,0,' ',
1,'Null',
2,'Row Share',
3,'Row Excl',
4,'Share',
5,'Sha Row Exc',
6,'Exclusive',
'Other') "Req Mode"
from DBA_OBJECTS A, V$LOCK B, V$SESSION C
where A.OBJECT_ID(+) = B.ID1
and B.SID = C.SID and (b.block>0 or b.request>0)
and C.USERNAME is not null;

分享到:
评论

相关推荐

    ORACLE DB数据库常见问题解决及诊断技巧集锦-ORACLE DBA故障修复必备手册.zip

    学习如何识别和解决死锁,以及使用锁定和事务管理机制,可以提高系统效率。 10. **故障预防**:定期进行健康检查,执行性能基线测试,制定应急计划,可以帮助预防可能出现的问题。 本手册作为Oracle DBA的故障修复...

    Oracle故障解决手册

    这本手册详细阐述了在使用Oracle数据库过程中可能遇到的各种问题,以及如何诊断和修复这些故障。由于Oracle数据库是企业级的重要数据存储和管理工具,因此对于DBA(数据库管理员)和其他IT专业人士来说,掌握故障...

    新版Oracle 8故障解决手册2.rar

    1. **系统初始化与配置**:介绍如何正确配置Oracle 8环境,包括数据库实例创建、参数文件设置、内存结构优化等,以及可能出现的配置错误和解决方法。 2. **性能监控与调优**:讲解如何使用Oracle的性能监控工具(如...

    新版ORACLE 8故障解决手册

    三、故障诊断与解决 1. 使用Oracle Enterprise Manager(OEM):Oracle 8的管理工具,能监控数据库状态,定位问题源。 2. 查询V$视图:如V$SESSION、V$INSTANCE、V$SESSION_WAIT等,获取实时数据库运行信息。 3. ...

    深入浅出oracle DBA入门进阶与诊断案例

    5. 故障诊断与处理:掌握诊断和解决数据库常见问题的技能,例如死锁、内存泄漏、I/O性能问题等。理解如何分析跟踪文件和警告日志来定位问题根源。 6. 高级主题:深入研究一些高级主题,如RAC(Real Application ...

    Oracle问题解决大全

    6. **故障诊断**:Oracle的日志系统,如alert.log、trace文件,是诊断问题的重要来源。理解如何阅读和分析这些日志,可以快速定位并解决问题。 7. **数据库升级与迁移**:随着技术发展,数据库升级和迁移是不可避免...

    深入浅出Oracle:DBA入门、进阶与诊断案例

    - 问题诊断:学习如何使用Oracle的故障诊断工具如ODI(Oracle Diagnostic Interface)和ADDM(Automatic Database Diagnostic Monitor)。 6. **Oracle新特性**: - 针对不同版本的Oracle,介绍新的特性和改进,...

    ORACLE 数据库入门 诊断基础

    了解Oracle的诊断工具,如alert log、trace文件、DBA视图、SQL Trace和Automatic Workload Repository (AWR)报告,可以帮助定位和解决问题。通过监控性能指标,可以及时发现系统瓶颈并采取相应措施。 总结,Oracle...

    深入浅出Oracle:DBA入门、进阶与诊断案例.pdf

    1. 系统故障诊断:如Oracle实例故障、内存问题、磁盘I/O性能瓶颈等,学习如何利用诊断工具定位和解决问题。 2. 事务处理故障:在事务大量失败时,需要能够分析事务日志,定位锁争用、死锁等问题,并解决它们。 3. ...

    oracle日志分析的一组文档

    其他文档如"分析Oracle数据库日志文1.doc"和"分析Oracle数据库日志文件.doc"可能包含实际案例分析,教读者如何根据日志信息定位并解决问题,例如数据库死锁、性能瓶颈、错误修复等。 5. **数据库维护与安全**: ...

    入浅出Oracle:DBA入门、进阶与诊断案例

    - 掌握故障排除技巧,包括日志分析、跟踪文件的解读以及问题定位和解决。 4. Oracle数据库版本: - 了解Oracle数据库的版本历史和特性,例如Oracle 8i, 9i, 10g, 11g, 12c等。 - 理解不同版本间的差异,以及这些...

    oracle DBA必看【深入浅出Oracle】

    《深入浅出Oracle》是Oracle数据库管理员(DBA)学习的重要参考资料,它涵盖了Oracle数据库的基础知识、进阶技术和故障诊断案例。对于想要深入了解Oracle DBA工作的人来说,这本书提供了全面且实践性强的学习路径。 ...

    实战JAVA虚拟机 JVM故障诊断与性能优化.rar

    通过分析堆转储文件(Heap Dump)和设置合适的内存参数(如-Xms, -Xmx)可以定位和解决问题。 2. 栈溢出:如果线程栈空间不足,会抛出StackOverflowError。通常由递归过深或方法调用链过长引起,可以通过调整栈大小...

    Oracle 8.1.6 admin (oracle 8.1.6 管理员指南)

    6. **故障诊断与问题解决**:学习如何通过日志文件(alert.log,trace文件)来识别和解决常见的数据库错误,以及如何使用Oracle的故障诊断工具。 7. **并发控制**:了解多用户环境下事务的并发操作,死锁的避免和...

    oracle经典100问

    9. **并发控制**:了解事务的概念,锁的类型(如行级锁、表级锁),以及死锁的预防和解决。 10. **集群与RAC**:Oracle Real Application Clusters(RAC)的原理和配置,如何实现高可用性和负载均衡。 11. **数据...

Global site tag (gtag.js) - Google Analytics