转至:http://www.cnblogs.com/WizardWu/archive/2010/08/13/1798645.html向原作者致敬
本帖提供两种做法,可避免在 SQL Server 事务锁定时产生的不正常或长时间阻塞,让用户和程序也无限期等待,甚至引起 connection pooling 连接数超过容量。
所谓的「阻塞」,是指当一个数据库会话中的事务,正在锁定其他会话事务想要读取或修改的资源,造成这些会话发出的请求进入等待的状态。SQL Server 默认会让被阻塞的请求无限期地一直等待,直到原来的事务释放相关的锁,或直到它超时 (根据 SET LOCK_TIMEOUT,本文后续会提到)、服务器关闭、进程被杀死。一般的系统中,偶尔有短时间的阻塞是正常且合理的;但若设计不良的程序,就可能导致长时间的阻塞,这样就不必要地锁定了资源,而且阻塞了其他会话欲读取或更新的需求。遇到这种情况,可能就需要手工排除阻塞的状态,而本文接下来要介绍两种排除阻塞的做法。
日前公司 server-side 有组件,疑似因撰写时 exception-handling 做得不周全,导致罕见的特殊例外发生时,让 SQL Server 的事务未执行到 cmmmit 或 rollback,造成某些表或记录被「锁定 (lock)」。后来又有大量的 request,要透过代码访问这些被锁定的记录,结果造成了严重的长时间「阻塞」,最后有大量 process (进程)在 SQL Server 呈现「等待中 (WAIT)」的状态。
由于 SQL Server 的「事务隔离级别」默认是 READ COMMITTED (事务期间别人无法读取),加上 SQL Server 的锁定造成阻塞时,默认是别的进程必须无限期等待 (LOCK_TIMEOUT = -1)。结果这些大量的客户端 request 无限期等待永远不会提交或回滚的事务,并一直占用着 connection pool 中的资源,最后造成 connection pooling 连接数目超载。
查了一些书,若我们要查询 SQL Server 目前会话中的 lock 超时时间,可用以下的命令:
SELECT @@LOCK_TIMEOUT
执行结果默认为 -1,意即欲访问的对象或记录被锁定时,会无限期等待。若欲更改当前会话的此值,可用下列命令:
SET LOCK_TIMEOUT 3000
后面的 3000,其单位为毫秒,亦即会先等待被锁定的对象 3 秒钟。若事务仍未释放锁,则会抛回如下代号为 1222 的错误信息,可供程序员编程时做相关的逾时处理:
消息 1222,级别 16,状态 51,第 3 行
已超过了锁请求超时时段。
若将 LOCK_TIMEOUT 设置为 0,亦即当欲访问对象被锁定时,完全不等待就抛回代号 1222 的错误信息。此外,此一 SET LOCK_TIMEOUT 命令,影响范例只限当前会话 (进程),而非对某个表做永久的设置。
-------------------------------------------------------------------------------------------
接下来我们在 SSMS 中,开两个会话 (查询窗口) 做测试,会话 A 创建会造成阻塞的事务进程,会话 B 去访问被锁定的记录。
--会话A
BEGINTRAN;
UPDATEOrdersSETEmployeeID=7WHEREOrderID=10248
--rollback;--故意不提交或回滚
--会话B
SELECT*FROMOrdersWHEREOrderID=10248
分别执行后,因为欲访问的记录是同一条,按照 SQL Server 「事务隔离级别」和「锁」的默认值,会话 B 将无法读取该条数据,而且会永远一直等下去 (若在现实项目里写出这种代码,就准备被客户和老板臭骂)。
-------------------------------------------------------------------------------------------
若将会话 B 先加上 SET LOCK_TIMEOUT 3000 的设置,如下,则会话 B 会先等待 3 秒钟,才抛出代号 1222 的「锁请求已超时」错误信息:
--会话B
SETLOCK_TIMEOUT3000
SELECT*FROMOrdersWHEREOrderID=10248
--SETLOCK_TIMEOUT-1
执行结果:
消息 1222,级别 16,状态 51,第 3 行
已超过了锁请求超时时段。
语句已终止。
-------------------------------------------------------------------------------------------
另根据我之前写的文章「30 分钟快快乐乐学 SQL Performance Tuning」所述:
http://www.cnblogs.com/WizardWu/archive/2008/10/27/1320055.html
撰写不当的 SQL 语句,会让数据库的索引无法使用,造成全表扫描或全聚集索引扫描。例如不当的:NOT、OR 算符使用,或是直接用 + 号做来串接两个字段当作 WHERE 条件,都可能造成索引失效,变成全表扫描,除了性能变差之外,此时若这句不良的 SQL 语句,是本帖前述会话 B 的语句,由于会造成全表扫描或聚集索引扫描,因此就一定会被会话 A 的事务阻塞 (因为扫描全表时,一定也会读到 OrderID=10248 这一条会话 A 正在锁定的记录)。
下方的 SQL 语句,由于 OrderID 字段有设索引,因此下图 1 的「执行计划」,会以算法中的「二分查找法」在索引中快速查找 OrderID=10250 的记录。
SELECT * FROM Orders WHERE OrderID=10250
SELECT * FROM Orders WHERE OrderID=10250 AND ShipCountry='Brazil'
图 1 有正确使用到索引的 SQL 语句,以垂直的方向使用索引。用 AND 算符时,只要有任一个字段有加上索引,就能受惠于索引的好处,并避免全表扫描
此时若我们将这句 SQL 语句,当作前述会话 B 的语句,由于它和会话 A 所 UPDATE 的 OrderID=10248 不是同一条记录,因此不会受会话 A 事务未回滚的影响,会话 B 能正常执行 SELECT 语句。
但若我们将会话 B 的 SQL 语句,改用如下的 OR 算符,由于 ShipCountry 字段没有加上索引,此时会造成聚集索引扫描 (和全表扫描一样,会对整个表做逐条记录的 scan)。如此一来,除了性能低落以外,还会因为在逐条扫描时,读到会话 A 中锁定的 OrderID=10248 那一条记录,造成阻塞,让会话 B 永远呈现「等待中」的状态。
SELECT * FROM Orders WHERE OrderID=10250 OR ShipCountry='Brazil'
图 2 未正确使用索引的 SQL 语句,以水平的方向使用索引。用 OR 算符时,必须「所有」用到的字段都有加上索引,才能有效使用索引、避免全表扫描
-------------------------------------------------------------------------------------------
发生阻塞时,透过以下命令,可看出是哪个进程 session id,阻塞了哪几个进程 session id,且期间经过了多少「毫秒 (ms)」。如下图 3 里 session id = 53 阻塞了 session id = 52 的进程。另透过 SQL Server Profiler 工具,也能看到相同的内容。
SELECT blocking_session_id, wait_duration_ms, session_id FROM sys.dm_os_waiting_tasks
图 3 本帖前述会话 A 的 UPDATE 语句 (53),阻塞了会话 B 的 SELECT 语句 (52)
透过以下两个命令,我们还能看到整个数据库的锁定和阻塞详细信息:
SELECT * FROM sys.dm_tran_locks
EXEC sp_lock
图 4 session id = 52 的 process 因阻塞而一直处于等待中 (WAIT)
另透过 KILL 命令,可直接杀掉造成阻塞的 process,如下:
KILL 53
-------------------------------------------------------------------------------------------
欲解决无限期等待的问题,除了前述的 SET LOCK_TIMEOUT 命令外,还有更省事的做法,如下,在会话 B 的 SQL 语句中,在表名称后面加上 WITH (NOLOCK) 关键字,表示要求 SQL Server,不必去考虑这个表的锁定状态为何,因此也可减少「死锁 (dead lock)」发生的机率。但 WITH (NOLOCK) 不适用 INSERT、UPDATE、DELETE。
SELECT * FROM Orders WITH (NOLOCK) WHERE OrderID=10248
类似的功能,也可如下,在 SQL 语句前,先设置「事务隔离级别」为可「脏读 (dirty read)」。
SET TRANSACTION ISOLATION LEVEL READ UNCOMMITTED
SELECT * FROM Orders WHERE OrderID=10248
两种做法的效果类似,让会话 B 即使读到被锁阻塞的记录,也永远不必等待,但可能读到别人未提交的数据。虽然说这种做法让会话 B 不用请求共享锁,亦即永远不会和其他事务发生冲突,但应考虑项目开发实际的需求,若会话 B 要查询的是原物料的库存量,或银行系统的关键数据,就不适合用这种做法,而应改用第一种做法的 SET LOCK_TIMEOUT 命令,明确让数据库抛回等候逾时的错误代号 1222,再自己写代码做处理。
-------------------------------------------------------------------------------------------
归根究柢,我们在编程时,就应该避免写出会造成长时间阻塞的 SQL 语句,亦即应最小化锁定争用的可能性,以下为一些建议:
- 尽可能让事务轻薄短小、让锁定的时间尽量短,例如把不必要的命令移出事务外,或把一个大量更新的事务,切成多个更新较少的事务,以改善并发性。
- 将组成事务的 SQL 语句,摆到一个「批(batch) 处理」,以避免不必要的延迟。这些延迟常由 BEGIN TRAN ... COMMIT TRAN 命令之间的网络 I/O 所引起。
- 考虑将事务的 SQL 语句写在一个存储过程内。一般来说,存储过程的执行速度会比批处理的 SQL 语句快,且存储过程可降低网络的流量和 I/O,让事务可更快完成。
- 尽可能频繁地认可 Cursor 中的更新,因为 Cursor 的处理速度较慢,会让锁定的时间较长。
- 若无必要,使用较宽松的事务隔离级别,如前述的 WITH (NOLOCK) 和 READ UNCOMMITTED。而非为了项目开发方便,全部使用默认的 READ COMMITTED 级别。
- 避免在事务执行期间,还要等待用户的反馈或交互,这样可能会造成无限期的持有锁定,如同本帖一开始提到的状况,最后造成大量的阻塞和数据库 connection 被占用。
- 避免事务 BEGIN TRAN 后查询的数据,可能在事务开始之前先被引用。
- 避免在查询时 JOIN 过多的表 (此指非必要的 JOIN),否则除了性能较差外,也很容易读到正被锁定或阻塞中的表和字段。
- 应注意在一个没有索引的表上,过量的「行锁」,或一些锁定使用了过多的内存和系统资源时,SQL Server 为了有效地管理这些锁定,会尝试将锁定扩展为整个表的「表锁」,此时会很容易造成其他 process 在访问时的阻塞和等待。
-------------------------------------------------------------------------------------------
本帖尚未提到死锁和其他更进阶的议题,等下次有空再继续泡茶聊天。
分享到:
相关推荐
### SQL Server 2008 阻塞查询与处理 #### 一、阻塞查询的概念及原因 在SQL Server 2008环境中,阻塞是指一个事务或操作因为某些资源(如锁、行、页等)被另一个正在运行的操作占用而无法继续执行的状态。阻塞通常...
在SQL Server数据库管理系统中,死锁是一个...总的来说,通过监控未提交事务、查找阻塞和死锁的SQL语句,以及适时使用`KILL`命令,我们可以有效地管理和解决SQL Server中的死锁问题,确保数据库系统的稳定和高效运行。
同时,了解并熟悉数据库的并发控制机制,如SQL Server的锁定和事务隔离级别,Oracle的多版本并发控制(MVCC),也是避免和解决阻塞的关键。 总之,数据库阻塞监控是数据库管理的重要环节。掌握有效的监控工具,理解...
SQL Server误区30日谈系列文章深入探讨了在使用Microsoft SQL Server时常见的错误理解和实践,由著名SQL Server专家Paul S. Randal撰写,涵盖了多个关键领域,以下是对文章中提到的知识点的详细解读。 误区#1:...
【SQL Server和Oracle并行处理比较分析】 在数据库系统中,数据一致性是核心问题之一,尤其是在高并发的环境中。SQL Server和Oracle作为两大主流的关系型数据库管理系统,它们各自采用了独特的并行处理策略来应对这...
本文将探讨SQL Server中的数据锁定技术,包括其锁的类型、锁定粒度、热点争用、死锁等关键问题,并着重分析如何通过这些技术提升应用系统的稳定性和性能。 首先,数据锁定技术在多用户数据库系统中扮演着不可或缺的...
SQL Server提供了日志运输、数据库镜像和Always On可用性组等技术来保证高可用性和快速恢复。 综上所述,SQL Server并发连接测试是一个涉及多方面知识的复杂过程,包括锁定、事务隔离、并发控制策略、性能调优、...
通过合理利用系统监视器、SQL Server Profiler、SQL Trace和DMVs等工具,可以有效地发现并解决各种性能瓶颈。此外,通过优化查询、增加硬件资源、合理规划tempdb等措施,可以进一步提升SQL Server的整体性能。 ####...
- **SQL Server Profiler**:用于捕获有关数据库活动的详细信息,包括查询计划、执行时间和阻塞情况等。 - **性能监视器(Perfmon)**:提供了一组计数器,用于监控SQL Server的性能,特别是在事务处理方面。 **2. ...
SQL Server中的动态管理视图(DMV)和动态管理函数(DMF)是数据库管理员(DBA)用来监控和诊断SQL Server实例性能的有力工具。自从SQL Server 2005引入这些视图和函数之后,DBA能够使用系统提供的内置函数来获取关于...
SQL Server提供了多种工具和方法来检测和分析死锁,以便管理员能够及时发现并解决问题。本文将详细介绍如何在SQL Server中分析死锁进程,特别是如何通过存储过程来捕捉和分析死锁信息。 ### 死锁分析存储过程 在...
- **日期与时间**: SQL Server 2005引入了`DATE`, `TIME`和`DATETIME2`等数据类型,使得处理日期和时间变得更加精确和高效。 - **可变精度货币**: `MONEY`类型被`DECIMAL`和`NUMERIC`所替代,提供了更高的精度选项。...
在探讨SQL Server中的阻塞和死锁之前,我们首先需要理解事务的基本特性——ACID特性,即原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)和持久性(Durability)。 - **原子性**:事务中的所有...
【Sqlserver 高并发和大数据存储方案】 在面临高并发和大数据存储的挑战时,Sqlserver 提供了一系列的策略和优化方法。以下是一些关键点的详细解释: 1. **解决高并发问题**: - **异步处理**:面对大量并发写...
行版本控制是SQL Server 2005引入的一种技术,用于支持快照隔离和读已提交隔离级别,它通过存储行的历史版本来避免锁定冲突。 理解SQL Server的锁机制并合理应用,对于优化数据库性能、防止数据不一致以及解决并发...
SQLServer数据库查看器是一款专为管理和查看SQL Server服务器上的数据库设计的应用程序。它提供了全面的数据库浏览和查询功能,使得用户能够轻松地查看服务器上的所有数据库,以及数据库中包含的表和字段信息。这款...
总结来说,理解和掌握SQL Server 2000中的死锁处理、事务隔离级别以及锁定策略对于有效管理数据库系统至关重要,尤其是对于涉及大量并发操作的业务环境。通过优化事务逻辑和选择合适的隔离级别,可以有效地平衡数据...
2 就不能更新记录,因为共享锁优先于排它锁,这是 SQL Server 7 之前的版本,为了避免锁饥饿,Lock Manager 会阻塞其他共享锁。 死锁:典型例子为两个进程都要更新对方锁定的记录,谁也不愿释放自己已实施的锁。这...