`
无量
  • 浏览: 1148342 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论
阅读更多
一次mysql死锁的排查过程

一、背景
  17号晚上要吃饭了,看旁边的妹子和佐哥还在调代码,就问了下什么问题啊,还在弄,妹子说,在测试环境测试给用户并发发送卡券时,出现了死锁,但看代码没有死锁,问题如下图



  看日志确实发生了死锁,按照死锁产生的原因:一般死锁是两把锁两个人争抢,每个人都获得其中一把,谁都不让谁,等待对方释放锁,死循环导致的,图示如下

 
   不过这次说看代码没有问题,感觉这个问题比较诡异,跟他们说先吃饭,吃完,一起群力群策研究研究这个。

二、问题点
1. ### SQL: select * from score_user where user_id = ? for update,这个sql查询是发送了死锁

三、排查过程
1. 根据经验和死锁产生的条件,猜测代码并发执行,一个线程先锁住了表A的记录,另外一个线程由于原因没有线索表A记录,而锁住了表B的记录,接下来,锁住A记录的线程等待B的锁是否,锁住B的线程等待A的锁释放,所以产生了原因,所以先看代码
2. 代码如下面所示,可以看到,基本逻辑,都是先插入score_gain_stream
@Transactional(propagation = Propagation.REQUIRED, isolation = Isolation.READ_COMMITTED,rollbackFor = Exception.class)
	public boolean generateScoreInfo(String userId, Integer score,
			Long scoreRuleId, int scoreType, int scoreStatus, String scoreWay,
			String orderId, String inviteeId, String reqId, Integer eventVersion) {

		//0:参数判断
		if(null == score || score <= 0) {
			log.warn("score null or < 0, userId:" + userId + "scoreRuleId:" + scoreRuleId + ",scoreWay:" + scoreWay);
			return true;
		}
		
		//1:获取用户等级   
		int memberLevel = MemberLevel.GENERAL_MEMBER;
		
		ScoreUser dbScoreUser = scoreUserManager.getScoreUserByUserIdForUpdate(userId);
		boolean isCreate = null == dbScoreUser ? true : false;
		if (!isCreate) {
			memberLevel = dbScoreUser.getMemberLevel();
		}
		
		// 2:构造/生成积分流水
		ScoreGainStream scoreGainStream = contructSocreGainStream(userId, score, scoreRuleId, scoreType, scoreStatus, scoreWay,
				orderId, inviteeId, reqId, eventVersion,memberLevel);
		
		boolean streamFlag = addScoreGainStream(scoreGainStream);
		
		if(!streamFlag){
			log.error("addScoreGainStream error,data:" + scoreGainStream.toString());
			return false;
		}
		
		// 3:判断用户类型
		if(isCreate){//新增积分用户信息
			try {
				boolean addFlag = addScoreUser(userId, memberLevel, scoreType, score);
				if(!addFlag){
					log.error("generateScoreInfo addScoreUser error, userId:" + userId + "|" + "score:" + score );
					throw new RuntimeException("generateScoreInfo addScoreUser error");
				}
			} catch (Exception e) {
				if(e instanceof DuplicateKeyException){
					log.warn("addScoreUser DuplicateKeyException,userId:" + userId + "|" + "score:" + score);
					//查询用户信息
					ScoreUser updateUser = contructUpdateScoreUser(scoreUserManager.getScoreUserByUserIdForUpdate(userId), score, scoreStatus);
					
					boolean flag = scoreUserManager.updateUserScoreInfoById(updateUser) > 0 ? true : false;
					if(!flag){
						log.error("generateScoreInfo updateUserScoreInfoById error, data:" + updateUser.toString());
						throw new RuntimeException("generateScoreInfo updateUserScoreInfoById error");
					}
					
					return true;
					
				}else{
					log.error("addScoreUser error,userId:" + userId + "|" + "score:" + score, e);
					return false;
				}
			}
			
			return true;
			
		}else{//更新积分用户信息
			ScoreUser updateScoreUser = contructUpdateScoreUser(dbScoreUser, score, scoreStatus);
			
			boolean flag = scoreUserManager.updateUserScoreInfoById(updateScoreUser) > 0 ? true : false;
			if(!flag){
				log.error("generateScoreInfo updateUserScoreInfoById error, data:" + updateScoreUser.toString());
				throw new RuntimeException("generateScoreInfo updateUserScoreInfoById error");
			}
			
			return true;
		}
	}

3. 看代码,不会发生死锁的,多个线程同时在执行,每个线程都开启事务,每个线程都加锁查询score_user,发现都没有查询到,那么每个线程都执行插入score_gain_stream操作,都成功,接下来,进行插入score_user,这里面只有一个线程可以成功,有唯一主键,其他线程这里会报错,接下来代码抓取异常,进行加锁查询,此时报错,死锁了

4. 理论上,报错,这里没有涉及争抢资源的情况,大家都在等待score_user释放,就一个锁,怎么会死锁呢,看来代码解决不了问题了

5. 再去查下mysql的死锁日志,看看死锁具体怎么产生的,如下图链接如何查询死锁日志
http://825635381.iteye.com/blog/2339503



看紫色中的三部分,
TRANSACTION 1292943095需要
RECORD LOCKS space id 553 page no 376 n bits 368 index `index_user_id` of table `tbj`.`score_user
这个位置的X锁,一直等待这个X锁

TRANSACTION 1292943097这个已经持有
RECORD LOCKS space id 553 page no 376 n bits 368 index `index_user_id` of table `tbj`.`score_user
这个位置的S锁,这样导致TRANSACTION 1292943095无法在这个位置获得X锁

TRANSACTION 1292943097这个事务接下来也在
RECORD LOCKS space id 553 page no 376 n bits 368 index `index_user_id` of table `tbj`.`score_user
这个位置的等待X锁

所以问题点有了:
1. 为什么有一个线程会持有S锁,看前面的代码结构没有加过S锁?
2. 还有为什么TRANSACTION 1292943097这个事务不能继续加X锁提交?


6.这边开始排查为什么会有S锁,查了很多资料,终于,在官网文档查询到了,如下
[b]
INSERT sets an exclusive lock on the inserted row. This lock is an index-record lock, not a next-key lock (that is, there is no gap lock) and does not prevent other sessions from inserting into the gap before the inserted row.Prior to inserting the row, a type of gap lock called an insertion intention gap lock is set. This lock signals the intent to insert in such a way that multiple transactions inserting into the same index gap need not wait for each other if they are not inserting at the same position within the gap.If a duplicate-key error occurs, a shared lock on the duplicate index record is set. This use of a shared lock can result in deadlock should there be multiple sessions trying to insert the same row if another session already has an exclusive lock. 
大体的意思是:insert会对插入成功的行加上排它锁,这个排它锁是个记录锁,而非next-key锁(当然更不是gap锁了),不会阻止其他并发的事务往这条记录之前插入记录。在插入之前,会先在插入记录所在的间隙加上一个插入意向gap锁(简称I锁吧),并发的事务可以对同一个gap加I锁。如果insert 的事务出现了duplicate-key error ,事务会对duplicate index record加共享锁。这个共享锁在并发的情况下是会产生死锁的,比如有两个并发的insert都对要对同一条记录加共享锁,而此时这条记录又被其他事务加上了排它锁,排它锁的事务提交或者回滚后,两个并发的insert操作是会发生死锁的。
[/b]

原理分析:这就找到上面问题为什么加上S锁的问题,当并发插入时,出现duplicate异常时,mysql会默认加上S锁,这就是为什么会出现死锁日志里面有个事务加上S锁了,也就同时解释了第二个问题,为什么事务没能提交,因为第一个事务也发生了duplicate异常,同时也对同一个位置加上了S锁,这样就出现了一种情况,多个线程对同一个位置持有S锁,每个线程都去这个位置争抢X锁,S和X锁两者是互斥关系,所以出现循环等待,死锁就此产生


关于mysql锁的机制,单独写个博客来介绍

四、解决办法
1. 并发插入时,不在一个事务内进行再次事务提交
2. 通过其他手段,如预创建账户,解决这个要并发插入的问题
3. 改并发为串行执行

五、解决过程

六、问题总结
1. mysql并发插入,出现duplicate时,会默认加S锁,这个坑啊,坑啊,要研究下为什么这么加



七、为什么会发生?
1. 知识体系,需要再次完善,技术无止境

欢迎大家关注我的公众号:


  • 大小: 52.9 KB
  • 大小: 19.1 KB
  • 大小: 9 KB
  • 大小: 41.8 KB
  • 大小: 49.7 KB
  • 大小: 26.7 KB
1
0
分享到:
评论
2 楼 无量 2016-11-22  
woodding2008 写道
楼主怎么解决的

昨天没时间了,今天继续写
1 楼 woodding2008 2016-11-22  
楼主怎么解决的

相关推荐

    一次Mysql死锁排查过程的全纪录

    本文将详细记录一次特定的MySQL死锁排查过程,以便于理解和处理类似的问题。 首先,死锁的基本概念是:当两个事务A和B相互持有对方需要的锁时,就会发生死锁。在事务A等待事务B释放锁的同时,事务B也在等待事务A...

    一次神奇的MySQL死锁排查记录

    本篇文章将深入探讨一次神奇的MySQL死锁排查记录,通过具体的案例帮助读者理解和解决这类问题。 在描述中提到的背景,我们了解到作者之前对MySQL锁机制有一定的了解,但在处理一个特定的死锁问题时遇到了挑战。问题...

    一个最不可思议的MySQL死锁分析1

    MySQL中的死锁问题是一个复杂而微妙的议题,尤其是在数据库优化和并发控制中。本文将深入探讨一个看似不可能发生的死锁案例,并分析其背后的原理。死锁通常发生在多个事务相互等待对方释放资源的情况下,但在这个...

    记一次排查线上MySQL死锁过程,不能只会curd,还要知道加锁原理.doc

    标题和描述中提到的事件是一次在线MySQL数据库发生的死锁问题,这突显了了解数据库加锁原理的重要性,而不仅仅是基础的CRUD操作。死锁是指两个或多个事务在执行过程中,因争夺资源而造成的一种相互等待的现象,若无...

    MySQL死锁的产生原因以及解决方案

    本文将探讨MySQL死锁的产生原因以及解决方案。 **死锁的产生原因** 1. **资源竞争与顺序依赖**:当两个事务A和B分别持有对方需要的资源,A等待B释放资源,B也在等待A释放资源,就会形成死锁。例如,事务A锁定表A后...

    Mysql 数据库死锁过程分析(select for update)

    避免这种死锁的一种方法是在设计事务时遵循一定的顺序规则,例如,确保所有事务按照相同的顺序访问和修改数据,或者使用`FOR UPDATE SKIP LOCKED`(Oracle支持,但MySQL不直接支持)来跳过已锁定的行。另外,可以...

    mysql innodb死锁问题详解.docx

    MySQL的InnoDB存储引擎在处理并发事务时可能会遇到死锁问题,这主要发生在多个事务互相等待对方释放资源的情况下。死锁通常由四个必要条件引发: 1. 互斥条件:资源只能被一个事务使用。 2. 请求和保持条件:一个...

    细说MySQL死锁与日志二三事

    MySQL数据库在运行过程中可能会遇到各种问题,其中死锁和日志分析是排查和解决数据库异常的关键环节。在本文中,我们将深入探讨MySQL的死锁现象以及如何通过日志来定位和解决问题。 首先,死锁是数据库操作中的一种...

    死锁查找与排除工具

    因此,这个工具可能是为这些数据库系统设计的,用于检测和解除SQL查询过程中出现的死锁。 在压缩包子文件的文件名称列表中,我们看到的是一些动态链接库(DLL)文件和一个可执行文件(find_deadlock.exe)。这些DLL...

    【MySQL面试第二弹】MySQL 服务占用cpu 100%,如何排查问题?

    3. **锁机制问题**:死锁是导致CPU飙升的一个重要原因。MySQL的InnoDB引擎支持事务和行级锁,不正确的锁策略可能导致死锁。通过`jstack`分析,若发现"deadlock"关键字,说明存在死锁,需要检查事务的执行顺序和锁的...

    从零开始MySQL PDF资源

    这也是非常不好的,因为每次建立一个数据库连接都很耗时,好不容易建立好了连接,执行完了SQL语句,你还把数据库连接给销毁了,下一次再重新建立数据库连接,那肯定是效率很低下的! 因此,一般我们必须要使用一个...

    SQL死锁监控工具

    MySQL数据库虽然没有内置的死锁日志,但在InnoDB存储引擎中,当发生死锁时,会自动检测并回滚其中一个事务,同时记录在"SHOW ENGINE INNODB STATUS"的输出中。通过对这些信息的分析,可以了解死锁的详细过程。 除了...

    MySQL排错指南.pdf

    《MySQL排错指南》是一本专门针对MySQL数据库系统在运行过程中遇到问题的解决方法和技巧的书籍。PDF格式使得读者可以方便地在电子设备上阅读和检索内容。MySQL作为世界上最流行的开源关系型数据库管理系统,其广泛...

    MySQL锁类型以及子查询锁表问题、解锁1

    MySQL在检测到死锁时会回滚其中一个事务以解决死锁。通过`SHOW ENGINE INNODB STATUS`可以查看死锁详情。 解决这种问题的一种方法是调整事务的隔离级别。MySQL默认的隔离级别是可重复读(REPEATABLE-READ),而...

Global site tag (gtag.js) - Google Analytics