hbase的行锁与多版本并发控制(MVCC)

san_yun

浏览: 2693177 次
来自: 杭州

最近访客更多访客>>

空城旧梦why

sd3870181

alexqdjay

hanmiao

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

HBase

参考：http://www.rigongyizu.com/hbase-row-lock-and-multiversion-concurrency-control/

MVCC (Multiversion Concurrency Control)，即多版本并发控制技术，它使得大部分支持行锁的事务引擎，不再单纯的使用行锁来进行数据库的并发控制，取而代之的是，把数据库的行锁与行的多个版本结合起来，只需要很小的开销，就可以实现非锁定读，从而大大提高数据库系统的并发性能。

HBase正是通过行锁+MVCC保证了高效的并发读写。

为什么需要并发控制

HBase系统本身只能保证单行的ACID特性。ACID的含义是：

原子性(Atomicity)
一致性(Consistency)
隔离性(Isolation)
持久性(Durability)

传统的关系型数据库一般都提供了跨越所有数据的ACID特性；为了性能考虑，HBase只提供了基于单行的ACID。

下面是一个hbase并发写的例子。

原始数据如下
mvcc

从Apache HBase Write Path一文可以知道hbase写数据是分为两步：
1. 写Write-Ahead-Log(WAL)文件
2. 写MemStore：将每个cell[(row,column)对]的数据写到内存中的memstore

写写同步

假定对写没有采取并发控制，并考虑以下的顺序：

mvcc

最终得到的结果是：

mvcc

这样就得到了不一致的结果。显然我们需要对并发写操作进行同步。
最简单的方式是提供一个基于行的独占锁来保证对同一行写的独立性。所以写的顺序是：

(0) 获取行锁
(1) 写WAL文件
(2) 更新MemStore：将每个cell写入到memstore
(3) 释放行锁

读写同步

尽管对并发写加了锁，但是对于读呢？见下面的例子：
mvcc

如果在上面的图中红线所示的地方进行读操作，最终得到的结果是：
mvcc

可见需要对读和写也进行并发控制，不然会得到不一致的数据。最简单的方案就是读和写公用一把锁。这样虽然保证了ACID特性，但是读写操作同时抢占锁会互相影响各自的性能。

MVCC算法

HBase采用了MVCC算法来避免读操作去获取行锁。

对于写操作：

(w1) 获取行锁后，每个写操作都立即分配一个写序号
(w2) 写操作在保存每个数据cell时都要带上写序号
(w3) 写操作需要申明以这个写序号来完成本次写操作

对于读操作:

(r1) 每个读操作开始都分配一个读序号，也称为读取点
(r2) 读取点的值是所有的写操作完成序号中的最大整数(所有的写操作完成序号<=读取点)
(r3) 对某个(row,column)的读取操作r来说，结果是满足写序号为“写序号<=读取点这个范围内”的最大整数的所有cell值的组合

在采用MVCC后的数据执行图：
mvcc

注意到采用MVCC算法后，每一次写操作都有一个写序号(即w1步)，每个cell数据写memstore操作都有一个写序号(w2，例如：“Cloudera [wn=1]”))，并且每次写操作完成也是基于这个写序号(w3)。

如果在“Restaurant [wn=2]” 这步之后，“Waiter [wn=2]”这步之前，开始一个读操作。根据规则r1和r2，读的序号为1。根据规则3，读操作以序号1读到的值是：

mvcc

这样就实现了以无锁的方式读取到一致的数据了。

重新总结下MVCC算法下写操作的执行流程：

(0) 获取行锁
(0a) 获取写序号
(1) 写WAL文件
(2) 更新MemStore：将每个cell写入到memstore
(2a) 以写序号完成操作
(3) 释放行锁

本文是基于HBase 0.92. 在HBase 0.94中会有些优化策略，比如 HBASE-5541 提到的。

英文原文：https://blogs.apache.org/hbase/entry/apache_hbase_internals_locking_and

参考：深入理解MVCC多版本并发控制

分享到：

HBase的数据的update | facebook的HBase经验

2014-11-16 12:57
浏览 6451
评论(2)
分类:非技术
查看更多

2 楼 san_yun 2017-09-14

leibnitz 写道

hi,我想知道,无论在92还是94版本,更新时(如Puts)都加上了至少获取一个rowlock的条件.但这意味着同一批次的余下puts不能获取到依然继续更新.
想问的是为什么至少一个rowlock呢?(而且代码要求是必须是first row's lock).
其实我看来mvcc已经保证了ACID的要求了.至于上面说到的写写问题,内部已经使用queueWrites来隔离,即atomicity已经实现.
thanks

这块我也不是很清楚诶

1 楼 leibnitz 2017-09-08

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论