HBase的数据的update

san_yun

浏览: 2685171 次
来自: 杭州

最近访客更多访客>>

空城旧梦why

sd3870181

alexqdjay

hanmiao

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

HBase

hbase是以rowkey，column，timestamp这三个维度来区分的。

即如果两条记录其rowkey，column，timestamp一样的话，那么hbase就会认为其是相同的数据。

Java代码  
         row     column   value   time  
put      r1     cf:c1      '5'       10  
put      r1     cf:c1      '6'       10  
put      r1     cf:c2      '7'    
put      r1     af:c2      '8'  
put      r2     cf:c1      '9'  

如上所示首先插入一条数据其值为5，然后又插入一条数据其值为6.

此时用客户端接口取到的都是value=‘6’的数据，这可以认为是对原数据的一个覆盖。

我们知道hbase的write数据是以append的形式追加的。只有当前compact的时候才会进行无效数据删除。

那么在compact之前hbase的存储文件就存在该记录的两份不同的数据，那么hbase是怎么区别这两份数据，并返回给用户的呢，下面从代码角度来分析

首先我们来看hbase的put过程，这个逻辑比较清除，首先根据table，和row找到相对应的region，然后和该region的regionserver通信。

其写入过程是一个wal过程，即先写日志后写内存，保证数据不会因为regionserver down而丢失。

写日志的过程不赘述了。

主要来看看写memstore的过程：

Java代码  
private long applyFamilyMapToMemstore(Map<byte[], List<KeyValue>> familyMap) {  
  ReadWriteConsistencyControl.WriteEntry w = null;  
  long size = 0;  
  try {  
    w = rwcc.beginMemstoreInsert();  
  
    for (Map.Entry<byte[], List<KeyValue>> e : familyMap.entrySet()) {  
      byte[] family = e.getKey();  
      List<KeyValue> edits = e.getValue();  
  
      Store store = getStore(family);  
      for (KeyValue kv: edits) {  
        kv.setMemstoreTS(w.getWriteNumber());  
        size += store.add(kv);  
      }  
    }  
  } finally {  
    rwcc.completeMemstoreInsert(w);  
  }  
  return size;  
}  

rwcc是用来控制读写一致性的，对于任何一个put，当其写入memstore的时候，都会设置其MemstoreTs的值。

而这个值在内存中是以一个递增的形式存在的，即新写入内存的数据比旧的其MemstoreTs大。而这个值就是用来保证在内存中的update的可靠性。举个例子，还是上面的两个put

1. put r1 cf:c1 '5' 10
2. put r1 cf:c1 '6' 10

第一条记录首先写进内存其memstoreTs为1，第二条记录的memstoreTs为二，那么第二条记录在内存中就排在第一条记录前面，说到这来看看内存中数据是怎么排序的。

我们知道hbase 是以key-value存放数据的，其底层存储完全依赖HDFS文件系统。

同样在内存中存储的也是key-value，在磁盘上是以storefile（hfile）存储，且都是有序的

其排序规则如下：

（以自然序列排序 a<b,2<3,23<3）

首先比较 rowkey 小的排前面

然后是 family小的排前面

接下来按排 column

然后是timestamp 排序时间越大的拍前面

接下来是按key的TYPE排序有min，delete，deleteFamily，put，deletecolumn，max

最后比较文件的maxsequenceId，越大的说明越新排在前面。memstore的maxsequenceId默认是整数最大值

如果是两个相同key的put的数据都在内存里那么上面的比较规则就都不适用了，此时就会比较这两个put的memstoreTs, 大的排在前面。

我们知道一个put里面可以有很多cf，那么如果在一个put当中有两个一样的数据，此时会如何呢。

这个hbase也做了处理。一个put中维护的是一个familymap<family,map<>>格式，显然当有两条一致的数据插入时，map自动会覆盖前一条数据。

那么此时用户以指定key取该条数据的话，会遵循以下原则：

首先从定位memstore和每个storefile(一个family就是一个Hstore，包裹一个Memstore和n个storefile)的target value的row的起始处。，比较当前memstoe和storefile的keyvalue，选取最靠前的数据，若满足则返回，若不满足则取下一条知道找到为止。

显然在这个过程中上述的put的第二条数据肯定是在第一条数据前面的，所以首先会取到第二条即最新的数据~~~

hbase就是通过keyvalue的排序和get的机制来保证取到的都是最新的value

分享到：

HBase的get过程(一) | hbase的行锁与多版本并发控制(MVCC)

2014-11-16 13:33
浏览 888
评论(0)
分类:非技术
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论