HBase的get过程(一)

punishzhou

浏览: 143141 次

最近访客更多访客>>

perfect6566

irisYU

TieMushan

lujisen

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

HBase Server端

0.90.X的get和scan操作原理上是比较一致的，get操作都变为scan操作。不过在分析之前我们还是从get说起

话不多说首先看看get这个接口，hbase客户端对于get有以下几种：

public Get(byte [] row)

public Get(byte [] row, RowLock rowLock)

其中rowlock主要是用来保证行的事务性，即每个get是以一个row来标记的一个row中可以有很多family和column

get还有很多函数如addfamily，addcolumn，这里我主要以指定row family column来get数据

ok我们来看HTable的get操作

public Result get(final Get get) throws IOException {
    return connection.getRegionServerWithRetries(
        new ServerCallable<Result>(connection, tableName, get.getRow()) {
          public Result call() throws IOException {
            return server.get(location.getRegionInfo().getRegionName(), get);
          }
        }
    );
  }

这也是一个RPC调用的过程且其返回结果为Result。

1.调用HConnectManger的getRegionServerWithRetries(ServerCallable<T> callable)

callable.instantiateServer(tries != 0);
return callable.call();

这两步主要是找到该get的row所在的region，locateRegion

这个过程以后再来分析，总之就是找到该get所在的region，并与该region所在server通信

我们主要来看RegionServer端的Get操作，主要是region的get操作

List<KeyValue> result = get(get);

 private List<KeyValue> get(final Get get) throws IOException {
    Scan scan = new Scan(get);

    List<KeyValue> results = new ArrayList<KeyValue>();

    InternalScanner scanner = null;
    try {
      scanner = getScanner(scan);
      scanner.next(results);
    } finally {
      if (scanner != null)
        scanner.close();
    }
    return results;
  }

上述这个过程就是region的get过程，我们用下图来进行一个简单的描述