Hbase路由代码分析 -

zlx19900228

浏览: 52049 次
性别:
来自: 杭州

最近访客更多访客>>

风语丶寄离愁

04370112

leogao2018

limingji0503

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

Hbase路由代码分析

HBase Cache ITeye

原创文章，请各位多多指导，有错误希望各位能及时告诉我，感激不尽～
（1）前面我们说了，locateRegion这个函数会根据tablename，rowkey，usercache，来定位data放在哪个reginserver上，那么具体是如何定位的呢？阅读源码，一行一行的仔细来看：（PS:Hbase的很多参数可以在Hconstants类中找到）
a) 首先会检查与zookeeper的链接是否close了，如果close了，那么就会抛出throw new IOException(toString() + " closed");异常，接下来判断传入的tablename，参数是否有误，以及抛出相应exception
b) Next,会判断传入的tablename是否eques HConstants.ROOT_TABLE_NAME，即是否是-ROOT-表，如果是，那么就会调用rootRegionTracker，从zookeeper上获得-ROOT-表所在的RegionServer，返回包装后的HregionLocation对象，这里用户可以设置超时时间：
this.rpcTimeout = conf.getInt(
HConstants.HBASE_RPC_TIMEOUT_KEY,
HConstants.DEFAULT_HBASE_RPC_TIMEOUT);默认超时时间是DEFAULT_HBASE_RPC_TIMEOUT = 60000，hbase.rpc.timeout是设置超时时间的参数名称。
c) Next,会判断传入的tablename是否eques HConstants.META_TABLE_NAME，即.META.表，如果是，那么调用locateRegionInMeta方法，该方法参数传入parenttable，tablename,row,usecache，regionLockObject，首先会根据用户是否设置了cache，判断是否从cache中读取HregionLocation，如果说从cache中拿不出来table的信息，那么就会继续触发下面函数，调用HregionInfo来create一个metakey，这个metakey即region的meta信息，接下来在设置的retyiestimes(hbase.client.retries.number，默认值是10)内，尝试定位locateRegion，这里即调用上一步说到的locateRegion函数，这是一个递归的调用，这里传入的parentablename是root表name，那么这里就会得到root所在的regionserver的链接，在获得链接之后，会在获取regionInfoRow代码中加锁，这是为了防止2个线程并发的同时去获得region的meta信息，加锁之后，第一个访问的线程查询返回结果之后，第二个线程会use the value that the first one found.下面便会调用 server.getClosestRowBefore，从root表中查找RowKey最接近的row，并获得这个row所在的regionserver，然后返回HregionLocation。Root表以及meta表的结构是完全一样的，例如下面：

d) Next，因为不是root表，也不是meta表，那么就会将metatable名称当作parenttable传入locateRegionInMeta函数，去定位region，这里的调用和前一步meta表调用类似。
e) 大致调用步骤可以归类为：
1. 根据传入的tablename,rowkey,timestamp合成metakey
2. 根据传入的parenttable，metakey，定位父级region，这个定位过程是递归的，以用户表为例，假如表明为table1，那么table1的parenttable是.META.,.META.的parenttable是-ROOT-，这样递归调用返回就是metakey所在的regionserver，
3. 打开定位的regionserver的connection，这里就是打开.META.表的 regionserver。
4. 从打开的regionserver的connection查询ClosestRowBefore，拿到regionInfoRow，这里的结构就是上图中的图1。
5. 从regionInfoRow这个Result中拿出info columnfamily中的regioninf列的value，然后用这个value生产HregionInfo对象。
6. 从regionInfoRow这个Result中拿出info columnfamily中的server列的value。
7. 根据5，6步拿到的HregionInfo以及server地址，生产HregionInfo对象。
8. 将7生产的HregionInfo放入cache，然后返回HregionInfo对象。