每个region都保存着一个HTable表的一个rowkey区间的数据,而每个HRegion Server都维护着HMaster Server分配个它的一些regions(默认情况下10 - 1000个,每个region大小默认为256MB),那么客户端到底是怎么通过一个给定的rowkey就知道要匹配的数据是在哪个服务器上的哪个region上的呢?谜底就是,HBase通过提供了2个特殊的叫做-ROOT-和.META.的目录表(catalog table)来支持这一region查找的。
Zookeeper中存储着-ROOT-和.META.表的位置。.META.表里保存的是HRegion标识符和HRegion Server服务器的映射,该表会随着数据的增长而变大,并且也会被分割;为了定位这些.META.region,HBase使用-ROOT-表来存储这些.META.表的位置信息,-ROOT-表不会被分割,整个HBase集群中只有唯一的一个。
这两个目录表在结构上和普通的HTable表没什么区别,就是这两个表的用处特殊,而且是由系统维护其中的数据——Region的分布情况以及每个Region的详细信息。
-ROOT-表结构大致如下所示:
由上图可以看到,-ROOT-表中的每一行都记录而一个HTable的region和该region所在的HRegin Server的地址的信息;该表是唯一的,并且永远不会被分割,这保证了region查询是一个类似B+Tree的3级的查找模式:
1、第一级就是Client到Zookeeper中获取-ROOT-表的地址;
2、第二级就是Client从-ROOT-表中请求rowkey所属的.META.region的位置;
3、第三级就是Client从.META.表中查找到rowkey所在的region的HRegion Server位置。
在经过这三步操作后,我们就可定位到要查询的rowkey所在的HRegion Server,然后客户端直接连接这个HRegion服务器,在rowkey所属的region上查询数据。整个流程如下图所示:
客户端查询流程示意图
- 大小: 35.4 KB
- 大小: 125.5 KB
分享到:
相关推荐
通过上述内容可以看出,《HBase权威指南》全面而深入地介绍了HBase的相关知识和技术要点,无论是对于初次接触HBase的新手还是想要深入了解其内部机制的资深开发者来说,都是一本不可多得的好书。该书不仅详细解释了...
hbase权威指南中文完整版pdf 12章+6附录
2. **HBase架构**:HBase的架构由Region Server、Master Server、Zookeeper和表、Region、Row Key等组成。Region Server负责实际的数据存储和处理,Master Server负责全局的元数据管理和Region分配,Zookeeper用于...
《HBase权威指南》是一本深入探讨分布式大数据存储系统HBase的专业书籍,旨在为读者提供全面、详尽的HBase知识。这本书涵盖了从基础概念到高级应用,包括HBase的架构设计、数据模型、表设计策略、性能优化、监控与...
《HBase权威指南》是HBase领域的经典著作,旨在深入解析这款分布式大数据存储系统的方方面面。随书提供的源代码是理解书中理论与实践结合的关键。在本文中,我们将围绕HBase的核心概念、架构以及如何通过源代码学习...
《HBase权威指南》是一本深入探讨Apache HBase这一分布式列式数据库的著作,源码则是作者为了辅助读者理解书中理论知识而提供的实践材料。HBase是构建在Hadoop文件系统(HDFS)之上的开源数据库,专为处理大规模数据...
《HBase权威指南》是一本深入探讨分布式列式数据库HBase的专业书籍,其配套源码提供了书中所提及的示例代码和实践案例,方便读者更好地理解和应用HBase。以下将详细解析HBase的相关知识点。 HBase是建立在Apache ...
《hbase权威指南》探讨了如何通过使用与hbase高度集成的hadoop将hbase的可伸缩性变得简单;把大型数据集分布到相对廉价的商业服务器集群中;使用本地java客户端,或者通过提供了rest、avro和thrift应用编程接口的...
Hbase权威指南 随书源代码 源码包 绝对完整版 maven工程,带pom文件,可以直接作为一个完整工程导入eclipse等ide。
2. **HBase架构**:HBase的核心架构包括Region服务器、Master节点、ZooKeeper和表与列族。Region服务器负责存储和处理数据,Master节点管理Region的分配和表的元数据,ZooKeeper提供高可用性和一致性保障,表由列族...
《HBase权威指南》是一本深入探讨分布式大数据存储系统HBase的专业书籍,其源代码的提供为读者提供了更直观的学习材料。HBase是基于Apache Hadoop的非关系型数据库(NoSQL),它在大规模数据存储方面表现卓越,尤其...
HBase权威指南中文版
hbase权威指南中文版hbase权威指南中文版hbase权威指南中文版 hbase权威指南中文版hbase权威指南中文版hbase权威指南中文版
《HBase权威指南》探讨了如何通过使用与HBase高度集成的Hadoop将HBase的可伸缩性变得简单;把大型数据集分布到相对廉价的商业服务器集群中;使用本地Java客户端,或者通过提供了REST、Avro和Thrift应用编程接口的...
Hbase权威指南中文版 带目录 人民邮电出版社 Hbase权威指南中文版 带目录 人民邮电出版社
《HBase权威指南》是一本深入探讨分布式列式数据库HBase的专业书籍,旨在帮助读者全面理解和掌握这一强大的大数据存储系统。HBase是构建在Apache Hadoop之上,专门为处理大规模数据而设计的非关系型数据库(NoSQL)...