行
行健
列
时间戳
列簇<family>
限定符<qualifier>
元素
HBase以表的形式存储数据,每个表由行和列组成,每个列属于一个特定的列族。
表中由行和列确定的存储单元称为一个元素,每个元素保存里同一份数据的多个版本,有时间戳来标识。
行健是数据行在表中的唯一标识,并作为检索记录的主键。
在HBase中访问表中的行只有三种方式:通过单个行健访问;给定行健的范围访问;全表扫描。
行健可以是任意字符串(最大长度64KB),并按照字典序进行存储。
时间戳对应着每条数据操作所关联的时间,可以由系统自动生成,也可以由用户显式地赋值。注意,如果应用程序需要避免数据版本冲突,则必须显式地生成时间戳。
HBase提供了两种数据版本的回收方式:一是对每个数据单元,只存储指定个数的最新版本;二是保存最近一段时间内的版本(比如7天)。
Region
HRegionServer(Region服务器程序)
HRegion(Region实例)
HLog(WAL,Write-Ahead Log预写式日志)
Store
memStore
StoreFile
HMaster
.META.
ROOT
相关推荐
【标题】:“HBase简介共8页.pdf.zip”是一个压缩文件,其中包含了关于HBase的详细介绍,一共8页内容。HBase是Apache软件基金会开发的一个开源分布式数据库,它基于Google的Bigtable设计,并且构建在Hadoop之上。...
### 林昊 HBase简介与实践分享 #### HBase概览 HBase是一个分布式的、面向列的开源数据库,该数据库的设计受到了Google的Bigtable论文的启发。它是在Hadoop之上构建的一个高度可扩展的数据存储系统,适用于实时数据...
HBase思维导图,便捷整理思路,HBase简介、HBase架构、HBase数据模型、HBase角色
大数据云计算技术系列 Hbase 简介 一、简介 Hbase源于Chad Walters和Jim在2006年11月提出的BigTable概念,它是一个开源的分布式数据库,最初作为Hadoop贡献项目的一部分在2007年2月创建。2007年10月,Hbase成为首...
Hadoop技术-HBase简介 HBase,全称为Hadoop Database,是Apache软件基金会下的一个开源项目,也是Hadoop生态系统中的重要组成部分。它是一款高度可扩展的NoSQL数据库,专为处理大规模非结构化和半结构化数据而设计...
HBase简介.pdf
HBase简介与实践分享
淘宝-林昊_HBase简介与实践分享
### HBase简介及安装知识点详解 #### 一、HBase概述 **HBase** 是一个构建在 **Hadoop** 分布式文件系统 (HDFS) 之上的分布式、可扩展的大规模数据存储系统。它是针对大数据量场景设计的,特别适用于需要实时读写...
Hbase简介,基础篇
【大数据与云计算培训学习资料 Hadoop集群 细细品味Hadoop_第11期_HBase简介及安装_V1.0 共21页.pdf】这篇文档主要介绍了HBase这一大数据处理的重要组件,以及其在Hadoop生态系统中的角色。HBase是一个基于列族的...
标题中的“大数据云计算技术系列 Hadoop之Hbase简介”揭示了我们要探讨的核心主题:HBase,它是Apache Hadoop生态系统中的一个分布式、版本化、列族式数据库,特别适合处理和存储大规模数据。HBase充分利用了Hadoop...
hbase简介,主要从hdfs开始介绍hbase,讲的比较细致生动
HBase是一种基于Hadoop生态系统的分布式列式存储系统,它为大数据处理提供了高效、可靠且可扩展的解决方案。HBase的设计灵感来源于Google的Bigtable,但它是开源的,旨在适应低成本的PC服务器集群,用于构建大规模...
### HBase技术深入解析 #### 引言 HBase,作为大数据领域中一款重要的分布式数据库系统,基于Hadoop生态系统构建,旨在提供高可靠、高性能的数据存储与查询服务。本文将全面解析HBase的核心概念、技术架构及应用...
从数据模型、物理储存、架构等方面介绍,比较简介通俗
三、HBase Table 四、Phoenix 三、HBase Table 四、Phoenix
#### 一、HBase简介与背景 HBase是Apache Hadoop生态系统中的一个分布式、可扩展的列族数据库,它提供了类似Bigtable的能力,能够在大规模数据集上进行随机读写操作。HBase是基于Hadoop Distributed File System ...