`
bit1129
  • 浏览: 1069636 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

【HBase十三】HBase知识点总结

 
阅读更多

1. 数据从MemStore flush到磁盘的触发条件有哪些?

   a.显式调用flush,比如flush 'mytable'

   b.MemStore中的数据容量超过flush的指定容量,hbase.hregion.memstore.flush.size,默认值是64M

2. Region的构成是怎么样?

1个Region由若干个Store组成,每个Store对应表的一个Column Family,这也是HBase列式存储的由来。

1个Store对应1个或者多个HFile,每次MemStore数据转磁盘都会创建一个新的HFile。

一个Store中的这些HFile可能有大有小,HBase有一个Compact的过程,将所有这些HFile整理成一个大的HFile文件,如果HFile文件的大小超过一定值,那么HBase将触发Region分裂动作

3. Region分裂的时机

当Region中的所有Store中有一个HFile的大小超过了HBase指定的值hbase.hregion.max.filesize,那么分裂就会发生

4.何谓HFile Compact?

The store files are monitored by a background thread to keep them under control. The flushes of memstores slowly build up an increasing number of on-disk files. If there are enough of them, the compaction process will combine them to a few, larger files

 

5.如何查看HBase Shell命令的联机帮助

 

hbase > help "命令"

如:

hbase > help "get"

hbase > help "put"

hbase > help "scan"

 

6.HBase修改操作

 

修改操作仍然使用put命令,不过需要以存在的RowKey作为主键

 

6.1插入数据:

 

hbase(main):021:0> put 'my_table', 'row1', 'cf_1:name', 'tom'

6.2 修改数据

 

hbase(main):021:0> put 'my_table', 'row1', 'cf_1:name', 'tom2'

 

6.3 获取数据(结果是tom2)

 

hbase(main):021:0> put 'my_table', 'row1', 'cf_1:name'

 

6.4 指定版本得到tom (其中1429186296076表示时间戳)

 

get 'my_table', 'row1', {COLUMN=>'cf_1:name',TIMESTAMP => 1429186296076}

 

7. 问题:

put一个数据row1(更新) -> flush -> put一个数据row1(更新)->get  为什么能够得到最新版本的,它是从最新的HFile开始扫描?指定版本也是按照HFile新旧进行扫描?

 

 

 

 

分享到:
评论

相关推荐

    Hbase总结.docx

    以下是关于HBase Rowkey设计的一些关键知识点: 1. 唯一性原则:Rowkey必须确保全局唯一,避免数据冲突。这可以通过结合业务主键和时间戳或者哈希值来实现。 2. 长度原则:Rowkey应尽可能短,一般建议不超过16个...

    超全的HBase知识体系总结.pdf

    HBase是一个分布式、可扩展、列式...13. HBase大厂面试题解析部分未在提供的内容中显示,但通常会涉及到HBase架构、性能调优、数据模型等重要知识点。面试题的解析可以帮助应聘者更深入地理解HBase,为面试做好准备。

    HBase总结(超详细)

    分数不让我设定(最好是0)包含原理概念、架构、单机安装、分布式安装,HBase的优化及Phoenixd的一点拓展知识,二叉树,B树等等。。

    Hbase权威指南(HBase: The Definitive Guide)

    ### HBase权威指南知识点概述 #### 一、引言与背景 - **大数据时代的来临**:随着互联网技术的发展,人类社会产生了前所未为的数据量。这些数据不仅数量巨大,而且种类繁多,传统的数据库系统难以应对这样的挑战。 ...

    hbase学习-脑图总结

    hbase学习-脑图总结,涵盖了大部分基础知识点,下个脑图查看器即可,方便大家学习

    【HBase企业应用开发】工作中自己总结的Hbase文档,非常全面!

    HBase是Apache软件基金会旗下一个开源的非关系型分布式数据库(NoSQL),是Google ...HBase企业应用开发涉及的HBase文档通常会包含以上介绍的这些知识点,并针对企业实际应用场景给出详细的实现方案和最佳实践。

    Hbase实验报告.pdf

    以下是详细步骤及知识点解析: ### 1. HBase Shell基础 HBase Shell是HBase提供的命令行界面,用户可以通过它来与HBase集群交互。在开始实验之前,确保已经正确安装并配置了Hadoop和HBase环境。 ### 2. 创建表 ...

    hbase社区2018精选资料

    HBase社区2018精选资料的知识点涵盖了HBase生态系统的多个方面,包括HBase的基本概念、架构、组件、应用案例、技术实践、性能优化策略、新特性、平台实践以及社区动态等。HBase是一个高性能的开源NoSQL数据库,属于...

    大数据实验三-HBase编程实践

    ### HBase编程实践知识点 #### 一、HBase在Hadoop体系结构中的角色 HBase是一种分布式的、可扩展的大规模数据存储系统,它构建在Hadoop之上,特别是在Hadoop Distributed File System (HDFS)之上。HBase为结构化...

    Hadoop3.1.1集成hbase2.1.1

    以上是关于Hadoop3.1.1集成HBase2.1.1的知识点总结。由于文章可能来自扫描文档,存在个别字识别错误或者漏识别的情况,建议根据实际情况进行适当调整和修正。同时,在实际操作中,还应关注各个组件的版本兼容性问题...

    hbase 的java代码 集合 hbase 0.96

    下面我们将深入探讨HBase 0.96版本中的关键Java编程知识点。 首先,理解HBase的基础架构至关重要。HBase是构建在Hadoop之上的,利用HDFS作为其底层存储。在Java中,我们通过HBase客户端API与HBase交互,这些API包括...

    HBase核心知识点总结

    【HBase核心知识点总结】 HBase,作为一款基于Hadoop的分布式数据库,是解决大规模数据存储和快速访问问题的关键工具。其主要特点是稀疏性、分布式、持久化和多维有序映射,通过行键、列键和时间戳进行索引,支持...

    hbase备份和数据恢复

    在大数据领域,HBase是一个基于Hadoop的分布式数据库,它为海量结构化和半结构化数据提供了高可靠性、高性能的存储方案。...理解和掌握这些知识点对于管理和优化大数据环境中的HBase操作至关重要。

    经过测试,总结出可运行成功的C#For HBase示例代码

    在实际应用中,C#与HBase的交互可能涉及以下关键知识点: 1. **安装和配置HBase**: 首先,需要在服务器上安装并配置HBase,确保其正常运行。 2. **启动HBase REST服务**: 在HBase配置中启用REST接口,并启动对应的...

    2018HBase技术总结

    对于HBase的基本知识和案例分析,文档中提到其存储计算分离的特性非常适合构建大数据系统,并且已被国内多家大公司广泛应用。HBase2.0版本中引入的新功能,比如AssignmentManagerV2、高可用读RegionReplica、修复...

    HBase 权威指南(HBase The Definitive Guide)

    ### HBase 权威指南(HBase The Definitive Guide)关键知识点解析 #### 标题与描述中的核心概念 **HBase** 是一个开源的、分布式的、面向列的数据库系统,它运行在 **Hadoop** 文件系统之上,旨在处理大规模数据...

    Hbase集群部署.pdf

    总结来说,HBase集群部署涉及到多个层面的知识点,包括对HBase结构的理解、虚拟机环境的配置、JDK的安装和配置、SSH无密码登录的设置,以及HBase的配置。这些知识点不仅对于理解HBase的工作原理至关重要,而且对于...

    Apache HBase at DIDI

    根据提供的文件内容,以下知识点是关于Apache HBase在滴滴出行(DiDi)的使用情况的总结: 1. 关于滴滴出行 滴滴出行是全球领先的移动出行平台,每天有2000万次出行服务,包括快车、专车、拼车、巴士、出租车等...

    hbase入门和使用

    HBase入门和使用知识点总结: 1. HBase基本介绍: HBase是建立在Hadoop文件系统(HDFS)之上的一种开源、分布式、可扩展的非关系型数据库。它是一种列式存储系统,模仿Google的Bigtable模型,适用于海量数据的实时...

    Hadoop与HBase自学笔记

    ### Hadoop与HBase自学笔记知识点总结 #### 一、Hadoop与HBase简介 - **Hadoop**:是一款能够对大量数据进行分布式处理的软件框架。它通过提供高可靠性和高扩展性的分布式计算能力,使得用户能够在廉价的硬件设备...

Global site tag (gtag.js) - Google Analytics