`
lc_koven
  • 浏览: 353306 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

hbase中的缓存的计算与使用

阅读更多

 

    hbase中的缓存分了两层:memstore和blockcache。

 

    其中memstore供写使用,写请求会先写入memstore,regionserver会给每个region提供一个memstore,当memstore满64MB以后,会启动flush刷新到磁盘。当memstore的总大小超过限制时(heapsize * hbase.regionserver.global.memstore.upperLimit * 0.9),会强行启动flush进程,从最大的memstore开始flush直到低于限制。

 

    blockcache主要提供给读使用。读请求先到memstore中查数据,查不到就到blockcache中查,再查不到就会到磁盘上读,并把读的结果放入blockcache。由于blockcache是一个LRU,因此blockcache达到上限(heapsize * hfile.block.cache.size * 0.85)后,会启动淘汰机制,淘汰掉最老的一批数据。

 

    一个regionserver上有一个blockcache和N个memstore,它们的大小之和不能大于等于heapsize * 0.8,否则hbase不能启动。默认blockcache为0.2,而memstore为0.4。对于注重读响应时间的系统,应该将blockcache设大些,比如设置blockcache=0.4,memstore=0.39。这会加大缓存命中率。

分享到:
评论

相关推荐

    HBase学习利器:HBase实战

    集成与生态**:HBase不仅与HDFS紧密结合,还与Hadoop生态系统中的其他组件(如Pig、Hive、Spark等)有着良好的集成关系,使得数据处理更加便捷高效。 总之,《HBase in Action》这本书全面覆盖了HBase的基础知识和...

    Hbase权威指南(HBase: The Definitive Guide)

    - **高度集成**:HBase与Hadoop生态系统紧密结合,充分利用Hadoop提供的资源管理和计算框架。 - **MapReduce集成**:HBase支持MapReduce任务直接对存储在HBase中的数据进行处理,这大大简化了数据处理流程,提高了...

    hbase在阿里搜索中的应用

    在阿里搜索的架构中,HBase扮演着核心存储系统的角色,与计算引擎紧密结合,主要用于支撑搜索和推荐业务。它的应用场景包括: - 索引构建:HBase支持从MySQL等数据库中导入商品和用户产生的线上数据,通过流式处理...

    storm-hbase集成

    1. 创建 HBase 连接:在 Storm 中,需要使用 HBase 客户端库初始化一个 HBase 连接。 2. 配置表和列族:定义要写入的 HBase 表和列族信息。 3. 数据转换:将 Storm 中的数据流转换为适合 HBase 存储的格式,例如键值...

    大数据HBASE考题材料

    HBase中的批量加载通常使用MapReduce实现,这种方式可以有效地处理大量的数据导入操作。 #### 多项选择题解析 1. **HBase的特性** - HBase是开源的:虽然题目中提到“不是开源的”这个选项不正确,但HBase确实...

    hbase API

    - MPI(Message Passing Interface)通常用于高性能计算,将HBase与MPI结合可能涉及到分布式并行计算场景。例如,利用MPI在多节点间协调HBase操作,进行大规模数据处理。 学习HBase API,不仅需要理解其基本概念,...

    hbase-1.3.0.tar.gz

    在本篇文章中,我们将深入探讨HBase 1.3.0在Hadoop 2.7.7、Hive 2.3.6和Zookeeper 3.4.6环境下的部署与应用。 首先,Hadoop 2.7.7是Hadoop生态系统的核心组成部分,提供了分布式存储和计算的基础。HBase依赖于HDFS...

    Apache HBase ™ Reference Guide

    在 OS 脚本中使用 HBase Shell**:展示了如何在操作系统级别的脚本中调用HBase shell命令。 - **16. 从命令文件读取 HBase Shell 命令**:解释了如何从外部命令文件读取并执行HBase shell命令。 - **17. 向 Shell ...

    WordCount,HBase MR样例代码

    5. **实例演示**:可能会提供一个完整的示例,展示如何从HBase中读取数据,使用MapReduce进行处理,然后将结果写回HBase。 6. **执行与调试**:说明如何在Hadoop集群上提交和监控MapReduce作业,以及如何解决可能...

    Hadoop之Hbase从入门到精通

    5. **Pig**:可以使用Pig Latin这种流程控制语言来处理HBase中的数据,通常会转化为MapReduce作业执行。 6. **Hive**:尽管当前版本的Hive不直接支持HBase,但即将发布的版本(0.7.0)将支持这一特性,使得用户可以...

    HBase专场:HBase在时序数据库中的应用(悠你).pdf

    在本文档中,专家悠你123深入探讨了HBase在时序数据库中的应用,以下是从文档标题、描述和部分内容中提取的详细知识点。 HBase是一种分布式、可扩展的存储系统,它基于Google的Bigtable模型,专为Hadoop设计,提供...

    hbase

    HBase是Apache Hadoop生态系统中的一个分布式、高性能、版本化、列族式数据库,它设计用于处理海量数据,尤其适合实时读写操作。HBase基于谷歌的Bigtable论文设计,但针对Hadoop环境进行了优化。在理解HBase的体系...

    使用HBase构建大数据生态.pdf

    使用HBase构建大数据生态,意味着能够在HBase之上实现多样化的数据处理和计算需求。 CTBase是一个轻量级的HBase客户端,它是为了解决结构化数据的场景需求而设计的。CTBase设计动机在于,大多数客户需求是结构化...

    hadoop和HBase常用shell命令

    在工作中,我们经常需要使用 Hadoop 和 HBase 的 shell 命令来管理和操作数据。下面是 Hadoop 和 HBase 常用 shell 命令的详细介绍。 HBase shell 命令 ### 1. 进入 HBase shell Console 在使用 HBase 之前,我们...

    hbase-2.0.2-bin.tar

    要使用这个"**hbase-2.0.2-bin.tar**"文件,你需要首先解压,然后配置HBase的环境变量,包括HBase的安装目录、Hadoop的相关路径等。接着启动HBase的Master进程和RegionServer进程,完成集群部署。一旦运行起来,你...

    HBase介绍介绍介绍

    HBase是Hadoop生态系统的一部分,与HDFS(分布式文件系统)一起提供数据存储,MapReduce则提供计算能力。Zookeeper用于服务协调和故障恢复,Pig和Hive提供高级查询语言支持,而Sqoop则方便传统数据库与HBase之间的...

    HBase上搭建广告实时数据处理平台-广点通.pdf

    - 方案四:选择HBase作为数据存储,广告请求信息写入HBase,曝光和点击时查询HBase,实现日志关联,此方案可充分利用缓存,减少I/O操作。 3. **技术方案** - 整体框架:每个广告请求分配唯一ID,创建关联表存储...

    hbase-0.92.1.tar.gz

    9. **Coprocessors**:这是一种可以在Region Server上运行的用户定义代码,用于执行与数据相关的计算,例如过滤、聚合等,减少了数据在网络上的传输。 10. **Scanning**:HBase提供了一种扫描机制,可以按行或列族...

Global site tag (gtag.js) - Google Analytics