`
lingqi1818
  • 浏览: 253498 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

hbase性能相关选项说明

阅读更多
首先我们简要说明下hbase的运行过程:
1.新数据在hdfs中生成hlog的日志文件,同时插入到内存的memtable中
2.当memtable的大小超过hbase.hregion.memstore.flush.size的时候,将会把数据刷新到hdfs中存成hfile格式
3.当hfile超过hbase.hregion.max.filesize,则会split成2个hfile文件,根据region对半拆分
4.当memtable满的时候,会将数据存成hfile跟拆分过的hfile在一个文件夹,当memtable变的文件超过hbase.hstore.compactionThreshold,则进行大的compaction操作,注意,这个操作非常耗费时间和系统资源。当compaction完之后的数据超过hbase.hregion.max.filesize则进行split.

由此可见:
hbase.hregion.max.filesize假如太小,则会影响文件打开的句柄数。太大假如到了要做split和compaction的时候,则非常耗费性能。
hbase.hregion.memstore.flush.size假如太小,则频繁进行磁盘写操作,假如太大,则一次性写入时间很长。
hbase.hstore.compactionThreshold假如太小,同时hbase.hregion.memstore.flush.size也很小,则在第一次split之后,会频繁做compaction操作,假如太大,并且hbase.hregion.max.filesize也很大,则compaction的时候很恐怖了。。。

结论则是,看你的系统是需要吞吐量和平均响应时间之间做一个选择。并且假如hbase.hregion.memstore.flush.size太大,虽然可以提高读写效率,万一hlog丢失,会造成部分数据的丢失,也是需要付出的代价。
分享到:
评论

相关推荐

    最全面的HBase说明文档

    文档还覆盖了HBase的配置选项,对于操作和性能调整提供了参考规则。这包括了在设计schema时应该注意的点,如RegionServer的大小,列族的数量,行键的设计,版本的数量,支持的数据类型,以及如何使用Time To Live...

    HBase配置文件与HBase doc文档

    2. **hbase-env.sh**:这个脚本用于配置HBase的环境变量,如JVM参数(堆大小、GC设置等)和HBase进程的启动选项。 3. **regionservers**:列出集群中提供服务的RegionServer节点。 4. **masters**:如果配置了主备...

    Hbase 官方中文文档

    - 通过具体的案例,说明了如何在实际环境中进行HBase的Schema设计、性能优化和故障排除。 14. HBase运维管理部分: - 介绍了如何管理和维护HBase集群,以保持其高性能和高可用性。 文档的翻译工作是由周海汉和...

    hbase 2.0参考手册

    在性能和操作配置选项方面,HBase 2.0参考手册讨论了如何根据不同的使用场景和需求来优化HBase的性能。手册也提到了特殊情况下的一些配置,帮助用户更好地理解和应用HBase的各种高级特性。 HBase与MapReduce的集成...

    Hadoop3.1.1集成hbase2.1.1

    - hbase.cluster.distributed:此选项标记集群是否以分布式模式运行。 - hbase.master:定义了HBase主节点的位置和端口。 - hbase.unsafe.stream.capability.enforce:此配置项设置为false,以允许HBase使用老...

    Apache HBase ™ Reference Guide

    重要的配置项**:强调了一些对HBase性能和功能至关重要的配置项,提醒用户注意这些配置项的重要性。 - **10. 动态配置**:介绍了如何在HBase运行时动态更改某些配置项的方法。 #### 三、升级 **11. HBase 版本号...

    HBase权威指南中文版+官方文档

    - **重要配置项解析**:重点分析对HBase性能有重大影响的配置项。 - **Bloom Filter**:介绍如何使用Bloom Filter来提高查询效率。 #### 三、HBase升级指南 - **从0.20.x或0.89.x升级到0.90.x**:列出具体的步骤...

    hbase详解,apache_hbase_reference_guide

    在操作和性能配置选项方面,了解如何调整相关参数,对系统性能至关重要。指南中会介绍一些特殊情况下的配置选项。 HBase与MapReduce的集成允许用户在Hadoop生态系统中利用HBase强大的数据存储能力,进行大规模数据...

    hbase权威指南(The hbase definition guide)最好的hbase入门书籍

    - **文件系统的选择**:分析了不同文件系统(如本地文件系统、HDFS、S3等)对于HBase性能的影响。 - **安装选项**:比较了从Apache官方下载二进制包安装与从源码编译安装两种方式的优劣。 - **运行模式**:介绍了...

    apache hbase reference guide

    - **Passing VM Options to the Shell**(传递VM选项到Shell):可以在启动Shell时指定JVM参数,例如内存分配大小。 - **Overriding configuration starting the HBase Shell**(启动HBase Shell时覆盖配置):通过...

    apache_hbase_reference_guide.pdf

    接着,关于"HBase的配置"章节,它详细说明了HBase的配置文件、基本先决条件、运行模式(包括独立模式和分布式模式)、安装确认、默认配置和示例配置。重要配置项的讲解能够让用户了解如何根据具体的使用场景调整...

    hbase官方文档

    - **性能调优**:提供一系列优化HBase性能的方法,包括硬件选型、软件配置等。 - **容错与恢复**:探讨HBase如何实现容错机制,以及在故障发生时如何快速恢复。 - **安全性**:讨论HBase的安全特性,包括访问控制、...

    第1章 HBase入门_v1.3.docx

    - **性能优化**:可以通过调整缓存大小、压缩算法等参数来优化HBase性能。 - **数据迁移**:使用`Export`和`Import`工具可以将数据迁移到其他HBase集群。 - **容灾备份**:定期备份HBase数据,使用HDFS的快照功能...

    HBASE权威指南

    - 书中分析了在大数据环境下,传统的关系数据库系统面临的局限性,包括性能瓶颈、扩展能力有限等问题。 - 通过介绍分片(Sharding)技术,说明了如何解决单机数据库无法应对大规模数据处理的问题。 - 讨论了非...

    阿里云 专有云企业版 V3.8.0 云数据库 HBase 开发指南 20190621.pdf

    此外,文档还可能详细解释了如何使用命令行工具与HBase交互,以及如何处理参数和选项。 总的来说,阿里云专有云企业版V3.8.0的云数据库HBase开发指南是用户有效使用和管理HBase服务的关键资源,涵盖了从基本操作到...

    阿里云 专有云企业版 V3.12.0 云数据库HBase版 运维指南 20200622.pdf

    - 性能监控:通过监控系统指标来诊断和优化HBase实例的性能,如CPU使用率、内存使用、磁盘I/O等。 - 数据备份与恢复:定期备份数据,确保数据安全,当需要时能快速恢复。 - 故障排查:学习如何识别和解决常见问题...

    阿里云 专有云企业版 V3.8.2 云数据库HBase版 运维指南 20200416.pdf

    - 包括如何根据业务需求调整HBase的性能参数,如内存分配、磁盘IO设置等。 - 可能会涉及读写性能优化、资源利用率监控等。 7. **备份与恢复**: - 指南可能会指导用户如何设置定期备份,以及在数据丢失或系统...

    阿里云 专有云企业版 V3.6.1 云数据库HBase版 运维指南 - 20181105.pdf

    - 文档中包含不同级别的警示信息,如“禁止”表示可能导致严重后果的操作,“警告”表示可能造成服务中断的操作,“注意”为用户提供重要信息,“说明”则是一些补充说明或操作建议。 - 文档采用特定格式标记关键...

    阿里云 专有云企业版 V3.12.0 云数据库HBase版 开发指南 20200702.pdf

    HBase是一种分布式、高性能的列式存储数据库,特别适合处理大规模半结构化数据。阿里云的HBase服务基于Apache HBase,为企业提供了稳定、高效、易用的数据库解决方案。在专有云企业版中,用户可以享受到定制化的云...

    pinpoint安装部署手册

    ##### 1.2 系统环境说明 为了确保各组件间的通信正常,需要对各服务器的`/etc/hosts`文件进行相应的配置: - **HBase服务器**: ```bash 192.168.233.136 hbase ``` - **Pinpoint服务器**: ```bash 192.168....

Global site tag (gtag.js) - Google Analytics