版本:0.94-cdh4.2.1
hbase-site.xml配置
hbase.tmp.dir
- 本地文件系统tmp目录,一般配置成local模式的设置一下,但是最好还是需要设置一下,因为很多文件都会默认设置成它下面的
- 线上配置
<
property
>
<
name
>hbase.tmp.dir</
name
>
<
value
>/mnt/dfs/11/hbase/hbase-tmp</
value
>
</
property
>
- 默认值:
${java.io.tmpdir}/hbase-${user.name}
hbase.rootdir
- HBase集群中所有RegionServer共享目录,用来持久化HBase的数据,一般设置的是hdfs的文件目录,如hdfs://namenode.example.org:9000/hbase
- 线上配置
<
property
>
<
name
>hbase.rootdir</
name
>
<
value
>hdfs://mycluster/hbase</
value
>
</
property
>
- 默认值:
${hbase.tmp.dir}/hbase
hbase.cluster.distributed
- 集群的模式,分布式还是单机模式,如果设置成false的话,HBase进程和Zookeeper进程在同一个JVM进程。
- 线上配置为true
- 默认值:false
hbase.zookeeper.quorum
- zookeeper集群的URL配置,多个host中间用逗号(,)分割
- 线上配置
<
property
>
<
name
>hbase.zookeeper.quorum</
name
> <
value
>inspurXXX.xxx.xxx.org,inspurXXX.xxx.xxx.org,inspurXXX.xxx.xxx.org,inspurXXX.xxx.xxx.org,inspurXXX.xxx.xxx.org</
value
>
</
property
>
- 默认值:localhost
hbase.zookeeper.property.dataDir
- ZooKeeper的zoo.conf中的配置。 快照的存储位置
- 线上配置:/home/hadoop/zookeeperData
- 默认值:${hbase.tmp.dir}/zookeeper
zookeeper.session.timeout
- 客户端与zk连接超时时间
- 线上配置:1200000(20min)
- 默认值:180000(3min)
hbase.zookeeper.property.tickTime
- Client端与zk发送心跳的时间间隔
- 线上配置:6000(6s)
- 默认值:6000
hbase.security.authentication
- HBase集群安全认证机制,目前的版本只支持kerberos安全认证。
- 线上配置:kerberos
- 默认值:空
hbase.security.authorization
- HBase是否开启安全授权机制
- 线上配置: true
- 默认值: false
hbase.regionserver.kerberos.principal
- regionserver的kerberos认证的主体名称(由三部分组成:服务或用户名称、实例名称以及域名)
- 线上配置:hbase/_HOST@HADOOP.xxx.xxx.COM
- 默认:无
hbase.regionserver.keytab.file
- regionserver keytab文件路径
- 线上配置:/home/hadoop/etc/conf/hbase.keytab
- 默认值:无
hbase.master.kerberos.principal
- master的kerberos认证的主体名称(由三部分组成:服务或用户名称、实例名称以及域名)
- 线上配置:hbase/_HOST@HADOOP.xxx.xxx.COM
- 默认:无
hbase.master.keytab.file
- master keytab文件路径
- 线上配置:/home/hadoop/etc/conf/hbase.keytab
- 默认值:无
hbase.regionserver.handler.count
- regionserver处理IO请求的线程数
- 线上配置:50
- 默认配置:10
hbase.regionserver.global.memstore.upperLimit
- RegionServer进程block进行flush触发条件:该节点上所有region的memstore之和达到upperLimit*heapsize
- 线上配置:0.45
- 默认配置:0.4
hbase.regionserver.global.memstore.lowerLimit
- RegionServer进程触发flush的一个条件:该节点上所有region的memstore之和达到lowerLimit*heapsize
- 线上配置:0.4
- 默认配置:0.35
hbase.client.write.buffer
- 客户端写buffer,设置autoFlush为false时,当客户端写满buffer才flush
- 线上配置:8388608(8M)
- 默认配置:2097152(2M)
hbase.hregion.max.filesize
- 单个ColumnFamily的region大小,若按照ConstantSizeRegionSplitPolicy策略,超过设置的该值则自动split
- 线上配置:107374182400(100G)
- 默认配置:21474836480(20G)
hbase.hregion.memstore.block.multiplier
- 超过memstore大小的倍数达到该值则block所有写入请求,自我保护
- 线上配置:8(内存够大可以适当调大一些,出现这种情况需要客户端做调整)
- 默认配置:2
hbase.hregion.memstore.flush.size
- memstore大小,当达到该值则会flush到外存设备
- 线上配置:104857600(100M)
- 默认值: 134217728(128M)
hbase.hregion.memstore.mslab.enabled
- 是否开启mslab方案,减少因内存碎片导致的Full GC,提高整体性能
- 线上配置:true
- 默认配置: true
hbase.regionserver.maxlogs
- regionserver的hlog数量
- 线上配置:128
- 默认配置:32
hbase.regionserver.hlog.blocksize
- hlog大小上限,达到该值则block,进行roll掉
- 线上配置:536870912(512M)
- 默认配置:hdfs配置的block大小
hbase.hstore.compaction.min
- 进入minor compact队列的storefiles最小个数
- 线上配置:10
- 默认配置:3
hbase.hstore.compaction.max
- 单次minor compact最多的文件个数
- 线上配置:30
- 默认配置:10
hbase.hstore.blockingStoreFiles
- 当某一个region的storefile个数达到该值则block写入,等待compact
- 线上配置:100(生产环境可以设置得很大)
- 默认配置: 7
hbase.hstore.blockingWaitTime
- block的等待时间
- 线上配置:90000(90s)
- 默认配置:90000(90s)
hbase.hregion.majorcompaction
- 触发major compact的周期
- 线上配置:0(关掉major compact)
- 默认配置:86400000(1d)
hbase.regionserver.thread.compaction.large
- large compact线程池的线程个数
- 线上配置:5
- 默认配置:1
hbase.regionserver.thread.compaction.small
- small compact线程池的线程个数
- 线上配置:5
- 默认配置:1
hbase.regionserver.thread.compaction.throttle
- compact(major和minor)请求进入large和small compact线程池的临界点
- 线上配置:10737418240(10G)
- 默认配置:2 * this.minFilesToCompact * this.region.memstoreFlushSize
hbase.hstore.compaction.max.size
- minor compact队列中storefile文件最大size
- 线上配置:21474836480(20G)
- 默认配置:Long.MAX_VALUE
hbase.rpc.timeout
- RPC请求timeout时间
- 线上配置:300000(5min)
- 默认配置:60000(10s)
hbase.regionserver.region.split.policy
- split操作默认的策略
- 线上配置: org.apache.hadoop.hbase.regionserver.ConstantSizeRegionSplitPolicy(采取老的策略,自己控制split)
- 默认配置: org.apache.hadoop.hbase.regionserver.IncreasingToUpperBoundRegionSplitPolicy(在region没有达到maxFileSize的前提下,如果fileSize达到regionCount * regionCount * flushSize则进行split操作)
hbase.regionserver.regionSplitLimit
- 单台RegionServer上region数上限
- 线上配置:150
- 默认配置:2147483647
相关推荐
在"04 - hbase常用配置参数.xml"文件中,列举了HBase的重要配置参数,如`hbase.rootdir`(HBase元数据的存储位置)、`hbase.cluster.distributed`(是否运行在分布式模式下)、`hbase.regionserver.handler.count`...
本篇将深入探讨HBase参数修改的相关知识,旨在帮助Java开发者更好地理解和实践。 一、HBase基本概念 HBase是构建在Hadoop文件系统(HDFS)之上的分布式数据库,支持随机读写,适用于大规模数据的实时访问。它的核心...
这些配置主要涉及 HBase 与 HDFS 的交互方式以及 ZooKeeper 的相关参数: ```xml <name>hbase.rootdir <value>hdfs://nginx:9000/hbase <name>hbase.cluster.distributed <value>true <name>hbase....
2. **HBase的配置**:修改 `conf/hbase-site.xml` 文件,设定HBase的主配置参数,例如HDFS的名称节点地址(`hbase.rootdir`)、Zookeeper的地址(`hbase.zookeeper.quorum`)和端口(`hbase.zookeeper.property....
首先,`hbase-site.xml`是HBase的主要配置文件,它包含了HBase运行所需的各种参数。在配置HBase时,你需要定义如HBase的Zookeeper地址、HBase的根目录、region服务器的地址等关键信息。例如,`<configuration>`标签...
1. **hbase-site.xml**: 这是HBase的主要配置文件,包含了HBase集群的全局配置参数。例如,你可以在这里设置`hbase.rootdir`来指定HBase的数据存储位置(通常是在HDFS上),以及`hbase.zookeeper.quorum`来指定...
在 HBase 的配置文件 hbase-site.xml 中,我们需要定义一些重要的参数,例如根目录、主服务器、分布式集群和 ZooKeeper 信息。在我们的示例中,我们将根目录设置为 hdfs://hadoop01:9000/hbase,将主服务器设置为 ...
总之,理解并正确配置HBase的各个参数是确保HBase高效稳定运行的关键。这不仅包括基本的集群配置,还包括根据业务需求进行的优化调整。在搭建HBase集群前,对这些知识点有深入的理解,可以极大地节省时间并减少可能...
- **参数配置**: - **initLimit**:初始化连接最长时间间隔,默认值为10个心跳周期。该设置用于限定Zookeeper服务器等待客户端初始化连接的最长时间。 - **syncLimit**:数据同步的最大时间间隔,默认值为2个心跳...
同时,“⽼年代为395.6.7.-**.**.**.***3.14-15.16.171819”这部分看起来像是内存分配的参数,由于文档内容的不连贯性,这部分的含义可能需要结合实际上下文和HBase的参数配置手册来理解。 在实施参数调整时,需要...
2. **hbase-env.sh**:这个脚本用于配置HBase的环境变量,如JVM参数(堆大小、GC设置等)和HBase进程的启动选项。 3. **regionservers**:列出集群中提供服务的RegionServer节点。 4. **masters**:如果配置了主备...
本文将深入探讨HBase的核心配置文件及其重要参数,帮助你更好地理解和优化你的HBase集群。 HBase的配置主要通过XML文件进行,这些文件通常位于`conf`目录下,包括`hbase-site.xml`、`hbase-default.xml`等。`hbase-...
### Hadoop2.7.1 + HBase1.3.5 在 CentOS6.5 虚拟机环境下的安装配置指南 #### 准备工作 为了确保 Hadoop 和 HBase 的顺利安装,需要提前做好一系列准备工作,包括安装 VMware、设置虚拟机、配置 CentOS 操作系统等...
HBase是一种分布式、基于列族的NoSQL数据库,由Apache基金会开发,主要...正确配置这些参数能确保HBase集群的高效运行,满足大数据应用的需求。在实际部署中,应根据具体业务场景进行调整,确保系统的稳定性和效率。
- **HBase配置**:配置`hbase-site.xml`,调整HBase的缓存策略、分区策略等参数。 - **安全性和权限**:如果启用了Hadoop的安全模式,则需要配置Kerberos认证机制。 - **性能优化**:根据实际应用场景调整JVM参数、...
总之,理解和配置好Hadoop与HBase的参数是确保大数据系统高效运行的关键。通过这份详尽的配置文件集合,你可以快速搭建起一个基本的Hadoop和HBase环境,并根据实际工作负载进行优化。记住,每个参数的调整都可能影响...
HbaseTemplate的`get`方法接受RowKey作为参数,返回一个Result对象,其中包含了该行的所有列族和列的信息。 4. **执行(execute)操作**:`execute`方法是一个更为灵活的接口,允许我们传递一个HBase操作的回调函数...
除了修改`hbase-site.xml`外,还需要配置`log4j.properties`文件来指定审计日志的具体参数,包括日志文件名、最大文件大小、备份索引等。 - **增加以下配置**: ```properties hbase.security.log.file=...
HBase 的配置文件 hbase-site.xml 是其核心配置文件,本文将详细解释 hbase-site.xml 的配置参数 DEFAULT 值和描述。 一、HBase 临时目录配置 * hbase.tmp.dir:${java.io.tmpdir}/hbase-${user.name},这个参数...
application.yml文件用于配置HBase的连接参数,例如: ```yaml hbase: zookeeper: quorum: hadoop001,hadoop002,hadoop003 property: clientPort: 2181 zookeeper: znode: parent: /hbase ``` SpringBoot...