`

hbase优化

 
阅读更多

 

 

 

 
 hdfs的优化: 
 
 设置hdfs中data的存储路径为多路径 ----> 对IO进行了分摊,这样IO优化下,  一台主机上有多个挂载点,
修改hdfs-site.xml中的dfs.data.dir,

设置java垃圾回收时的heap
修改hbase-env.sh中的HBASE_HEAPSIZE=8000   单位是 MB 这里设置虚拟内存是8G ,这个设置需要根据集群和机器特性来反复调试

修改RegionServer与Zookeeper间的连接超时时间
zookeeper.session.timeout=180000   单位是s     如果启动超时 hmaster会挂掉

 

hbase客户端优化:
1 put积累到一定量才发送请求到服务端
AutoFlush
将HTable的setAutoFlush设为false,可以支持客户端批量更新。即当Put填满客户端flush缓存时,才发送到服务端。
默认是true。
hTable.setAutoFlush(false);

2 Scan Caching
scanner一次缓存多少数据来scan(从服务端一次抓多少数据回来scan)。
默认值是 1,一次只取一条。
scan.setCaching(1000);   测试下

Scan Attribute Selection
scan时建议指定需要的Column Family,减少通信量,否则scan操作默认会返回整个row的所有数据(所有Coulmn Family)
减少了整个IO通讯量。

 

机架感知:  机架之间通过知道有哪些文件存在,  就是进去小区后有地图,然后找这个房间能快一点。

 

预分区:
热点:很多数据都去一个地方

wal日志: hlog, 所有操作日志成功失败写删都有,因为这个日志是做灾难恢复用的,这个日志保存这个机器最近的操作,当进行一次大合并后会减少很多。
 当这个日志很大的时候 需要使用这个命令来进行分割:
 hbase org.apache.hadoop.hbase.regionserver.wal.HLog  --split /hbase/WALs/hadoop3,60020,1457256379217-splitting

 

 

 

分享到:
评论

相关推荐

    hbase优化总结

    hbase优化总结 HBase 是一个基于列存储的 NoSQL 数据库,广泛应用于大数据存储和处理领域。然而,在实际应用中,HBase 的性能优化变得至关重要。本文档旨在总结 HBase 的优化方法,对项目中使用 HBase 的调优提供...

    网易视频云技术分享_HBase优化实战.pdf

    HBase 优化实战 HBase 是一个高性能的分布式数据库系统,常用于大规模数据存储和处理。然而,在实际使用中,HBase 也存在一些问题,例如热点问题、RegionServer 不均匀分布等。以下是 HBase 优化实战的相关知识点:...

    HBase优化-系统架构

    【HBase优化-系统架构】主要探讨了针对HBase性能的优化策略,特别是从系统架构层面进行调优的方法。HBase作为一个分布式、列族式的NoSQL数据库,性能优化至关重要,尤其是对于大数据处理场景。 首先,关注到配置...

    19-HBase优化

    HBase优化思维导图,便捷整理思路,protobuffer、书写.proto文件、编译 .proto 文件、MapReduce整合、HBase优化设计:1、表设计、2、写表操作、3、读表操作

    Hbase优化-参数优化

    在HBase中,性能优化是确保大数据平台高效运行的关键步骤。本文主要关注应用程序设计与开发层面的优化策略,包括表的设计、写表操作、读表操作以及数据计算。以下是具体的优化点: 1. **表的设计** - **Pre-...

    HBase性能优化方法总结

    本文将深入探讨HBase性能优化的各种策略,旨在帮助你提升数据操作的效率。 一、硬件优化 1. **磁盘选择**:HBase对I/O性能要求较高,因此推荐使用SSD硬盘,以减少读写延迟。 2. **内存配置**:合理分配HBase的堆...

    Hbase性能优化百科全书(csdn)————程序.pdf

    在HBase性能优化的过程中,表设计和RowKey的设计是至关重要的。预分区是表设计的一个重要环节,目的是避免因表的自动split导致的资源消耗和性能影响。预分区可以根据业务需求预先设定rowkey的范围,比如在例子中,...

    Kylin在贝壳的性能挑战和HBase优化实践

    《Kylin在贝壳的性能挑战与HBase优化实践》 Kylin,作为一款高效的企业级在线分析处理(OLAP)引擎,在贝壳公司的应用实践中扮演着关键角色。自2017年起,贝壳开始使用Kylin作为其核心数据分析平台,目前已有超过...

    hbase-2.4.17-bin 安装包

    五、HBase优化与扩展 1. Region分裂与合并:随着数据增长,Region会自动分裂,保持大小均衡。必要时,可以手动合并Region。 2. RegionServer负载均衡:Master节点负责RegionServer间的负载均衡,调整Region分布以...

    HBase优化实战

    本文来自于cnblogs,介绍了Rowkey设计问题,Region重...然而,分布式系统从结构上来讲,也相对较复杂,模块繁多,各个模块之间也很容易出现一些问题,所以对像HBase这样的大型分布式系统来说,优化系统运行,及时解决

    phoenix-hbase-2.4-5.1.2

    在2.4版本中,HBase优化了Region Splitting策略,提升了数据分布的均匀性,同时增强了对高并发读写的支持。 2. **Phoenix SQL接口** Phoenix作为HBase的SQL层,使得开发者无需学习复杂的HBase API,就能利用SQL...

    Hbase+Spring boot实战分布式文件存储

    第4章 HBase进阶 讲解HBase的高级特性,常用的优化策略,协处理器等,并实战开发协处理器,将开发的协处理器加载到HBase测试环境,验证其功能 4-1 HBase优化策略一:服务端优化策略 4-2 HBase优化策略二:常用优化...

    hbase API

    5. **HBase优化** - Bloom Filters: 用于快速判断某个元素是否存在于表中,减少不必要的磁盘I/O。 - Compaction: 对Region内的StoreFiles进行合并,减少数据碎片和提高读取效率。 - BlockCache: 缓存热数据,加速...

    hbase数据库

    2. HBase的读写操作:HBase优化了数据的读写性能,尤其是在写操作上,支持高效的随机读取以及对数据子集的快速扫描。 3. 其他功能:除了基本的CRUD操作,HBase还提供了许多扩展功能,如数据的过滤器、计数器以及协...

    Hbase学习总结.rar

    ### 四、HBase优化 1. **行键设计**:合理设计行键,避免热点问题,例如使用反向时间戳+哈希值的方式。 2. **列族和列的设计**:减少列族数量,控制列的数量,降低内存开销。 3. **缓存配置**:调整BlockCache和...

    Hadoop2.7.1+Hbase1.2.1集群环境搭建(7)hbase 性能优化

    本篇将详细阐述如何在Hadoop 2.7.1环境下搭建HBase 1.2.1集群,并进行性能优化,以提升系统效率。 首先,我们需要了解Hadoop和HBase的基本概念。Hadoop是基于分布式文件系统HDFS(Hadoop Distributed File System)...

Global site tag (gtag.js) - Google Analytics