`

hbase 使用经验

阅读更多
hbase  使用经验。

1、单条rowkey下虽然能支持百万列,但是建议不要这么做,因为真正一个rowkey下挂了这么多数据时会在两个地方出现问题,一是查询时单行记录数据量过大,client超时;第二个问题是regionserver做compact的过程有可能被单条rowkey的数据塞满内存造成OOM

2、datanode的handler的数量不要默认值,太少,要在100左右,另外regionserver的handler的数量在200左右比较合适

3、resultScannser使用完毕记得关闭

4、HTablePool可以管理HTable。查询结束后直接用HTablePool.put(HTable t)来回收,入库结束后记得table.flushCommit()后再回收

5、mapred.local.dir这个参数是mapreduce会在机器的硬盘上做临时文件的存放,如果挂载的多块盘请将每个盘都配上,提升总体性能

6、map阶段的输出可以配置LZO压缩,这样能有效节省map->reduce阶段的网络带宽,不过会提高cpu的占用率

7、多网卡绑定能有效提高hadoop体系的网络带宽

8、bulkload目前测试的性能在单节点51GB/小时左右,希望其他有做过的同学能交流一下bulkload方面的问题。
分享到:
评论

相关推荐

    HBase 实战经验分享.pdf

    例如,OpenTSDB使用时间戳作为RowKey的一部分,实现了高效的时间序列查询;JanusGraph利用图索引来优化图数据的遍历;GeoMesa则利用空间索引处理地理空间数据。 在实战案例中,我们可以看到各种实际应用场景对HBase...

    hive与hbase整合经验谈

    在大数据处理领域,Hive和HBase都是广泛使用的工具,各有其特定的优势。Hive作为一个基于Hadoop的数据仓库工具,适合于数据批处理和分析,而HBase则是一款分布式、高性能的NoSQL数据库,适用于实时数据查询。本文将...

    hbase shell使用文档

    这是本人使用hbase shell的部分经验总结,一般的shell使用全部包括了。 版本,压缩,region等需求,以及使用普通shell使用hbase shell

    hbase常见错误整理3年运维经验整理

    ### HBase常见错误及解决方案:3年运维经验总结 #### 一、配置第三方依赖包HADOOP_CLASSPATH和HBase问题 **问题描述** 在本地开发HBase程序时,虽然本地编译能够通过(因为在IDE中已经导入了必要的jar包),但在...

    hbase 资源合集 hbase 企业应用开发实战 权威指南 hbase 实战 hbase 应用架构

    总的来说,这些书籍覆盖了HBase的各个方面,从基础理论到实战经验,从架构设计到性能优化,对于希望深入理解和应用HBase的专业人士来说,都是宝贵的资源。通过深入学习,读者不仅可以掌握HBase的基本操作,还能了解...

    hive与hbase整合经验谈.pdf

    在整合经验分享方面,使用Hive与HBase整合的系统时,需要注意数据的实时性和一致性问题。HBase本身支持数据的快速写入,而Hive更适合执行大规模数据的分析查询,所以在数据写入HBase后,可能需要一定时间来同步到...

    藏经阁-HBase 在中国电信的实战.pdf

    本资源摘要信息主要介绍了中国电信使用 HBase 技术的实战经验,包括 HBase 的架构设计、数据收集、存储和处理、监控和优化等方面的内容。 HBase 架构设计 HBase 是一个基于 Hadoop 的分布式数据库,中国电信使用 ...

    hbase社区2018精选资料

    社区动态部分突出了中国HBase技术社区的重要性,这是HBase爱好者和专业人士交流技术经验、分享最佳实践的平台。社区成员积极贡献知识,共同推动HBase技术在中国的发展。 在学习HBase的过程中,理解其生态系统的多个...

    HBase视频教程下载|基于微博数据应用的HBase实战开发

    本教视从实战角度出来,向学员们手把手掌握HBase使用精髓,让学员达到如下目标: 1. 了解分布式存储的原理及架构。 2. 掌握如何使用HBase实现海量数据存储与检索。 3. 掌握HBase在开发中常见的技术大坑与调优技术...

    阿里hbase 使用场景

    Ali-HBase作为阿里巴巴大厦的基础存储设施,全面服务于淘宝、天猫、蚂蚁...面对如此规模的业务体量,阿里巴巴团队对于如何基于HBase打造稳定、高效、易用的存储服务,形成了一套完善的产品体系与实践经验,其整体大图如

    HBase 权威指南(HBase The Definitive Guide)

    ### HBase 权威指南...通过上述内容可以看出,《HBase 权威指南》不仅覆盖了 HBase 的基本原理和技术细节,还包含了丰富的实践经验和未来展望,对于想要深入学习 HBase 的技术人员来说是一本非常有价值的参考书。

    HBase:The Definition Guide,HBase权威指南完全版

    此外,HBase使用ZooKeeper进行协调和故障恢复,确保系统的高可用性和一致性。 书中详细讲解了如何安装和配置HBase,包括在各种操作系统上的部署方法,以及如何与Hadoop集群集成。读者将学习到如何创建表,定义列族...

    HBase不睡觉书.pdf HBase不睡觉书

    总之,《HBase不睡觉书》是一本全面介绍HBase的书籍,无论是初学者还是有经验的开发者,都能从中获得宝贵的知识和实践经验,进一步提升在大数据存储和处理方面的技能。通过阅读这本书,你将能够更好地理解HBase的...

    HBase企业应用开发实战-高清

    此外,本书还会详细阐述HBase的API使用,包括Java API和命令行工具,以及如何通过HBase Shell进行数据操作。通过实例,读者可以学习如何创建表、插入和查询数据,以及执行复杂的扫描操作,这对于实际开发中的数据...

    《HBase实战》

     《HBase实战》是一本基于经验提炼而成的指南,它教给读者如何运用HBase设计、搭建及运行大数据应用系统。全书共分为4个部分。前两个部分分别介绍了分布式系统和大规模数据处理的发展历史,讲解HBase的基本原理模式...

    《Learning HBase中文版》

    通过《Learning HBase中文版》这本书的学习,读者不仅能够全面理解HBase的技术细节,还能获得在实际项目中部署和管理HBase的经验。无论是开发人员还是运维人员,都能从中受益,提升自己在大数据领域的技能。

    HBase in Action(中文)

    总的来说,《HBase in Action》是一本全面且实用的HBase指南,无论你是初学者还是有一定经验的开发者,都能从中受益匪浅。通过阅读这本书,你将能够熟练地掌握HBase的使用,解决大数据存储和处理中的各种挑战。

Global site tag (gtag.js) - Google Analytics