hbase 使用经验。
1、单条rowkey下虽然能支持百万列,但是建议不要这么做,因为真正一个rowkey下挂了这么多数据时会在两个地方出现问题,一是查询时单行记录数据量过大,client超时;第二个问题是regionserver做compact的过程有可能被单条rowkey的数据塞满内存造成OOM
2、datanode的handler的数量不要默认值,太少,要在100左右,另外regionserver的handler的数量在200左右比较合适
3、resultScannser使用完毕记得关闭
4、HTablePool可以管理HTable。查询结束后直接用HTablePool.put(HTable t)来回收,入库结束后记得table.flushCommit()后再回收
5、mapred.local.dir这个参数是mapreduce会在机器的硬盘上做临时文件的存放,如果挂载的多块盘请将每个盘都配上,提升总体性能
6、map阶段的输出可以配置LZO压缩,这样能有效节省map->reduce阶段的网络带宽,不过会提高cpu的占用率
7、多网卡绑定能有效提高hadoop体系的网络带宽
8、bulkload目前测试的性能在单节点51GB/小时左右,希望其他有做过的同学能交流一下bulkload方面的问题。
分享到:
相关推荐
例如,OpenTSDB使用时间戳作为RowKey的一部分,实现了高效的时间序列查询;JanusGraph利用图索引来优化图数据的遍历;GeoMesa则利用空间索引处理地理空间数据。 在实战案例中,我们可以看到各种实际应用场景对HBase...
在大数据处理领域,Hive和HBase都是广泛使用的工具,各有其特定的优势。Hive作为一个基于Hadoop的数据仓库工具,适合于数据批处理和分析,而HBase则是一款分布式、高性能的NoSQL数据库,适用于实时数据查询。本文将...
这是本人使用hbase shell的部分经验总结,一般的shell使用全部包括了。 版本,压缩,region等需求,以及使用普通shell使用hbase shell
### HBase常见错误及解决方案:3年运维经验总结 #### 一、配置第三方依赖包HADOOP_CLASSPATH和HBase问题 **问题描述** 在本地开发HBase程序时,虽然本地编译能够通过(因为在IDE中已经导入了必要的jar包),但在...
总的来说,这些书籍覆盖了HBase的各个方面,从基础理论到实战经验,从架构设计到性能优化,对于希望深入理解和应用HBase的专业人士来说,都是宝贵的资源。通过深入学习,读者不仅可以掌握HBase的基本操作,还能了解...
在整合经验分享方面,使用Hive与HBase整合的系统时,需要注意数据的实时性和一致性问题。HBase本身支持数据的快速写入,而Hive更适合执行大规模数据的分析查询,所以在数据写入HBase后,可能需要一定时间来同步到...
本资源摘要信息主要介绍了中国电信使用 HBase 技术的实战经验,包括 HBase 的架构设计、数据收集、存储和处理、监控和优化等方面的内容。 HBase 架构设计 HBase 是一个基于 Hadoop 的分布式数据库,中国电信使用 ...
社区动态部分突出了中国HBase技术社区的重要性,这是HBase爱好者和专业人士交流技术经验、分享最佳实践的平台。社区成员积极贡献知识,共同推动HBase技术在中国的发展。 在学习HBase的过程中,理解其生态系统的多个...
本教视从实战角度出来,向学员们手把手掌握HBase使用精髓,让学员达到如下目标: 1. 了解分布式存储的原理及架构。 2. 掌握如何使用HBase实现海量数据存储与检索。 3. 掌握HBase在开发中常见的技术大坑与调优技术...
Ali-HBase作为阿里巴巴大厦的基础存储设施,全面服务于淘宝、天猫、蚂蚁...面对如此规模的业务体量,阿里巴巴团队对于如何基于HBase打造稳定、高效、易用的存储服务,形成了一套完善的产品体系与实践经验,其整体大图如
### HBase 权威指南...通过上述内容可以看出,《HBase 权威指南》不仅覆盖了 HBase 的基本原理和技术细节,还包含了丰富的实践经验和未来展望,对于想要深入学习 HBase 的技术人员来说是一本非常有价值的参考书。
此外,HBase使用ZooKeeper进行协调和故障恢复,确保系统的高可用性和一致性。 书中详细讲解了如何安装和配置HBase,包括在各种操作系统上的部署方法,以及如何与Hadoop集群集成。读者将学习到如何创建表,定义列族...
总之,《HBase不睡觉书》是一本全面介绍HBase的书籍,无论是初学者还是有经验的开发者,都能从中获得宝贵的知识和实践经验,进一步提升在大数据存储和处理方面的技能。通过阅读这本书,你将能够更好地理解HBase的...
此外,本书还会详细阐述HBase的API使用,包括Java API和命令行工具,以及如何通过HBase Shell进行数据操作。通过实例,读者可以学习如何创建表、插入和查询数据,以及执行复杂的扫描操作,这对于实际开发中的数据...
《HBase实战》是一本基于经验提炼而成的指南,它教给读者如何运用HBase设计、搭建及运行大数据应用系统。全书共分为4个部分。前两个部分分别介绍了分布式系统和大规模数据处理的发展历史,讲解HBase的基本原理模式...