Datastream一直以来在使用HBase分流日志,每天的数据量很大,日均大概在80亿条,10TB的数据。对于像Datastream这种数据量巨大、对写入要求非常高,并且没有复杂查询需求的日志系统来说,选用HBase作为其数据存储平台,无疑是一个非常不错的选择。
HBase是一个相对较复杂的分布式系统,并发写入的性能非常高。然而,分布式系统从结构上来讲,也相对较复杂,模块繁多,各个模块之间也很容易出现一些问题,所以对像HBase这样的大型分布式系统来说,优化系统运行,及时解决系统运行过程中出现的问题也变得至关重要。正所谓:“你”若安好,便是晴天;“你”若有恙,我便没有星期天。
历史现状
HBase交接到我们团队手上时,已经在线上运行有一大段时间了,期间也偶尔听到过系统不稳定的、时常会出现一些问题的言论,但我们认为:一个能被大型互联网公司广泛采用的系统(包括Facebook,twitter,淘宝,小米等),其在性能和可用性上是毋庸置疑的,何况像Facebook这种公司,是在经过严格选型后,放弃了自己开发的Cassandra系统,用HBase取而代之。既然这样,那么,HBase的不稳定、经常出问题一定有些其他的原因,我们所要做的,就是找出这些HBase的不稳定因素,还HBase一个“清白”。“查案”之前,先来简单回顾一下我们接手HBase时的现状(我们运维着好几个HBase集群,这里主要介绍问题最多那个集群的调优):
<a href='http://mp3.baidu.com/songlist/545074356' target='_blank'>匚铣讯</a>
<a href='http://mp3.baidu.com/songlist/545092335' target='_blank'>缸侵俳叶备</a>
<a href='http://mp3.baidu.com/songlist/545095032' target='_blank'>口舌交锋</a>
<a href='http://mp3.baidu.com/songlist/545632433' target='_blank'>穆纶</a>
拭炯炯拦以倨拷僮尚穆纶松
分享到:
相关推荐
HBase 优化实战 HBase 是一个高性能的分布式数据库系统,常用于大规模数据存储和处理。然而,在实际使用中,HBase 也存在一些问题,例如热点问题、RegionServer 不均匀分布等。以下是 HBase 优化实战的相关知识点:...
总的来说,这些书籍覆盖了HBase的各个方面,从基础理论到实战经验,从架构设计到性能优化,对于希望深入理解和应用HBase的专业人士来说,都是宝贵的资源。通过深入学习,读者不仅可以掌握HBase的基本操作,还能了解...
HBase的RowKey设计对于优化查询性能至关重要,而MOB(Mobile Object Base)是HBase的一个功能,用于存储和管理大型二进制对象,优化移动应用场景的数据存储效率。 在技术篇中,专刊深入探讨了HBase2.0新功能,如...
《HBase实战》这本书主要聚焦于HBase这一分布式大数据存储系统的实际应用与操作。HBase是构建在Hadoop生态系统之上,面向列的、高度可扩展的NoSQL数据库,特别适合处理海量半结构化数据。以下是根据标题和描述提炼出...
本文将深入解析HBase的基础概念、需求调研、RowKey设计以及实战案例,帮助读者更好地理解和运用HBase。 首先,我们来看HBase的基础概念。HBase是一种基于Google Bigtable理念设计的开源分布式数据库,它构建于...
- **第4章:HBase表设计**:讲解如何有效地设计HBase表结构以满足特定的应用需求,包括如何选择合适的列族、如何优化数据模型以提高查询性能等。 - **第5章:通过Coprocessors扩展HBase**:Coprocessors是HBase中...
在“HBase实战”中,读者将通过实际案例和动手练习,掌握如何安装配置HBase,创建和管理表,执行数据操作,以及优化HBase性能。此外,还会学习如何解决常见的问题和挑战,以便在实际项目中充分利用HBase的优势。
第4章 HBase进阶 讲解HBase的高级特性,常用的优化策略,协处理器等,并实战开发协处理器,将开发的协处理器加载到HBase测试环境,验证其功能 4-1 HBase优化策略一:服务端优化策略 4-2 HBase优化策略二:常用优化...
7. **HBase运维参考**:在提供的“hbase运维参考手册(项目实战).docx”文档中,详细介绍了HBase的日常维护、故障排查和性能优化方法,包括但不限于日志分析、监控指标解读、常见问题解决等,对于实际运维工作具有很...
最后,书中还可能包含了HBase运维相关的知识,这部分内容有助于读者了解如何在生产环境中有效地管理和优化HBase集群。 对于HBase的初学者来说,这本书不仅仅提供了理论知识,还通过大量的实例帮助读者理解HBase在...
本资源摘要信息主要介绍了中国电信使用 HBase 技术的实战经验,包括 HBase 的架构设计、数据收集、存储和处理、监控和优化等方面的内容。 HBase 架构设计 HBase 是一个基于 Hadoop 的分布式数据库,中国电信使用 ...
《HBase企业应用开发实战》是一本深度剖析HBase在实际业务场景中应用的专业书籍,旨在帮助读者理解和掌握HBase的核心功能、设计理念以及在大规模数据处理中的应用策略。HBase,作为Apache的一个分布式、高性能、基于...
### HBase源码解析与开发实战 #### 一、HBase简介 HBase是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的 Google 论文 “Bigtable:一个结构化数据的分布式存储系统”。就像 Bigtable 利用了...