0.92版本对于HBase有了很大的改进,这里从问题单逐渐分析0.92版本的新特性。从特性看0.92维护功能得到了显著的提高:
HBASE-2233 支持hadoop的0.20,0.21以及0.22版本。
HBASE-3839 在WebUI上显示进程的处理状态
HBASE-3837 在WebUI上显示RIT的状态
HBASE-3836 实时跟踪进展的处理任务以及工作流
HBASE-4240 把Master的均衡算法做成了插件,可以自己开发均衡算法适应不同的应用场景。目前算法存在比较多的缺点,
HBASE-4281 增加能力获取执行器的状态
HBASE-4292 增加dump servlet的能力
HBASE-2000 0.92版本中主要特性之一,协处理器
HBASE-3856 目前Hfile V1 的block Index占用很大的内存空间,本单计划解决这个问题,但是在0.92版本Hfile 已经改变格式。这个单没有做任何优化。
(待续)
分享到:
相关推荐
hadoop1.0.1+hbase0.92综合安装包(已测试),需要JDK1.6
修改thrift接口支持使用不同timestamp批量插入数据
基于kafka和spark streaming和hbase的日志统计分析系统.zip基于kafka和spark streaming和hbase的日志统计分析系统.zip基于kafka和spark streaming和hbase的日志统计分析系统.zip基于kafka和spark streaming和hbase的...
本项目"java基于spark streaming和kafka,hbase的日志统计分析系统"提供了一个高效的数据处理框架,用于实时处理大规模日志数据。以下是关于这个系统的详细介绍,以及涉及的技术栈的核心知识点。 1. **Spark ...
【资源说明】 1、该资源包括项目的全部源码,下载可以直接使用! 2、本项目适合作为计算机、数学、电子信息等专业的课程设计、期末大作业和毕设...基于spark streaming+kafka+hbase的日志统计分析系统源码+项目说明.zip
HBase,作为BigTable的一个开源实现,因其卓越的分布式数据库特性在大数据处理领域占据了重要地位。然而,随着HBase在各行业的广泛应用,用户对其性能表现的关注日益增强,尤其是实时数据插入性能,成为衡量HBase...
3. 新功能引入:可能包含新的API或特性,以适应更多应用场景。 4. 安全性增强:提供更完善的权限控制和安全机制。 5. 兼容性提升:可能对Hadoop和其他生态系统组件的兼容性进行了优化。 6. 监控与管理:改进了...
本使用kafka,spark,hbase开发日志分析系统。 ![architecture](/docs/images/architecture.png "architecture") ### 软件模块 * Kafka:作为日志事件的消息系统,具有分布式,可分区,可冗余的消息服务功能。...
【HBase 分析报告 原理分析】 HBase 是一款构建在 Apache Hadoop 分布式文件系统(HDFS)之上的开源分布式数据库,旨在处理大规模数据存储需求。其灵感来源于 Google 的 Bigtable,旨在提供类似的功能,允许快速...
HBase 负载均衡算法分析 HBase 作为一个非关系型列式数据库,对其负载均衡算法进行深入分析是非常重要的。本文将详细介绍 HBase 负载均衡算法的实现原理和工作流程。 Region 初始分配策略 在 HBase 中,Region 的...
在大数据领域中,Hadoop、HBase和Hive是重要的组件,它们通常需要协同工作以实现数据存储、管理和分析。随着各个软件的版本不断更新,确保不同组件之间的兼容性成为了一个挑战。本文将介绍Hadoop、HBase、Hive以及...
基于HBase的汽车市场数据分析平台的设计与实现 本文档旨在设计和实现基于HBase的汽车市场数据分析平台,旨在满足科大讯飞智能汽车事业部的真实需求。该平台采用网络爬虫、列式存储和线性回归等技术,面向市场分析...
09.hbase的核心特性--基于hdfs-分布式数据管理--表结构.mp4
《HBase实战》是一本实践导向的书籍,通过实际的项目案例,展示了HBase在不同场景下的应用,如实时分析、日志处理、推荐系统等。读者可以从中学习到如何根据业务需求设计合适的HBase表结构,以及如何进行高效的查询...
例如,`put`方法用于向表中写入新的数据,`delete`方法根据行键删除一行,`update`方法则可以更新已有数据。 6. **事务管理**:HbaseTemplate也支持HBase的事务管理。尽管HBase自身并不完全支持ACID事务,但Hbase...
《基于Spark Streaming、Kafka与HBase的...它融合了实时流处理、大数据分析和高速存储的特性,为企业提供了一套完整的日志分析基础设施。在人工智能领域,这样的系统对于实时监控、故障检测以及业务洞察具有重大价值。