`

5。hbase高级部分 - Coprocessor (vs Filter)

 
阅读更多

?what

  in a SQL DB Server,in tradictionally,contains Triggers or Procedures,and the privior is used to handle server's internal transactions,most of 'post-do' operations;the laster also is subroutine to processs 'client-server' interactive ops.

 

?why

     just same like with it,HBase has it's internal computation framework named Coprocessor(CP) to play thes e funcs.similar to Scan,this CP is placed in server end,but diffenerce by Reduce the huge data returned to client.

  within CP,users can interact with hbase more neatly.

 

?how

CP VS Filter implemetion
type triggered by customed executed at appliations
Filter client client server

scan,simple count by client

Observer master/region/wal server server

secondary index,access control,

complex filter

Endpoint client client server aggregate functions,sum,max...

 

common coprocessor flow:



 

EndPoint coprocessor flow:

 

可以看到,client是以region 为单位访问的,这意味着一个rs上太多regions的话,在全表统计时将产生很多连接请求.其实类似我们在solr实现一样,可以merge-in-rs即可 TODO



 

?features

1 advantages

 -reduce much data to client to computation

 -converient intersactions to hbase

 

2 disvantages

 -just slimilar to common SQL DB,if this CPs are CPU ,MEM or IO intensive,this will slow down the entire cluster performance.so i think if you are run in thise case,let the cluster to in a off-line state is much better.

 -CP is different from Bigtable's one,the former is a plugin in hbase,and the later is a individual process out of server,so this may impact server to run normally.

 

 另外在看HRegion#exec()时发现

CoprocessorProtocol handler = protocolHandlers.getInstance(protocol);

 这意味着一个protocol只有一个implement,通常这没什么问题,但是需要知道的

  • 大小: 23.3 KB
  • 大小: 55.3 KB
  • 大小: 18.2 KB
分享到:
评论

相关推荐

    hbase-0.98.6-cdh5.3.6.zip

    9. ** Coprocessor机制**:HBase 0.98.6引入了Coprocessor框架,允许用户自定义插件在Region服务器端执行,实现数据的预处理或后处理,提升性能和安全性。 10. **MapReduce集成**:HBase可以与MapReduce结合,进行...

    HBase企业应用开发实战-高清

    在高级特性部分,书里涵盖了Coprocessor、Filter、Compaction和Replication等关键特性。Coprocessor允许用户自定义逻辑,实现数据处理的本地化,提高效率;Filter则提供了灵活的数据筛选机制;Compaction是HBase维护...

    HBase官方文档中文版-HBase手册中文版

    HBase是一种分布式、基于列族的NoSQL数据库,由Apache软件基金会开发并维护,是Hadoop生态系统中的重要组件。这份“HBase官方文档中文版”提供了全面深入的HBase知识,帮助用户理解和掌握如何在大数据场景下有效地...

    大数据面试题试卷.docx

    4. HBase高级应用 - Coprocessor:允许在HBase表上进行定制化操作,提高性能和安全性。 - BloomFilter:一种空间效率高的概率数据结构,用于判断一个元素是否可能存在于集合中,常用于减少不必要的数据访问。 5. ...

    2-2+HBase-RowKey+与索引设计.zip

    - ** Coprocessor**:HBase的扩展机制,可以在RegionServer端实现简单的索引功能。 - ** phoenix**:一个开源的SQL层,提供对HBase的索引支持,允许用户使用SQL语句查询HBase。 **5. 性能优化** - **预分区...

    HBase课件汇总完整版ppt全套课件最全教学教程整本书电子教案全书教案合集最新课件汇编.pptx

    - HBase 的读取过程涉及 Region Server、MemStore 和 HFile 等组件,通过 Bloom Filter 和 BlockCache 提高性能。 - 写入数据首先被写入内存的 MemStore,当达到一定阈值时,会触发 Flush 操作,将数据写入磁盘的 ...

    HBase在淘宝的应用和优化

    尽管当时0.92版本的HBase还未成熟,淘宝团队通过自行开发Coprocessor来实现这些复杂功能。 ##### 2. 技术选型与版本选择 - **0.90.x版本**:2011年1月发布的0.90.0版本成为HBase应用的一个重要里程碑,该版本加入...

    Hbase的安装与简单操作

    3. **Secondary Indexes**:虽然HBase默认不支持二级索引,但可以通过实现 Coprocessor 或使用第三方库如 phoenix 来实现。 4. **Replication**:HBase支持跨集群的数据复制,以提高可用性和容错性。 5. **Bulk ...

    大数据HBase二次开发.pdf

    HBase是一种针对大数据处理的开源分布式数据库,它属于Apache Hadoop生态系统的一部分,特别设计用于处理和存储海量结构化数据。HBase基于Google的Bigtable设计,提供高可靠性、高性能和可伸缩性,解决了传统关系型...

    HBase权威指南.pdf

    HBase是Apache软件基金会的Hadoop项目的一部分。下面将详细介绍HBase的一些核心知识点。 ### HBase的基本概念 1. **表结构**:HBase中的表由行和列组成,每个表具有一个Row Key来唯一标识行。列以“列族”的形式...

    大数据方向学习课程体系

    - 了解HBase协处理器(Coprocessor)的概念及其应用场景。 - 学习如何实现二级索引来提高查询性能。 4. **过滤器查询** - 学习使用Filter进行复杂的查询操作。 - 掌握不同类型的过滤器及其用法。 5. **Hbase内部...

    3-8+BitMap在大数据精准营销中的应用.pdf

    - Hbase的Coprocessor(协处理器)机制可以实现数据端的并行计算,降低网络传输成本。 4. **BitMap技术** - BitMap是一种位数组,每个位对应一个状态,0表示未出现,1表示出现,非常适合处理大量的布尔型数据。 ...

    hadoop相关知识习题

    8. HBase可以通过MapReduce或Coprocessor实现二级索引,二级索引的核心是倒排表,是对Rowkey的一级索引的补充。 9. Bloom Filter是一种空间效率高的概率型数据结构,用于测试一个元素是否在一个集合中,存在一定的...

    百亿级数据的秒级复杂查询技术设计.pptx

    传统的解决方案如原生Filter、HBase + Solr(ES)、Phoenix以及HBase On Cloud等存在性能、复杂度和安全性等问题,无法满足对实时性、效率和架构简洁性的要求。针对这些挑战,一种名为Pharos的新解决方案应运而生。 ...

Global site tag (gtag.js) - Google Analytics