hbase的caching和batch - 大神带我来搬砖 - ITeye博客

`

kabike

浏览: 610846 次
性别:
来自: 大连

最近访客更多访客>>

agreetech

confused9090

kavy

aininim

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

fei33423：同意你的说法. hbase 的强一致性分为两部分来说. 数据分 ...
浅谈Hbase 的强一致性
zengwenbo5566： ,高人，刚安装了 genymotion 那个附带 virtu ...
VirtualBox报错Unable to load R3 module GetLastError=1790 (VERR_UNRESOLVED_ERROR
kabike： QQ1289714862 写道这代码有问题吧 bar1 bar ...
AtomicBoolean运用
QQ1289714862：这代码有问题吧 bar1 bar2 那来的你是不是new了两 ...
AtomicBoolean运用
DEMONU：需要依赖这么多东西啊
hbase 0.96和hadoop 2.2 java 客户端的jar依赖

hbase的caching和batch

博客分类：

大数据
hbase

阅读更多

hbase scan的时候设置caching,可以每次多从服务器取得row的数量,减少RPC的请求,那么batch的作用是什么呢?
batch指的是一次next的时候,取得keyvalue的最大值.这个设置的用处是什么呢?是因为假设hbase中的row特别宽,那么一次next的时候,取得的keyvalue特别多,导致内存不足,所以用batch限制next时取keyvalue的数量.
但是batch使用时需要注意的是,batch和某些filter有冲突,这是因为这些filter需要一个完整的row才能进行操作,而且使用了batch之后,一个row就有可能分成多个result来返回.

下图是HBase The Definitive Guide中的说明

查看图片附件

分享到：

hbase利用hint来实现filter快速扫描 | hbase并行scan

2015-01-15 19:24
浏览 996
评论(0)
分类:开源软件
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

基于集群的HBase安装和配置: ### 基于集群的HBase安装和配置 #### Zookeeper简介 Zookeeper作为Hadoop生态中的关键组件，主要用于提供高可用性和分布式协调服务。它能够有效地管理Hadoop集群中的各种资源和服务，例如Hadoop NameNode管理和...

HbaseTemplate 操作hbase: 通过HbaseTemplate，我们可以执行常见的CRUD（创建、读取、更新和删除）操作以及更复杂的查询。 1. **HbaseTemplate的初始化**：在使用HbaseTemplate之前，我们需要在Spring配置文件中配置HBase的相关连接信息，如...

hbase备份和数据恢复: 在大数据领域，HBase是一个基于Hadoop的分布式数据库，它为海量结构化和半结构化数据提供了高可靠性、高性能的存储方案。HBase备份和数据恢复是系统运维中至关重要的一环，确保了业务连续性和数据安全性。同时，...

hbase原理和设计: 1. **表和列族**：HBase中的表由行和列组成，列被划分成多个列族(Column Family)，每个列族又包含多个列。RowKey是表的主键，用于排序记录。 2. **Region**：随着数据量的增长，表会自动分割成多个Region。每个...

hbase入门和使用: HBase入门和使用知识点总结： 1. HBase基本介绍： HBase是建立在Hadoop文件系统（HDFS）之上的一种开源、分布式、可扩展的非关系型数据库。它是一种列式存储系统，模仿Google的Bigtable模型，适用于海量数据的实时...

HBASE架构和原理解析: ### HBASE架构与原理详解 ...通过其独特的数据模型和分布式架构，HBase能够在保持高可靠性和高性能的同时，支持海量数据的存储和实时访问。对于需要处理PB级数据的应用场景而言，HBase无疑是一个强大的选择。

hbase安装和使用: 4. **配置HBase**：编辑`$HBASE_HOME/conf/hbase-site.xml`文件，设置HDFS为HBase的默认文件系统，并配置其他必要参数，如`hbase.rootdir`（HBase的数据目录）和`hbase.zookeeper.quorum`（Zookeeper服务器列表）。...

hive和hbase整合: 这里，`STORED BY`指定了HBase的存储处理类，`WITH SERDEPROPERTIES`定义了列族和列的映射，`:key`表示HBase的行键，`cf1:val`和`cf2:val`是列族和列。`TBLPROPERTIES`指定了HBase表的名称。然而，在执行上述创建...

hbase和zookeeper配置: HBase 和 ZooKeeper 配置详解 HBase 和 ZooKeeper 是两个非常重要的分布式系统组件，分别用于分布式数据库和分布式协调服务。今天，我们将详细介绍如何配置 HBase 和 ZooKeeper，以便更好地理解它们之间的交互。 ...

hbase-sdk是基于hbase-client和hbase-thrift的原生API封装的一款轻量级的HBase ORM框架: hbase-sdk是基于hbase-client和hbase-thrift的原生API封装的一款轻量级的HBase ORM框架。针对HBase各版本API（1.x~2.x）间的差异，在其上剥离出了一层统一的抽象。并提供了以类SQL的方式来读写HBase表中的数据。对...

hbase和hadoop数据块损坏处理: HBase 和 Hadoop 数据块损坏处理 HBase 和 Hadoop 数据块损坏是非常常见的问题，可能会导致数据丢失、集群崩溃等严重后果。因此，了解如何处理 HBase 和 Hadoop 数据块损坏是非常重要的。本文将介绍 HBase 和 ...

HBase官方文档中文版-HBase手册中文版: 这份“HBase官方文档中文版”提供了全面深入的HBase知识，帮助用户理解和掌握如何在大数据场景下有效地使用HBase。一、HBase概述 HBase设计目标是提供大规模数据的实时读写能力，它运行在Hadoop之上，利用HDFS作为...

Hbase权威指南(HBase: The Definitive Guide): 通过上述内容可以看出，《HBase权威指南》全面而深入地介绍了HBase的相关知识和技术要点，无论是对于初次接触HBase的新手还是想要深入了解其内部机制的资深开发者来说，都是一本不可多得的好书。该书不仅详细解释了...

HIVE和HBASE的整合: HIVE和HBASE是两个不同的数据处理和存储系统，HIVE是一种数据仓库系统，专门用来存储和处理结构化数据，而HBASE是一种NoSQL数据库，专门用来存储和处理半结构化和非结构化数据。由于HIVE和HBASE的特点不同，导致它们...

hbase用于查询客户端工具: HBase以其高吞吐量、低延迟和水平扩展能力而闻名，常用于存储非结构化和半结构化数据。在HBase环境中，有多种客户端工具可供开发人员和管理员使用来进行查询和其他操作。以下是一些主要的HBase查询客户端工具及其...

hbase安装和基本介绍: HBase 是一个分布式的、面向列的开源数据库，它旨在为结构化数据提供高效存储和检索服务。HBase 的设计灵感来源于 Google 的 Bigtable 论文，并且它作为 Apache Hadoop 生态系统的一个关键组件而存在。HBase 能够...

HIVE和HBASE区别: "HIVE和HBASE区别" HIVE和HBASE是两种基于Hadoop的不同技术，分别是数据仓库和Key/Value系统。它们之间有很多区别，包括设计理念、应用场景、查询语言等方面。 HIVE HIVE是一个构建在Hadoop基础设施之上的数据...

scala API 操作hbase表: 此外，为了连接到HBase，还需要在项目的`src/main/resources`目录下放置`core-site.xml`、`hdfs-site.xml`和`hbase-site.xml`配置文件。以下是一些关键的Scala API操作HBase的基本步骤： 1. 引入必要的库：首先...

pinpoint的hbase初始化脚本hbase-create.hbase: 搭建pinpoint需要的hbase初始化脚本hbase-create.hbase

Global site tag (gtag.js) - Google Analytics