`

hbase初探之一

阅读更多

花了二天时间看了下相关资料,当然也做了些demo,感觉挺好。

 

hbase 是基于hdfs的,分布式的面向列储存的数据储存系统。正是这些特点,使得它是很好应用于实时读写,随时访问超大数据集的情景。

在结构上,有点类似于hdfs设计,同样由hbase master,hregion sever(slaves).组成,其中hregion储存基于个region(相当于table)。在建立region时,需要定义好column family(我把它看作是有点类似super class,因为后面可以随时根据这个添加新的column元素,并且重要的是它们都具有family一样的属性).

 

hbase存储时是根据列族依存的。

Although at a conceptual level, tables may be viewed as a sparse set of rows, physically they are stored on a per-column family basis. This is an important consideration for schema and application designers to keep in mind.

 

cell为空时(没存放过数据),是不会在列族上儲存的。

当取出一个一行时没有指定time stamp,但对于某些column families有若干个版本时,每个family只取出最后一个版本数据。

 

具体也可以参见taobao架构师的文章。http://blog.csdn.net/cenwenchu79/archive/2008/08/08/2786388.aspx

 

分享到:
评论

相关推荐

    hbase&hadoop初探

    HBase,全称为Hadoop Base,是一个基于Google Bigtable设计的开源非关系型数据库,运行在Hadoop之上。它是NoSQL数据库的一种,特别适合处理大规模、稀疏的数据。HBase提供了实时读写、强一致性的能力,支持水平扩展...

    HbaseTemplate 操作hbase

    HBase是建立在Hadoop文件系统(HDFS)之上,为处理大规模数据提供了一个高效的数据存储解决方案。而Spring Data Hadoop是Spring框架的一部分,它提供了与Hadoop生态系统集成的工具,包括对HBase的操作支持。本篇文章...

    Hbase 删除某一列

    删除Hbase中某个表的一列值 命令 java -jar deleteOneColumn.jar(这个文件的路径) '表名' '列簇名' '列名'

    HBase(hbase-2.4.9-bin.tar.gz)

    就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类似于Bigtable的能力。HBase是Apache的Hadoop项目的子项目。HBase不同于一般的关系数据库,它是一个适合于非...

    hbase用于查询客户端工具

    HBase是一种分布式、基于列族的NoSQL数据库,它在大数据领域中扮演着重要的角色,尤其是在需要实时查询大规模数据集时。HBase以其高吞吐量、低延迟和水平扩展能力而闻名,常用于存储非结构化和半结构化数据。在HBase...

    Hbase权威指南(HBase: The Definitive Guide)

    - **HBase的历史**:HBase起源于一个叫做Hadoop的项目中的子项目,最初是为了实现一个类似于Bigtable的功能而创建的。 - **术语介绍**: - **背景层**(Backdrop):HBase运行于Hadoop之上,利用Hadoop提供的分布式...

    java操作Hbase之从Hbase中读取数据写入hdfs中源码

    在Java编程环境中,操作HBase并将其数据写入HDFS(Hadoop Distributed File System)是一项常见的任务,特别是在大数据处理和分析的场景下。本篇将详细介绍如何使用Java API实现这一功能,以及涉及到的关键技术和...

    hbase-1.1.5-bin版本的压缩包,下载到本地解压后即可使用 HBase 是一个开源的、分布式的NoSQL数据库

    HBase 是一个开源的、分布式的、版本化的 NoSQL 数据库(也即非关系型数据库),它利用 Hadoop 分布式文件系统(Hadoop Distributed File System,HDFS)提供分布式数据存储。与传统的关系型数据库类似,HBase 也以...

    pinpoint的hbase初始化脚本hbase-create.hbase

    搭建pinpoint需要的hbase初始化脚本hbase-create.hbase

    HBase官方文档中文版-HBase手册中文版

    HBase设计目标是提供大规模数据的实时读写能力,它运行在Hadoop之上,利用HDFS作为其底层存储系统。HBase的数据模型基于稀疏、多维度、排序的映射表,其中行键、列族、列限定符和时间戳构成数据的唯一标识。 二、...

    hbase配置内置的zookeeper

    -- hbase2 是一个临时目录,注意不要与其他目录重名 --> <name>hbase.zookeeper.quorum <value>nginx,tomcat1,tomcat2 <name>hbase.zookeeper.property.clientPort <value>2181 ``` 这里有几个关键...

    hadoop map reduce hbase 一人一档

    而HBase,则是构建在Hadoop之上的一款开源、非关系型数据库,设计用于处理大规模分布式数据存储。它提供了实时读写访问,并支持随机和有序的数据检索,这在大数据应用场景中非常关键。 “一人一档”或“一车一档”...

    HBase学习利器:HBase实战

    《HBase in Action》是一本由Nick Dimiduk和Amandeep Khurana撰写的关于HBase实践的书籍,该书旨在帮助读者深入理解HBase的工作原理及其实战应用。 **章节概述**: - **第一部分:HBase基础** - **第1章:介绍...

    HBase开启审计日志

    HBase是一款分布式列式存储系统,基于Google的Bigtable论文实现。它具有高可靠性、高性能、面向列、可伸缩的特点,非常适合处理海量数据。在大数据领域,HBase被广泛用于实时读/写访问以及随机查询的大规模数据集。...

    hbase安装与使用

    HBase 是一款构建于 Hadoop 之上的分布式、可扩展的大规模数据存储系统。它提供了类似 Google BigTable 的功能特性,非常适合处理海量数据和高并发读写需求的应用场景。本文主要介绍如何在 Linux 环境下安装和配置 ...

    hbase-sdk是基于hbase-client和hbase-thrift的原生API封装的一款轻量级的HBase ORM框架

    对HBase的API做了一层抽象,统一了HBase1.x和HBase2.x的实现,并提供了读写HBase的ORM的支持,同时,sdk还对HBase thrift 的客户端API进行了池化封装,(类似JedisPool),消除了直接使用原生API的各种问题,使之...

    基于springboot集成hbase过程解析

    SpringBoot集成HBase是当前大数据处理和存储解决方案中的一种常见组合。HBase是基于Hadoop的分布式、可扩展的NoSQL数据库,能够存储大量的结构化和非结构化数据。SpringBoot则是一个基于Java的现代Web框架,提供了...

    在windows上安装Hbase

    HBase是一个分布式的、基于列模式的架构,在Apache Hadoop和Apache Zookeeper上数据库。它具有高性能、可扩展性和灵活性等特点。 七、HBase的应用场景 HBase广泛应用于大数据处理、实时数据处理、数据仓库等领域。...

    hbase-1.2.1-bin.tar的压缩包,下载到本地解压后即可使用 HBase 是一个开源的、分布式的NoSQL 数据库

    HBase 是一个开源的、分布式的、版本化的 NoSQL 数据库(也即非关系型数据库),它利用 Hadoop 分布式文件系统(Hadoop Distributed File System,HDFS)提供分布式数据存储。与传统的关系型数据库类似,HBase 也以...

    hbase安装包

    HBase,全称为Hadoop Distributed File System上的基础结构(HBase on Hadoop Distributed File System),是一种分布式的、面向列的开源数据库,它构建在Apache Hadoop文件系统(HDFS)之上,提供高可靠性、高性能...

Global site tag (gtag.js) - Google Analytics