1 基本介绍
1.1 前言
HBase – Hadoop Database,是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类似于Bigtable的能力。HBase是Apache的Hadoop项目的子项目。
HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。另一个不同的是HBase基于列的而不是基于行的模式。
HBase是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。
2 安装和使用
2.1 下载
HBase的官方网站http://www.apache.org/dyn/closer.cgi/hbase/上面可以下载到各种版本。目前用最新版本是0.98.2,建议下载stable目录下的稳定版本。
2.2 安装
安装依赖基础要求
1. Linux操作系统
根据HBase的官方介绍,HBase没有在windows下测试过,因而,我们都是将HBase安装在Linux操作系统上。我本机安装的Ubuntu 12.04的虚拟机。
2. Jdk
HBase需要jdk支持其运行,jdk版本要求是1.6及其以上。
这里暂且把Linux虚拟机的安装和虚拟机上jdk的安装过程跳过,可以参照网上其他相关资料执行。
HBase的安装方法比较简单,将我们下载的HBase的安装包hbase-0.94.20.tar.gz拷贝到Linux的根目录下。
接着执行以下命令和配置,之后启动HBase:
1. 解压缩安装包
root@ubuntu:/# tar xfz hbase-0.94.20.tar.gz
root@ubuntu:/# cd hbase-0.94.20
2. 配置数据存储目录
正如官方文档描述的那样,这时我们可以直接启动HBase,这样的话,使用的数据存储目录为 /tmp/hbase-${user.name},也就意味着,我们一旦重启Linux,我们先前存储的数据就将丢失。
Linux下执行以下命令:
root@ubuntu:/# cd /hbase-0.94.20/conf/
root@ubuntu:/hbase-0.94.20/conf# vi hbase-site.xml
之后,修改配置文件内容为:
<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl"href="configuration.xsl"?>
<configuration>
<property>
<name>hbase.rootdir</name>
<value>file:///hbase_data/hbase</value>
</property>
</configuration>
3. 启动HBase
root@ubuntu:/hbase-0.94.20/conf# ../bin/start-hbase.sh
starting master, logging to/hbase-0.94.20/bin/../logs/hbase-root-master-ubuntu.out
至此,单机模式启动HBase已经完成了。HBase的停止脚本是相同目录下的stop-hbase.sh。
2.3 HBase安装模式
在上一节中我们提到,我们安装的是单机模式。单机模式表示,我们所有的服务都运行在一个JVM上,包括HBase和Zookeeper。
另外,HBase还有两种安装模式:伪分布式模式和分布式模式。
伪分布式模式是把进程运行在一台机器上,但不是一个JVM。
完全分布式模式就是把整个服务被分布在各个节点上了 。
伪分布式模式和分布式模式依赖安装较多其他组件和服务,安装过程较为复杂,将会在另一篇文章中专门介绍。
3 开始一个例子
大多数技术人员happy的时候开始了。我们开始一个简单的Helloworld。
3.1 使用HBase shell连接HBase
使用HBase自带的客户端连接工具,连接到HBase:
3.2 创建User表
输入以下命令并执行:
3.3 对User表简单地增删改查
往User表中插入一条信息:
查询刚才插入的信息:
3.4 检查数据存储目录
我们看一下之前我们配置的数据存储目录的变化:
我们可以看到,在之前配置的数据存储目录下,已经新添加了一些用于存储我们刚才存入的数据的文件了。
4 HBase基础定义和概念
4.1 表
HBase是一个数据库,数据以表的形式存储在Hbase中。
正如我们在hello world中定义中的User表类似,HBase的表的结构如下所示:
Row Key |
Time Stamp |
ColumnFamily contents |
ColumnFamily anchor |
"com.cnn.www" |
t9 |
|
anchor:cnnsi.com = "CNN" |
"com.cnn.www" |
t8 |
|
anchor:my.look.ca = "CNN.com" |
"com.cnn.www" |
t6 |
contents:html = "<html>..." |
|
"com.cnn.www" |
t5 |
contents:html = "<html>..." |
|
"com.cnn.www" |
t3 |
contents:html = "<html>..." |
|
4.2 行、列族、列
行以rowkey作为唯一标示。Rowkey是一段字节数组,这意味着,任何东西都可以保存进去,例如字符串、或者数字。行是按字典的排序由低到高存储在表中。
列族是列的集合。要准确表示一个列,需要“列族:列名”的方式。例如Hello world中的name列,应该被表示为“personalinfo:name”。
值得注意的是,列族被要求在创建表时指定,但列不需要,可以随时使用的时候创建。另外,一个列族的成员在文件系统上都存储在一起,因而列族中的所有列的存取方式都是一致的。HBase的存储优化就都针对列族级别,例如,我们可以考虑将经常需要一起取出来分析的信息,都存储在一个列族上。
5 HBase常用的操作
为了方便大家开发过程中快速查询,这里分类介绍最常见的HBase命令。HBase shell中支持的所有命令,可以通过help命令来列举出来。如下所示:
这里只是截取了前部分命令,尚有部分命令不能再上图中显示。
5.1 一般命令
5.1.1 status
功能:查询服务器状态
使用:
5.1.2 version
功能:查询HBase版本信息
使用:
5.1.3 whoami
功能:查看连接的用户
使用:
5.2 DDL命令
5.2.1 Create创建表
功能:创建一个表。正如之前提到的,创建一个表时,不指定具体的列名,但要指定列族名。
使用:create ‘表名’,’列族名1’,’列族名2’
5.2.2 disable失效表
功能:失效一个表。当需要修改表结构、删除表时,需要先执行此命令。
使用:
5.2.3 enable使失效表有效
功能:使表有效。在失效表以后,需要执行此命令,以使得表可用。
使用:
5.2.4 alter修改表结构
功能:修改表结构,包括新增列族、删除列族等
使用:
新增列族(记得在执行alter之前,要先disable表)
删除列族
重命名列族
列族不能被重命名。重命名一个列族的通常途径是使用API创建一个有着期望名称的新的列族,然后将数据复制过去,最后再删除旧的列族。
5.2.5 describe查看表结构
功能:查看表结构
使用:
5.2.6 list列举数据库中的所有表
功能:查看数据库中所有的表
使用:
5.2.7 drop删除表
功能:删除指定的表
使用:
5.3 DML命令
5.3.1 put插入数据
功能:插入一条数据到指定的表中。对于同一个rowkey,如果执行两次put,则第二次被认为是更新操作。
使用:put ‘表名’,’列族名1:列名1’,’值’
5.3.2 get获取数据
功能:获取数据
使用:
获取指定rowkey的指定列族指定列的数据
获取指定rowkey的指定列族所有的数据
获取指定rowkey的所有数据
获取指定时间戳的数据
5.3.3 Count计算表的行数
功能:计算表的行数
使用:
5.3.4 put更新数据
详见5.3.1
5.3.5 scan全表扫描数据
功能:扫描全表所有数据
使用:
5.3.6 delete删除数据
功能:删除表中的数据
使用:
删除指定rowkey的指定列族的列名的数据
删除指定rowkey的指定列族的数据
5.3.7 deleteall删除整行数据
功能:删除整行数据
使用:
5.3.8 truncate删除全表数据
功能:删除表中所有的数据。正如你看到的,在HBase的help命令里并没有
使用:
相关推荐
【资源说明】 基于微信小程序的校园论坛;微信小程序;云开发;云数据库;云储存;云函数;纯JS无后台;全部资料+详细文档+高分项目.zip 【备注】 1、该项目是个人高分项目源码,已获导师指导认可通过,答辩评审分达到95分 2、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 3、本项目适合计算机相关专业(人工智能、通信工程、自动化、电子信息、物联网等)的在校学生、老师或者企业员工下载使用,也可作为毕业设计、课程设计、作业、项目初期立项演示等,当然也适合小白学习进阶。 4、如果基础还行,可以在此代码基础上进行修改,以实现其他功能,也可直接用于毕设、课设、作业等。 欢迎下载,沟通交流,互相学习,共同进步!
单电阻采样 基于单电阻采样的相电流重构算法 keil完整工程。 单电阻采样 f103的单电阻,完整工程,带文档,带硬件资料。 f3平台的单电阻完整工程,代码详细注释。 还有微芯的单电阻smo代码加文档 具体如截图请看下
jQuery左侧导航右侧tab页面切换
哈希查找
五相电机邻近四矢量SVPWM模型_MATLAB_Simulink仿真模型包括: (1)原理说明文档(重要):包括扇区判断、矢量作用时间计算、矢量作用顺序及切时间计算、PWM波的生成; (2)输出部分仿真波形及仿真说明文档; (3)完整版仿真模型:Simulink仿真模型; 注意,只包含五相电机邻近四矢量SVPWM算法,并非五相电机双闭环矢量控制,如果想要五相电机双闭环矢量控制资料,另一个链接。 资料介绍过程十分详细
法码滋.exe法码滋2.exe法码滋3.exe
项目包含完整前后端源码和数据库文件,均测试可正常运行 环境说明: 开发语言:Java 框架:ssm,mybatis JDK版本:JDK1.8 数据库:mysql 5.7 数据库工具:Navicat11 开发软件:eclipse/idea Maven包:Maven3.3 部署容器:tomcat7
算法允许用户在图像上自行划定标签,并对这些区域内的图像进行肤色检测和处理;最后在一个PyQt窗口中显示处理后的三张图片,分别为带标签图片,二值化图片,膨胀后图片。
内容概要: 本资料包含了一系列用于庆祝浪漫节日的创意代码,主要包括爱心代码和圣诞树代码。这些代码可以生成视觉上吸引人的图案和动画,用于在屏幕上展示爱心和圣诞树,增加节日气氛。爱心代码可以用于表达爱意,而圣诞树代码则适合在圣诞节期间使用,为用户带来节日的欢乐和视觉享受。 适用人群: 本资料适用于以下人群: 程序员和开发者,他们希望在项目中添加节日元素或为特别场合创造个性化的视觉效果。 网页设计师,他们需要为网站或应用程序添加节日主题的装饰。 技术爱好者和DIY爱好者,他们喜欢通过编程来庆祝节日或为朋友和家人制作特别的礼物。 实现:可直接运行python程序。
1. 患者信息与隔离状态管理 患者基本信息录入:对于疑似、确诊或密切接触者患者,系统记录其基本信息,包括姓名、年龄、性别、联系方式、住址等。 疫情风险评估:通过问卷或医务人员评估,系统对患者进行风险评估,判断是否需要隔离、隔离的级别(如轻症、中症、重症等)。 隔离状态管理:记录患者的隔离状态(如隔离中、已解除隔离、转入ICU等),并能够实时更新隔离状态变化。 隔离病房分配:根据患者的病情、感染风险和病房资源,系统自动分配适当的隔离病房或床位,避免交叉感染。 2. 隔离病房与环境管理 病房信息管理:系统对每个隔离病房进行实时监控,包括病房的床位使用情况、设备设施、清洁消毒状况等,确保每个病房的隔离效果。 空气流通与环境消毒管理:记录隔离病房的空气流通情况、消毒记录、物品消耗等,确保符合疫情防控要求。 设备与物资分配:针对隔离病房的特殊需求,系统可以自动化管理医疗设备(如氧气、呼吸机等)与防护物资(如口罩、手套、防护服等)的分配与库存管理。 3. 医护人员防护与工作管理 医护人员排班与防护管理:为隔离病房的医护人员进行特殊排班,避免交叉感染,并根据需要分配适当的防护装备,如全身防护服、N9
适配文章:https://editor.csdn.net/md?not_checkout=1&spm=1011.2415.3001.6217&articleId=144663667 富芮坤FR8003作为主机连接FR8003二:官方代码主从的UUID和att_idx
内容概要:文章介绍了USB PD协议单口控制器DP3145D的技术特点、主要功能和应用场景。DP3145D支持USB Type-C和USB Power Delivery(PD)3.1协议,具备多种配置选项,最高输出功率45W。它集成了CV环路光耦驱动电路、反馈网络电阻以及多项保护措施,适用于ACDC适配器等USB充电设备。 适合人群:电子工程师、电源产品设计师和技术研究人员。 使用场景及目标:主要用于设计和开发支持USB PD协议的ACDC适配器和充电设备,实现高效、安全的充电解决方案。 阅读建议:重点关注DP3145D的具体技术参数、功能特点和典型应用实例,结合自身需求进行产品选型和设计。
VBA视频教程 05
基于Spring Boot框架的网上蛋糕销售系统_30z8r428_231-wx.zip
matlab
蜡笔小新-去掉动效.zip
1221额的2的2的2额
济宁市2005-2024年近20年的历史气象数据,每3小时更新一次数据,参数包含气温、气压、降水量、云层、能见度、风向、湿度等,几万条数据
8.40 最新版本Saturn_PCB_Toolkit安装包,,eda 设计 PCB设计辅助工具,软件功能强大,单端线阻抗、差分线阻抗到串扰分析等多种计算工具
NotImplementedError.md