Hbase配置手册
1)下载hbase
解压到每台服务器的/data/soft
解压
root@master:/data/soft# tar zxvf hbase-0.90.0.tar.gz
建立软连
root@master:/data/soft# ln -s hbase-0.90.0 hbase
2)配置hbase
前提是安装完成hadoop,默认在namenode上进行
1.修改conf/hbase-env.sh,添加jdk支持
export JAVA_HOME=/usr/local/jdk
export HBASE_MANAGES_ZK=true
export HBASE_LOG_DIR=/data/logs/hbase
2. 修改conf/hbase-site.xml,
<property>
<name>hbase.rootdir</name>
<value>hdfs://master:9000/hbase</value>
</property>
<property>
<name>hbase.cluster.distributed</name>
<value>true</value>
</property>
<property>
<name>hbase.master</name>
<value>hdfs://master:60000</value>
</property>
<property>
<name>hbase.zookeeper.quorum</name>
<value>slave-001,slave-002,slave-003</value>
<description>Comma separated list of servers in the ZooKeeper Quorum. For example, "host1.mydomain.com,host2.mydomain.com,host3.mydomain.com". By default this is set to localhost for local and pseudo-distributed modes of operation. For a fully-distributed setup, this should be set to a full list of ZooKeeper quorum servers. If HBASE_MANAGES_ZK is set in hbase-env.sh this is the list of servers which we will start/stop ZooKeeper on. </description>
</property>
<property>
<name>hbase.zookeeper.property.dataDir</name>
<value>/data/work/zookeeper</value>
<description>Property from ZooKeeper's config zoo.cfg. The directory where the snapshot is stored. </description>
</property>
hbase.rootdir设置hbase在hdfs上的目录,主机名为hdfs的namenode节点所在的主机
hbase.cluster.distributed设置为true,表明是完全分布式的hbase集群
hbase.master设置hbase的master主机名和端口
hbase.zookeeper.quorum设置zookeeper的主机,建议使用单数
3.修改hadoop的目录下的conf/hdfs-site.xml
<property>
<name>dfs.datanode.max.xcievers</name>
<value>4096</value>
</property>
4.复制hadoop的jar到hbase的lib目录下,删除原来的lib下的hadoop.jar
原来的hadoop-core-0.20-append-r1056497.jar
新的hadoop-0.20.2-core.jar
5.修改conf/regionservers
将所有的datanode添加到这个文件,类似与hadoop中slaves文件
6.拷贝hbase到所有的节点
3)启动hbase
$ ./bin/start-hbase.sh
4)hbase自带的web界面
http://master:60010/
5)测试
1.登录hbase客户端
./bin/hbase shell
2.新建数据表,并插入3条记录
hbase(main):003:0> create 'test', 'cf'
0 row(s) in 1.2200 seconds
hbase(main):003:0> list 'table'
test
1 row(s) in 0.0550 seconds
hbase(main):004:0> put 'test', 'row1', 'cf:a', 'value1'
0 row(s) in 0.0560 seconds
hbase(main):005:0> put 'test', 'row2', 'cf:b', 'value2'
0 row(s) in 0.0370 seconds
hbase(main):006:0> put 'test', 'row3', 'cf:c', 'value3'
0 row(s) in 0.0450 seconds
3.查看插入的数据
hbase(main):007:0> scan 'test'
ROW COLUMN+CELL
row1 column=cf:a, timestamp=1288380727188, value=value1
row2 column=cf:b, timestamp=1288380738440, value=value2
row3 column=cf:c, timestamp=1288380747365, value=value3
3 row(s) in 0.0590 seconds
4.读取单条记录
hbase(main):008:0> get 'test', 'row1'
COLUMN CELL
cf:a timestamp=1288380727188, value=value1
1 row(s) in 0.0400 seconds
5.停用并删除数据表
hbase(main):012:0> disable 'test'
0 row(s) in 1.0930 seconds
hbase(main):013:0> drop 'test'
0 row(s) in 0.0770 seconds
6.退出
hbase(main):014:0> exit
分享到:
相关推荐
指导手册06:HBase安装部署 hbase配置文件
HBase是一种分布式、基于列族的NoSQL数据库,由Apache软件基金会开发并维护,是Hadoop生态系统中的重要组件。这份“HBase官方文档中文版”提供了全面深入的HBase知识,帮助用户理解和掌握如何在大数据场景下有效地...
HBase 官方开发参考手册是一份详尽的文档,主要面向开发人员和系统管理员,提供了关于 HBase 的配置、使用和优化等方面的知识。 ### HBase 系统架构 - **快速入门**:这部分内容介绍了如何快速启动一个单节点的 ...
### Hadoop2.7.1 + HBase1.3.5 在 CentOS6.5 虚拟机环境下的安装配置指南 #### 准备工作 为了确保 Hadoop 和 HBase 的顺利安装,需要提前做好一系列准备工作,包括安装 VMware、设置虚拟机、配置 CentOS 操作系统等...
### HBase 官方手册知识点概述 #### 一、引言 HBase 是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的 Google 的论文 “Bigtable: A Distributed Storage System for Structured Data”。就像...
Hadoop2.4、Hbase0.98、Hive集群安装配置手册
实验环境中需要已经搭建好的 HBase 环境,并确保 HBase Shell 已经安装和配置好了。 二、实验步骤 1. 启动 HBase Shell 首先,启动 HBase Shell,运行命令:hbase shell 2. 一般操作 (1)查询服务器状态 使用...
首先,手册从介绍 HBase 入手,然后通过快速入门指南引导用户搭建起单机版的 HBase 环境,接着深入探讨了 HBase 的配置细节,包括配置文件和运行模式等内容。此外,手册还介绍了一些基本的准备工作,比如安装 Java ...
这份手册适合于2.0.3版本的HBase,它为用户提供了从入门到深入的全面指导,涵盖了HBase的安装、配置、运行模式、命令行操作、数据模型、架构设计、表操作、版本控制、索引、事务以及安全性等多个方面。 在安装和...
《HBase用户手册-v2.2》是一份详尽的指南,主要针对HBase这款分布式列存储数据库。手册涵盖了从基础介绍到高级特性的多个方面,适用于对HBase感兴趣的开发者和管理员。 2.1 整体介绍 HBase是基于Google Bigtable...
### 云计算Hadoop伪集群与HBase安装配置详解 #### 1. 综述 本文档旨在为IT工程师提供在单台Linux服务器上构建和配置Hadoop伪集群及HBase服务的详细指南。Hadoop是一种分布式计算框架,主要用于处理大量数据集。而...
《HBase运维手册》主要涵盖了HBase数据库的运维核心要点,包括Region管理、缓存机制、读写性能、压缩操作、内存使用以及RPC调用等多个方面。以下是对这些知识点的详细解析: 1. **Region管理**: - Region数量:...
#### 一、配置第三方依赖包HADOOP_CLASSPATH和HBase问题 **问题描述** 在本地开发HBase程序时,虽然本地编译能够通过(因为在IDE中已经导入了必要的jar包),但在打包jar并尝试在Linux环境下使用`hadoop jar`命令...
性能调优包括操作系统、网络、Java、HBase配置、ZooKeeper、Schema设计等方面的优化。优化HBase的性能是一个综合性的工程,需要从多个角度进行考量。 ### 故障排除和调试 这一部分提供了故障排除和调试HBase的一些...
### HBase安装手册知识点概述 #### 一、HBase简介 HBase是一个分布式的、面向列的开源数据库,是Apache Hadoop生态系统中的一个重要组成部分。它建立在Hadoop Distributed File System (HDFS)之上,提供了类似...
《HBase权威指南》则是一部全面的HBase技术手册,详细阐述了HBase的内部机制和工作原理,包括RegionServer、Zookeeper、HDFS等关键组件的工作流程。此外,还讲解了HBase的高级特性,如MapReduce、Hive、Pig等与HBase...
- **Java与HBase配置**:针对Java虚拟机和HBase配置项给出了优化建议。 - **ZooKeeper与Schema设计**:强调了ZooKeeper的配置对HBase稳定性的重要性,以及合理设计Schema对性能提升的作用。 - **HBase General ...
### HBase运维手册知识点解析 #### 一、Transwarp HBase运维管理工具清单 **1.1 HBase运维管理工具清单** ##### 1.1.1 Canary Canary是Transwarp HBase中用于健康检查的一个工具。它可以定期检测集群的健康状况,...
### Hadoop和HBase安装操作手册 #### 一、引言 随着大数据技术的发展,Hadoop和HBase作为处理大规模数据的关键技术框架,受到了越来越多的关注。本文档旨在为初次接触这些技术的学习者提供一份详尽的操作指南,...