`
zljpp
  • 浏览: 259085 次
社区版块
存档分类
最新评论

Hadoop之HBase快速入门

阅读更多

本文解决单机(standlone)运行HBase的故障问题。读者可以快速领略HBase的基本Shell命令。


第一步 准备软件

机器环境:Ubuntu11.10+JDK1.6

下载软件:hbase-0.92.1.tar.gz

我的用户名为:cl

我的机器名为:thinkpad-zh

解压缩hbase:

$ tar xzf /home/cl/Downloads/hbase-0.92.1.tar.gz

复制到目录下:

/home/hbase-0.92.1

 

第二步 配置HBase

更改配置:

1)配置JDK路径

.../hbase-0.92.1/conf/hbase-env.sh

修改下面的行:
# export JAVA_HOME=/usr/java/jdk1.6.0/
export JAVA_HOME=/usr/local/java/jdk1.6.0_30

2)配置数据库文件路径

.../hbase-0.92.1/conf/hbasev-site.xml

修改为下面的:

<configuration>
  <property>
    <name>hbase.rootdir</name>
    <value>file:///home/cl/hbase_data</value>
  </property>
</configuration>

第三步 使用命令行

1)启动hbase数据库

cl@thinkpad-zh:/home/hbase-0.92.1/bin$ ./start-hbase.sh


2)停止hbase数据库命令:
...$ ./stop-hbase.sh

 

3)常见问题

日志在:

.../hbase-0.92.1/logs/hbase-cl-master-thinkpad-zh.log

如果发现日志中出现:

... WARN org.apache.hadoop.hbase.master.AssignmentManager: Unable to find a viable location to assign region -ROOT-,,0.70236052

则后面无法创建表(create 'tablename' 会无限期等待)


此时需要修改:

$ sudo vi /etc/hosts

为:

127.0.0.1 localhost
#127.0.1.1 thinkpad-zh
127.0.0.1 thinkpad-zh


重新启动数据库(如果已经存在进程nnnn,则先  $ kill nnnn):

cl@thinkpad-zh:/home/hbase-0.92.1/bin$ ./start-hbase.sh
starting master, logging to /home/hbase-0.92.1/bin/../logs/hbase-cl-master-thinkpad-zh.out


4)运行hbase shell命令工具

cl@thinkpad-zh:/home/hbase-0.92.1/bin$ ./hbase shell
HBase Shell; enter 'help<RETURN>' for list of supported commands.
Type "exit<RETURN>" to leave the HBase Shell
Version 0.92.1, r1298924, Fri Mar  9 16:58:34 UTC 2012


5)创建表

hbase(main):001:0> create 'my_first_table', 'col1', 'col2'
0 row(s) in 1.6050 seconds

hbase(main):002:0> 

hbase(main):002:0> list 'my_first_table'
TABLE                                                                           
my_first_table                                                                  
1 row(s) in 0.0150 seconds

 

6)退出shell

hbase(main):003:0> exit


7)停止hbase数据库

cl@thinkpad-zh:/home/hbase-0.92.1/bin$ ./stop-hbase.sh
stopping hbase............
cl@thinkpad-zh:/home/hbase-0.92.1/bin$ 
分享到:
评论

相关推荐

    Hadoop之Hbase从入门到精通 .doc

    "Hadoop之Hbase从入门到精通" HBase 是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用 HBase 技术可在廉价 PC Server 上搭建起大规模结构化存储集群。HBase 是 Google Bigtable 的开源实现,类似 ...

    Hadoop之Hbase从入门到精通

    HBase,全称Hadoop Base,是一种构建在Hadoop HDFS(Hadoop Distributed File System)之上的分布式列式数据库。它的设计目标是处理大规模数据集,提供高并发读写操作,同时保证数据的强一致性和高可用性。HBase受到...

    大数据云计算技术系列 Hadoop之Hbase从入门到精通(共243页).pdf

    《大数据云计算技术系列:Hadoop之Hbase从入门到精通》 HBase,全称Hadoop Database,是一款基于Hadoop生态系统的分布式列式存储系统,旨在处理海量结构化数据。它借鉴了Google Bigtable的设计思想,但开源并适应了...

    Hadoop之Hbase从入门到精通.doc

    Hadoop之HBase从入门到精通 本文将详细介绍HBase技术,从基础概念到高级应用,旨在帮助读者快速掌握HBase技术。 一、HBase技术介绍 HBase是Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储...

    hadoop hbase从入门到精通

    《Hadoop之HBase从入门到精通》是一个深入学习Hadoop和HBase的全面指南,旨在帮助初学者和有经验的开发者快速掌握这两个强大的大数据处理工具。Hadoop是Apache软件基金会开发的一个开源分布式计算框架,它允许在廉价...

    大数据云计算技术系列 Hadoop之Hbase从入门到精通(共243页).rar

    《大数据云计算技术系列:Hadoop之HBase从入门到精通》是一份全面深入的教程,旨在帮助读者理解和掌握HBase这一强大的分布式列式数据库。HBase是构建在Hadoop生态系统之上,专门处理大规模数据的非关系型数据库。这...

    Hadoop之Hbase从入门到精通.docx

    HBase是一种分布式、面向列的NoSQL数据库,作为Hadoop生态系统的一部分,HBase可以对大规模数据进行存储和处理。然而,HBase的性能调优是非常重要的,否则可能会导致性能下降,影响应用程序的运行效率。在本文中,...

    分布式存储系统hadoop:hbase安装

    分布式存储系统hadoop:hbase安装经验,非常不错的hadoop之hbase,入门环境搭建。

    新手指导hadoop、hbase、hive版本对应关系查找表

    对于Hadoop、HBase和Hive的版本对应关系问题,新手朋友们在入门时除了参考这些官方的文档以外,还可以通过查找社区论坛、博客文章等了解他人在升级过程中遇到的问题和解决方案,这将大大降低尝试和错误成本,快速...

    hadoop和hbase安装操作手册

    ### Hadoop和HBase安装操作手册 #### 一、引言 随着大数据技术的发展,Hadoop和HBase作为处理大规模数据的关键技术框架,受到了...希望这份操作手册能够帮助初学者快速入门,并在未来的大数据领域探索更广阔的空间。

    小牛学堂-大数据24期-04-Hadoop Hive Hbase Flume Sqoop-12天适合初学者

    小牛学堂-大数据24期-04-Hadoop Hive Hbase Flume Sqoop-12天适合初学者.txt

    基于Hadoop、HBase的wordcount代码.zip

    WordCount是Hadoop的入门示例,用于统计文本文件中每个单词出现的次数。它主要包含两个部分:Mapper和Reducer。Mapper负责将输入文本分割成单词,并为每个单词生成键值对(&lt;单词,1&gt;),Reducer则将所有相同的键(即...

    一个开源、成体系的大数据学习教程 spark学习 hadoop hive hbase flink教程 linux 从入门到精通

    spark学习 hadoop hive hbase flink教程 linux 从入门到精通 一个开源、成体系的大数据学习教程。spark学习 hadoop hive hbase flink教程 linux 从入门到精通 一个开源、成体系的大数据学习教程。spark学习 hadoop ...

    Hadoop 十分钟快速入门

    本快速入门将带你深入了解Hadoop生态系统的核心组件,包括HDFS、MapReduce、Hive和HBase,并通过集群配置实例让你快速上手。 首先,我们来探讨Hadoop。Hadoop是Apache基金会的一个开源项目,其核心设计思想是分布式...

    Hadoop、HBase、Hive、Pig、Zookeeper资料整理

    - **Hadoop-0.20.0-HDFS+MapReduce+Hive+HBase十分钟快速入门.doc**:这与前面的快速入门文档类似,可能对Hadoop的早期版本进行了快速介绍。 - **Hbase_分析报告白皮书.doc**:这可能是一份关于HBase在某个具体场景...

Global site tag (gtag.js) - Google Analytics