- 浏览: 562688 次
- 性别:
- 来自: 杭州
文章分类
- 全部博客 (478)
- lucene (45)
- oracle (19)
- nutch (2)
- blog (2)
- 垂直搜索 (19)
- java综合 (89)
- spring (15)
- Hibernate (9)
- Struts (9)
- Hadoop (16)
- Mysql (12)
- nosql (10)
- Linux (3)
- MyEclipse (4)
- Ant (1)
- 设计模式 (19)
- JBPM (1)
- JSP (1)
- HtmlParser (5)
- SVN (2)
- 插件 (2)
- 收藏 (7)
- Others (1)
- Heritrix (18)
- Solr (4)
- 主题爬虫 (31)
- 内存数据库 (24)
- 分布式与海量数据 (32)
- httpclient (14)
- Tomcat (1)
- 面试宝典 (6)
- Python (14)
- 数据挖掘 (1)
- 算法 (6)
- 其他 (4)
- JVM (12)
- Redis (18)
最新评论
-
hanjiyun:
本人水平还有待提高,进步空间很大,看这些文章给我有很大的指导作 ...
JVM的内存管理 Ⅲ -
liuxinglanyue:
四年后的自己:这种方法 不靠谱。 使用javaagent的方式 ...
计算Java对象占用内存空间的大小(对于32位虚拟机而言) -
jaysoncn:
附件在哪里啊test.NoCertificationHttps ...
使用HttpClient过程中常见的一些问题 -
231fuchenxi:
你好,有redis,memlink,mysql的测试代码吗?可 ...
MemLink 性能测试 -
guyue1015:
[color=orange][/color][size=lar ...
JAVA同步机制
1.简介
HBase是 Hadoop 的正式子项目,它是一个面向列的分布式数据库,它在存储数据结构上并非关系型,而是疏松分布式的,持久并按多维排序并索引的map型,其思想源于Google的BigTable论文。(Google BigTable的paper: http://labs.google.com/papers/bigtable-osdi06.pdf)
由于HBase是一个分布式、大规模的平台,主要安装在类Unix平台上。但是由于其开发语言是Java,因此它同样具有跨平台的特性,同样也可以安装在Windows操作系统上。为了方便起见,使用具有类Unix特性的Cygwin来安装HBase。
2.目的
本文主要阐述在伪分布式模式(Pseudo-distributed mode)下,在Windows操作系统上使用Cygwin来安装、运行和测试HBase项目。对于真正的分布式的集群配置,可以参考本文以及HBase项目官网(http://hadoop.apache.org/hbase/)中的讲解。
3.安装与配置
软件版本:
JDK 1.6(或以上版本)
Cygwin 2.5
Hadoop 0.20.x
HBase 0.20.x
3.1 Java、Cygwin、SSH
这里的三个软件的安装过程,可以参考《Hadoop开发者》杂志创刊号中《在Windows 上安装Hadoop 教程》,在此不再赘述。
3.2 Hadoop
同样,Hadoop的安装也可以参考《Hadoop开发者》杂志创刊号中《在Windows 上安装Hadoop 教程》一文。但是根据笔者的安装过程,列出以下几点注意:
1. 在配置hadoop-env.sh中的JAVA_HOME时,Jdk往往安装在C:\Program Files\文件夹下,例如:C:\Program Files\Java\jdk1.6.0_01。JAVA_HOME应配置如下:
export JAVA_HOME=/cygdrive/c/Progra~1/Java/jdk1.6.0_01
其中,由于Cygwin无法识别“Program Files”中间的空格,如果不按照上述设置,则系统无法找到Jdk安装目录。
当然,你也可以在Cygwin的/usr/local目录下添加一个连接,从而方便配置JAVA_HOME。例如:
ln -s /cygdrive/c/Program\ Files/Java/jdk1.6.0_01 \
/usr/local/jdk1.6.0_01
export JAVA_HOME=/usr/local/jdk1.6.0_01
2. 在core-site.xml配置文件中,属性“fs.default.name”的值与《Hadoop开发者》杂志创刊号中《在Windows 上安装Hadoop 教程》一文中的值保持一致,设置为:“hdfs://localhost:8888”。同样,配置文件mapred-site.xml中的“mapred.job.tracker”属性值设置为:“localhost:9999”。
3. 在Hadoop分布式文件系统中创建两个目录hbase和tmp,这两个目录将在下面安装HBase的过程中使用,在Shell中输入命令如下:
bin/hadoop dfs –mkdir hbase tmp
Hadoop的分布式文件系统中将增加hbase和tmp两个目录,如下图所示:
3.3 HBase
假设HBASE_HOME为HBase的安装目录。
1. 在$HBASE_HOME/conf/hbase-env.sh中增加如下两个环境变量:
export JAVA_HOME=/cygdrive/c/Progra~1/Java/jdk1.6.0_01
export HBASE_IDENT_STRING=localhost
其中,JAVA_HOME的设置参照上文的说明。
2. 将$HBASE_HOME/conf/hbase-default.xml中的所有内容,拷贝到$HBASE_HOME/conf/hbase-site.xml文件中。
3. 修改hbase-site.xml配置文件中的“hbase.rootdir”属性,以及“hbase.tmp.dir”属性,如下所示:
<property>
<name>hbase.rootdir</name>
<value>hdfs://localhost:8888/hbase</value>
<description>The directory shared by region servers.
Should be fully-qualified to include the filesystem to use.
E.g: hdfs://NAMENODE_SERVER:PORT/HBASE_ROOTDIR
</description>
</property>
……
<property>
<name>hbase.tmp.dir</name>
<value>hdfs://localhost:8888/tmp</value>
<description>Temporary directory on the local filesystem.</description>
</property>
…….
注意,这里设置的两个目录正是上文中在Hadoop的分布式文件系统中建立的两个目录,此外,端口号也与前面保持一致,设置为:“8888”。
4. 修改hbase-site.xml配置文件中的“hbase.zookeeper.quorum”属性的值为“127.0.0.1”,在Cygwin中,“localhost”有时无法正确识别。如下所示:
<property>
<name>hbase.zookeeper.quorum</name>
<value>127.0.0.1</value>
<description>Comma separated list of servers in the ZooKeeper Quorum.
For example, "host1.mydomain.com,
host2.mydomain.com, host3.mydomain.com".
By default this is set to localhost for local and pseudo-distributed modes
of operation. For a fully-distributed setup, this should be set to a full
list of ZooKeeper quorum servers. If HBASE_MANAGES_ZK
is set in hbase-env.sh
this is the list of servers which we will start/stop ZooKeeper on.
</description>
</property>
4.测试
下面测试系统是否正确安装。
1. 打开Cygwin的终端,执行“ssh localhost”命令。
2. 在Hadoop安装目录下,执行“bin/start-all.sh”脚本,启动Hadoop。
3. 在Hbase安装目录下,执行“bin/start-hbase.sh”脚本,启动HBase。
4. 在Hbase安装目录下,执行“bin/hbase shell”命令,进入Shell命令模式。
5. 在Shell中输入“create 'test', 'data'”,执行结果通过输入“list”命令进行查看。如下图所示:
6. 在Shell中分别输入“put 'test', 'row1', 'data:1', 'value1'”,“put 'test', 'row2', 'data:2', 'value2'”,“put 'test', 'row3', 'data:3', 'value3'”三条命令,以创建三条记录。
7. 输入“scan 'test'”命令,通过执行结果来测试上述三条命令的执行情况。如下图所示。
5.总结
至此,HBase在Windows操作系统中利用Cygwin工具已经安装完成,并运行良好。用户可以在系统中存储大规模的数据,并进行海量数据处理。
发表评论
-
基于Hadoop的Hbase环境搭建
2010-12-22 20:47 1316转:http://www.tech126.com/hado ... -
Hbase Shell的常用命令
2010-12-22 20:32 1662总结的一些Hbase shell的命令 都很简单,可以h ... -
HBase的性能优化和相关测试
2010-12-22 20:29 1586HBase的写效率还是很高的,但其随机读取效率并不高 可 ... -
understanding redis internal - 持久化机制
2010-12-05 09:28 1107redis 持久化有2种方式,定时快照与append only ... -
understanding redis internal - 主体结构与启动流程
2010-12-05 09:27 1084一. redis的定义 官方wiki对redis的定 ... -
MemcacheDB, Tokyo Tyrant, Redis performance test
2010-11-29 21:05 875I had tested the following ke ... -
mongodb API
2010-11-28 21:17 829http://api.mongodb.org/java/2.3 ... -
MongoDB 安装与启动
2010-11-28 19:06 983主要介绍在Windows 与 Linux 下的安装与启动 ... -
分布式key-value数据库mongoDB 安装
2010-11-28 19:05 1132Mongo是一个高性能,开源,模式自由(schema-free ... -
NoSQL数据库MongoDB之Windows安装
2010-11-28 19:04 1685就像和被人们当初炒得沸沸扬扬的SOA、OSGi等技术一 ... -
HBase使用例子(中文翻译)
2010-11-28 17:33 1553通过编码(java)的形式对HBase进行一系列的管理 ... -
HBase安装及测试
2010-11-28 17:25 1450HBase安装及测试 1. ... -
HBase安装
2010-11-28 17:23 997官方文档:http://hbase.apache.org/ ... -
hbase的安装配置
2010-11-28 17:21 917standalone&pseudo-distribut ... -
javaeye上一些hbase讲解的链接
2010-11-28 17:20 10601.比较多的一些讲解http://beyiwork.iteye ... -
HBase入门
2010-11-28 15:58 1015HBase入门 部分内容参考于http://www.na ... -
HBase的安装配置
2010-11-28 15:56 940首先需要先下载HBase最新且稳定的版本:http://www ... -
MongoDB
2010-11-28 14:18 1283软硬件环境 MySQL版本:5.1.50,驱动版本:5. ... -
Berkeley DB Java Edition Research
2010-11-27 14:10 1022一、Berkeley DB Java Edition ... -
Berkeley DB
2010-11-27 13:28 1100Berkeley DB(简称dbd)是oracle下一款开源的 ...
相关推荐
在安装HBase前,需要安装Cygwin和Hadoop。这两个软件的安装不在本文的讨论范围内。 二、下载HBase 首先,需要下载HBase的安装包。可以从HBase的官方网站(http://hadoop.apache.org/hbase/)下载。这里使用的是...
7. **依赖库的兼容性**:HBase可能依赖一些特定版本的库,这些库在Cygwin环境中可能需要特别安装或调整。 解决这些问题通常需要深入理解HBase的源码,以及Cygwin的工作原理。开发者可能需要修改HBase的脚本或者配置...
1 Hadoop介绍 2 Hadoop在国内应用情况 3 Hadoop源代码eclipse编译教程 ...24 在Windows中使用Cygwin安装HBase 28 Nutch 与Hadoop的整合与部署 31 在Windows eclipse上单步调试Hive教程 38 Hive应用介绍
### 在Windows中使用Cygwin安装HBase HBase是Hadoop生态系统中的一个重要组件,主要用于存储非结构化和半结构化数据。在Windows环境下,可以通过Cygwin环境来安装HBase。主要步骤包括安装Cygwin、配置Java环境、...
在安装Cygwin之前,需要下载Cygwin的安装程序setup.exe,然后选择安装模式,可以选择从Internet安装或从本地安装。安装完成后,需要配置环境变量,包括PATH和JAVA_HOME。 2. Cygwin的配置 在配置Cygwin时,需要...
安装 Hadoop 在 Windows 平台上的步骤可能会比较复杂,但是通过使用 Cygwin 仿真 Linux 环境,我们可以成功地安装 Hadoop、ZooKeeper、HBase 和 Hive 等相关组件。同时,我们也需要注意安装过程中的每一个细节,以...
如果是在Windows环境下,可能还需要安装cygwin或使用其他工具来模拟Linux命令行环境。 **hbase-2.3.5-bin.tar.gz.tar.gz.tar.gz** 和 **zookeeper-3.4.10.tar.gz.tar.gz.tar.gz** 这两个文件是压缩了多次的安装包,...
Windows用户可能需要依赖额外的工具,如Cygwin或Git Bash,来模拟Linux环境,因为Hadoop和HBase主要在Unix-like系统上开发和测试。解压后,你需要配置Hadoop的环境变量,包括HADOOP_HOME、HADOOP_CONF_DIR等,并将...
2. **安装插件**: 安装必要的插件,如Hadoop插件或HBase插件,以支持在Eclipse中编写相关的应用程序。 3. **配置项目**: 创建新的Hadoop或HBase项目,并配置好项目的类路径和库文件。 4. **编写代码**: 根据需求编写...
在实际操作中,"windows客户端依赖资料"可能包含用于安装、配置和运行Hadoop所需的特定文件,如配置文件模板、Cygwin安装指南、Hadoop二进制包、环境变量设置说明等。通过这些资料,你可以一步步地在Windows上构建起...
尽管Hadoop在Windows上的运行相比Linux会有一些额外的挑战,如文件路径问题、权限管理等,但通过使用Hadoop的Windows Service工具或者cygwin模拟Linux环境,可以有效解决这些问题。此外,还可以借助如Apache Ambari...
6. **Windows上的Hadoop**:由于Hadoop主要针对Linux设计,Windows上的部署需要额外的配置,如使用Cygwin模拟Linux环境或使用Microsoft的Azure HDInsight服务。 7. **编译Hadoop**:对于非官方的Windows版本,需要...
在 Windows 下还需要安装 Cygwin,Cygwin 是在 Windows 平台上运行的 UNIX 模拟环境,提供了 shell 支持。 二、Hadoop 集群安装部署 Hadoop 集群安装部署需要多台计算机集群,Master 和 Slaves 处理器、内存、硬盘...
下面我们将深入探讨这两个文件的作用、功能以及如何在Windows系统中使用它们。 首先,`hadoop.dll`是一个动态链接库文件,它是Java编程语言在Windows平台上运行Hadoop时所依赖的库。Hadoop主要由Java编写,但某些...
下载并安装Cygwin,确保在安装过程中选择了ssh和ssl支持包。安装完成后,通过`ssh-host-config`命令配置SSH服务,根据提示设置参数。接着,生成SSH密钥并配置免密码登录。 2. **配置Hadoop环境** 首先,设置Hadoop...