安装hadoop+hbase伪分布式
1.安装hadoop伪分布式
1.1安装jdk-6u24-linux-x64-rpm.bin,需要说明的是,尽可能的使用64位的JDK版本。
1.2进入到CDH3的官方下载网址http://archive.cloudera.com/cdh/3/下载最新hadoop和hbase的release版本hadoop-latest.tar.gz 和hbase-latest.tar.gz 。
1.3新建系统hadoop用户。命令:#adduser hadoop;#passwd hadoop,回车输入hadoop。
1.4用hadoop用户登录服务器。
1.5在/home/hadoop/目录下建立.ssh目录,修改/home/hadoop/.ssh/authorized_keys文件的权限为:-rw-r–r–,设置命令:$ cd /home/hadoop/.ssh,$ chmod 644 authorized_keys。
1.6通过ssh无需密码登录本机。ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa,直接回车,完成后会在~/.ssh/生成两个文件:id_dsa 和id_dsa.pub。这两个是成对出现,类似钥匙和锁。再执行命令$ cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys。此时通过命令$ssh localhost测试。
1.7解压缩hadoop.$tar -zxvf hadoop-latest.tar.gz。$mv hadoop-0.20.2-cdh3u2 hadoop.
1.8修改~/hadoop/hadoop/conf/hadoop-env.sh文件的环境变量
$cd hadoop/conf/,$vim hadoop-env.sh添加环境变量export JAVA_HOME=/usr/java/jdk1.6.0_20(自己机器上的jdk安装路径)
1.9修改hadoop配置文件
conf/core-site.xml:
<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>
conf/hdfs-site.xml:
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>
conf/mapred-site.xml:
<configuration>
<property>
<name>mapred.job.tracker</name>
<value>localhost:9001</value>
</property>
</configuration>
1.10修改/etc/hosts配置文件
把文件中的127.0.0.1 替换成本机的实际IP。
1.11、启动/停止hadoop
1.1.1格式化namenode。$ bin/hadoop namenode -format
1.1.2启动hadoop。$ bin/start-all.sh
可以通过浏览器查看NameNode - http://localhost:50070/ ,和
JobTracker - http://localhost:50030/
1.1.3停止hadoop。$bin/stop-all.sh
2.安装hbase伪分布式
2.1解压缩上面下载的hbase-latest.tar.gz
$tar -zxvf hbase-latest.tar.gz. $mv hbase-0.90.4-cdh3u2 hbase.
$cd hbase.
2.2修改hbase-env.sh
export JAVA_HOME=/usr/lib/jvm/java-6-sun。(自己的jdk安装路径)
export HBASE_CLASSPATH=/home/hadoop/hadoop/conf
export HBASE_MANAGES_ZK=true
2.3修改hbase-site.sh
<configuration>
<property>
<name>hbase.cluster.distributed</name>
<value>true</value>
</property>
<property>
<name>hbase.rootdir</name>
<value>hdfs://localhost:9000/hbase(此处要和前面配置的hadoop路径一致)</value>
</property>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>
2.4 修改hadoop-env.sh
export HADOOP_CLASSPATH=$HADOOP_CLASSPATH:/home/hadoop/hbase/lib/zookeeper-3.3.3-cdh3u2.jar: /home/hadoop/hbase/hbase-0.90.4-cdh3u2.jar:/home/hadoop/hadoop/hadoop-hbase-streaming.jar
2.4启动/关闭HBase
2.4.1.启动hbase $bin/start-hbase.sh
2.4.2执行$hbase shell命令,进入hbase控制台,执行控制台命令操作hbase。
2.4.3关闭hbase $bin/stop-hbase.sh
相关推荐
这个过程涉及了虚拟化技术、分布式系统、Hadoop和HBase的安装配置、远程调试等多个环节,每个环节都需要细心操作,确保所有配置正确无误,才能实现Windows7下通过Eclipse对Fedora虚拟机中Hadoop+hBase伪分布式的有效...
Hbase是基于Hadoop的分布式NoSQL数据库,提供了高效的数据存储和检索能力。Spark是基于内存的数据处理引擎,能够快速处理大规模数据。Hive是基于Hadoop的数据仓库工具,提供了高效的数据处理和分析能力。本文档旨在...
基于hadoop+hbase+springboot实现分布式网盘系统源码+数据集+详细文档(高分毕业设计).zip基于hadoop+hbase+springboot实现分布式网盘系统源码+数据集+详细文档(高分毕业设计).zip基于hadoop+hbase+springboot...
接下来是HBase,一个基于Hadoop的分布式数据库,适用于半结构化数据的存储。HBase2.1.0提供了更好的性能和稳定性。配置HBase集群需要: 1. 设置Hadoop依赖:在`hbase-site.xml`中指定Hadoop的配置目录。 2. 配置...
jdk1.8.0_131、apache-zookeeper-3.8.0、hadoop-3.3.2、hbase-2.4.12 mysql5.7.38、mysql jdbc驱动mysql-connector-java-8.0.8-dmr-bin.jar、 apache-hive-3.1.3 2.本文软件均安装在自建的目录/export/server/下 ...
Hadoop和HBase是两种广泛应用于分布式存储架构的技术,本文将深入探讨Hadoop+HBase教程,教你如何搭建这种架构。 首先,Hadoop是一个由Apache软件基金会支持的开源分布式存储与计算框架,其发展起源于Apache Lucene...
- 在Hadoop集群运行的基础上安装HBase,确保Hadoop的相关环境变量被HBase使用。 - 配置HBase的`hbase-site.xml`以指定Zookeeper地址和集群模式。 - 启动HBase服务,包括Master和RegionServer。 3. **Spark**:...
在构建分布式网盘系统时,通常会涉及到多个技术栈,如大数据处理框架Hadoop、分布式数据库HBase以及微服务开发框架Spring Boot。本项目“基于hadoop+hbase+springboot实现分布式网盘系统”旨在利用这些技术搭建一个...
HBase是一个分布式的、面向列的开源数据库,运行在Hadoop之上,适合存储半结构化数据。安装HBase时,需要考虑集群的Zookeeper配置,因为Zookeeper用于协调HBase的各个组件。 Oozie是Hadoop的工作流调度器,用于管理...
本文档旨在指导用户如何在单节点上安装并配置Hadoop与Hbase,从而实现数据的分布式存储和处理。通过本教程的学习,读者将能够理解并掌握Hadoop与Hbase的基本操作流程。 #### 二、运行环境要求 ##### 2.1 支持的平台...
2. HBase:HBase是一个基于Hadoop的分布式数据库,用于存储和处理大规模数据。 3. ZooKeeper:ZooKeeper是一个分布式协调服务,用于管理Hadoop和HBase集群。 二、机器集群结构分布 在本文中,我们将使用8台曙光...
【描述】:在本文中,我们将探讨如何在两台云主机(实际环境可能需要三台或更多)上安装Hadoop、HBase、Sqoop2、Phoenix以及Kerberos的详细过程,涵盖从伪分布式模式到Kerberos安全认证的完整步骤。 【标签】:...
- **Hbase部署:** 在Hadoop集群的基础上安装Hbase,并配置Master节点和RegionServer。 - **数据迁移与同步:** 将现有数据迁移到HDFS中,并在Hbase中建立相应的表结构。 - **系统优化:** 根据业务需求调整HDFS...
安装HBase需要下载hbase-0.96.2-hadoop2-bin.tar.gz安装包,然后解压缩并配置HBase。 集群环境搭建 搭建Hadoop2.2+Zookeeper3.4.5+HBase0.96集群环境需要完成以下步骤: 1. 安装和配置Hadoop2.2 2. 安装和配置...
标题 "Hadoop+HBase+Java API" 涉及到三个主要的开源技术:Hadoop、HBase以及Java API,这些都是大数据处理和存储领域的关键组件。以下是对这些技术及其结合使用的详细介绍: **Hadoop** 是一个分布式计算框架,由...
为了解决这一问题,研究人员提出了基于Hadoop和HBase的分布式索引集群方案。这一方案可以提高信息检索效率,并通过分布式计算框架对索引进行高效维护。 Hadoop是一个由Apache基金会开发的分布式系统基础架构,它由...
**HBase** 是基于Hadoop的分布式列式数据库,它提供实时读写能力,适用于半结构化或非结构化的海量数据存储。HBase的数据模型类似于Google的Bigtable,支持稀疏存储,能够快速查询大规模数据。 **Hive** 是一个基于...