`
cp1985chenpeng
  • 浏览: 44121 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

hadoop+hbase伪分布式安装

阅读更多

         

 

                         安装hadoop+hbase伪分布式
1.安装hadoop伪分布式
    1.1安装jdk-6u24-linux-x64-rpm.bin,需要说明的是,尽可能的使用64位的JDK版本。
    1.2进入到CDH3的官方下载网址http://archive.cloudera.com/cdh/3/下载最新hadoop和hbase的release版本hadoop-latest.tar.gz 和hbase-latest.tar.gz 。
    1.3新建系统hadoop用户。命令:#adduser hadoop;#passwd hadoop,回车输入hadoop。
    1.4用hadoop用户登录服务器。
    1.5在/home/hadoop/目录下建立.ssh目录,修改/home/hadoop/.ssh/authorized_keys文件的权限为:-rw-r–r–,设置命令:$ cd /home/hadoop/.ssh,$ chmod 644 authorized_keys。
    1.6通过ssh无需密码登录本机。ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa,直接回车,完成后会在~/.ssh/生成两个文件:id_dsa 和id_dsa.pub。这两个是成对出现,类似钥匙和锁。再执行命令$ cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys。此时通过命令$ssh localhost测试。
    1.7解压缩hadoop.$tar -zxvf hadoop-latest.tar.gz。$mv hadoop-0.20.2-cdh3u2 hadoop.
    1.8修改~/hadoop/hadoop/conf/hadoop-env.sh文件的环境变量
    $cd hadoop/conf/,$vim hadoop-env.sh添加环境变量export JAVA_HOME=/usr/java/jdk1.6.0_20(自己机器上的jdk安装路径)
    1.9修改hadoop配置文件
    conf/core-site.xml:
    <configuration>
             <property>
                 <name>fs.default.name</name>
                 <value>hdfs://localhost:9000</value>
             </property>
    </configuration>
    conf/hdfs-site.xml:
    <configuration>
        <property>
                 <name>dfs.replication</name>
                 <value>1</value>
             </property>
    </configuration>
    conf/mapred-site.xml:
    <configuration>
             <property>
                 <name>mapred.job.tracker</name>
                 <value>localhost:9001</value>
             </property>
    </configuration>
    1.10修改/etc/hosts配置文件
    把文件中的127.0.0.1 替换成本机的实际IP。
    1.11、启动/停止hadoop
        1.1.1格式化namenode。$ bin/hadoop namenode -format
        1.1.2启动hadoop。$ bin/start-all.sh
            可以通过浏览器查看NameNode - http://localhost:50070/ ,和
            JobTracker - http://localhost:50030/
        1.1.3停止hadoop。$bin/stop-all.sh
2.安装hbase伪分布式
    2.1解压缩上面下载的hbase-latest.tar.gz
    $tar -zxvf hbase-latest.tar.gz. $mv hbase-0.90.4-cdh3u2 hbase.
    $cd hbase.
    2.2修改hbase-env.sh
    export JAVA_HOME=/usr/lib/jvm/java-6-sun。(自己的jdk安装路径)
    export HBASE_CLASSPATH=/home/hadoop/hadoop/conf
    export HBASE_MANAGES_ZK=true


    2.3修改hbase-site.sh
    <configuration>
        <property>
            <name>hbase.cluster.distributed</name>
            <value>true</value>
        </property>
        <property>
                <name>hbase.rootdir</name>
                <value>hdfs://localhost:9000/hbase(此处要和前面配置的hadoop路径一致)</value>
          </property>
          <property>
                <name>dfs.replication</name>
                <value>1</value>
          </property>
    </configuration>

    2.4 修改hadoop-env.sh

        export HADOOP_CLASSPATH=$HADOOP_CLASSPATH:/home/hadoop/hbase/lib/zookeeper-3.3.3-cdh3u2.jar:      /home/hadoop/hbase/hbase-0.90.4-cdh3u2.jar:/home/hadoop/hadoop/hadoop-hbase-streaming.jar
    2.4启动/关闭HBase
        2.4.1.启动hbase $bin/start-hbase.sh
        2.4.2执行$hbase shell命令,进入hbase控制台,执行控制台命令操作hbase。
        2.4.3关闭hbase $bin/stop-hbase.sh

分享到:
评论

相关推荐

    Windows7下eclipse调试Fedora虚拟机的hadoop+hbase伪分布式

    这个过程涉及了虚拟化技术、分布式系统、Hadoop和HBase的安装配置、远程调试等多个环节,每个环节都需要细心操作,确保所有配置正确无误,才能实现Windows7下通过Eclipse对Fedora虚拟机中Hadoop+hBase伪分布式的有效...

    Hadoop+Hbase+Spark+Hive搭建

    Hbase是基于Hadoop的分布式NoSQL数据库,提供了高效的数据存储和检索能力。Spark是基于内存的数据处理引擎,能够快速处理大规模数据。Hive是基于Hadoop的数据仓库工具,提供了高效的数据处理和分析能力。本文档旨在...

    基于hadoop+hbase+springboot实现分布式网盘系统源码+数据集+详细文档(高分毕业设计).zip

    基于hadoop+hbase+springboot实现分布式网盘系统源码+数据集+详细文档(高分毕业设计).zip基于hadoop+hbase+springboot实现分布式网盘系统源码+数据集+详细文档(高分毕业设计).zip基于hadoop+hbase+springboot...

    hadoop+hbase+zookeeper集群配置流程及文件

    接下来是HBase,一个基于Hadoop的分布式数据库,适用于半结构化数据的存储。HBase2.1.0提供了更好的性能和稳定性。配置HBase集群需要: 1. 设置Hadoop依赖:在`hbase-site.xml`中指定Hadoop的配置目录。 2. 配置...

    zookeeper+hadoop+hbase+hive(集成hbase)安装部署教程(超详细).docx

    jdk1.8.0_131、apache-zookeeper-3.8.0、hadoop-3.3.2、hbase-2.4.12 mysql5.7.38、mysql jdbc驱动mysql-connector-java-8.0.8-dmr-bin.jar、 apache-hive-3.1.3 2.本文软件均安装在自建的目录/export/server/下 ...

    hadoop+HBase教程

    Hadoop和HBase是两种广泛应用于分布式存储架构的技术,本文将深入探讨Hadoop+HBase教程,教你如何搭建这种架构。 首先,Hadoop是一个由Apache软件基金会支持的开源分布式存储与计算框架,其发展起源于Apache Lucene...

    大数据Hadoop+HBase+Spark+Hive集群搭建教程(七月在线)1

    - 在Hadoop集群运行的基础上安装HBase,确保Hadoop的相关环境变量被HBase使用。 - 配置HBase的`hbase-site.xml`以指定Zookeeper地址和集群模式。 - 启动HBase服务,包括Master和RegionServer。 3. **Spark**:...

    基于hadoop+hbase+springboot实现分布式网盘系统.zip

    在构建分布式网盘系统时,通常会涉及到多个技术栈,如大数据处理框架Hadoop、分布式数据库HBase以及微服务开发框架Spring Boot。本项目“基于hadoop+hbase+springboot实现分布式网盘系统”旨在利用这些技术搭建一个...

    Hadoop+Spark+Hive+HBase+Oozie+Kafka+Flume+Flink+ES+Redash等详细安装部署

    HBase是一个分布式的、面向列的开源数据库,运行在Hadoop之上,适合存储半结构化数据。安装HBase时,需要考虑集群的Zookeeper配置,因为Zookeeper用于协调HBase的各个组件。 Oozie是Hadoop的工作流调度器,用于管理...

    Hadoop+Hbase技术使用文档(整理过的)

    本文档旨在指导用户如何在单节点上安装并配置Hadoop与Hbase,从而实现数据的分布式存储和处理。通过本教程的学习,读者将能够理解并掌握Hadoop与Hbase的基本操作流程。 #### 二、运行环境要求 ##### 2.1 支持的平台...

    hadoop+hbase集群搭建 详细手册

    2. HBase:HBase是一个基于Hadoop的分布式数据库,用于存储和处理大规模数据。 3. ZooKeeper:ZooKeeper是一个分布式协调服务,用于管理Hadoop和HBase集群。 二、机器集群结构分布 在本文中,我们将使用8台曙光...

    安装笔记:hadoop+hbase+sqoop2+phoenix+kerberos

    【描述】:在本文中,我们将探讨如何在两台云主机(实际环境可能需要三台或更多)上安装Hadoop、HBase、Sqoop2、Phoenix以及Kerberos的详细过程,涵盖从伪分布式模式到Kerberos安全认证的完整步骤。 【标签】:...

    Hadoop+Hbase搭建云存储总结

    - **Hbase部署:** 在Hadoop集群的基础上安装Hbase,并配置Master节点和RegionServer。 - **数据迁移与同步:** 将现有数据迁移到HDFS中,并在Hbase中建立相应的表结构。 - **系统优化:** 根据业务需求调整HDFS...

    Hadoop2.2+Zookeeper3.4.5+HBase0.96集群环境搭建

    安装HBase需要下载hbase-0.96.2-hadoop2-bin.tar.gz安装包,然后解压缩并配置HBase。 集群环境搭建 搭建Hadoop2.2+Zookeeper3.4.5+HBase0.96集群环境需要完成以下步骤: 1. 安装和配置Hadoop2.2 2. 安装和配置...

    Hadoop+HBase+Java API

    标题 "Hadoop+HBase+Java API" 涉及到三个主要的开源技术:Hadoop、HBase以及Java API,这些都是大数据处理和存储领域的关键组件。以下是对这些技术及其结合使用的详细介绍: **Hadoop** 是一个分布式计算框架,由...

    基于hadoop和hbase的分布式索引集群研究.pdf

    为了解决这一问题,研究人员提出了基于Hadoop和HBase的分布式索引集群方案。这一方案可以提高信息检索效率,并通过分布式计算框架对索引进行高效维护。 Hadoop是一个由Apache基金会开发的分布式系统基础架构,它由...

    HADOOP+HBASE+HIVE整合工程和文档

    **HBase** 是基于Hadoop的分布式列式数据库,它提供实时读写能力,适用于半结构化或非结构化的海量数据存储。HBase的数据模型类似于Google的Bigtable,支持稀疏存储,能够快速查询大规模数据。 **Hive** 是一个基于...

Global site tag (gtag.js) - Google Analytics