基于Hbase的完全分布式集群,只不过集群的zookeeper与上次的不同,我们都知道Hbase为了简化集群部署,已经内置了zookeeper,大部分时候使用内置的zookeeper都可以非常方便的部署集群,而这一点与solr中solrcloud的集群部署非常相似,solrcloud也内置了zookeeper了,启动的时候可以由solr负责启动zookeeper,而在Hbase中,则是由Hbase负责启动zookeeper的。
其实,大多数的分布式应用框架,都离不开zookeeper这个统一协作服务,当然,我们也可以不用其内置的 zookeeper,由我们自己来安装维护独立的zookeeper集群,关于外置和内置的zookeeper也算各有利弊吧,散仙在此,就不加以评论了,下面开始进入正题,配置独立的zookeeper集群来管理Hbase。
在这之前,需要注意的是,如果使用的是外置zookeeper那么这个zookeeper版本号,建议跟Hbase里面内置的zookeeper版本保持一致,这样尽可能避免出现一些莫名其妙的错误。总结的步骤,如下图所示:
顺序 | 内容 | 一 | 配置Hbase的hbase-env.sh文件 | 二 | 配置下载的zookeeper3.4.5 | 三 | 分发zookeeper到每个节点上 |
第一步,配置hbase-env.sh内容截图如下:
第二步,配置zookeeper,修改其config目录下zoo_simple.cfg重命名为zoo.cfg,并在其data目录(自己手动创建)下,新建一个myid文件,server.x后面的x数字一直即可,修改其内容如以下截图:
- tickTime=2000
- initLimit=10
- syncLimit=5
- dataDir=/root/zookeeper/data
- clientPort=2181
- server.1=10.2.143.5:2887:3887
- server.2=10.2.143.36:2888:3888
- server.3=10.2.143.37:2889:3889
tickTime=2000 initLimit=10 syncLimit=5 dataDir=/root/zookeeper/data clientPort=2181 server.1=10.2.143.5:2887:3887 server.2=10.2.143.36:2888:3888 server.3=10.2.143.37:2889:3889
第三步,使用scp命令,进行远程拷贝zookeeper到子节点,需要注意的是,zookeeper的配置个数只能是奇数个,一般建议是3或5个比较好,当然你也可以配置更多,来保证集群的稳定性。,截图如下:
最后我们就可以关闭防火墙,来启动集群了,注意集群启动的顺序,先启动hadoop集群,然后到各个节点上启动Zookeeper,最后再启动Hbase集群,启动成功后,jps打印命令如下:
访问Hbase首页Web的截图如下:
使用Java API操作Hbase,示例如下截图:
然后,我们使用Hbase shell在服务器上验证,刚才的建表步骤是否成功,截图如下:
至此,我们已经成功完成,使用外置zookeeper与Hbase的集群。最后注意,停止集群的顺序,先关闭Hbase,然后再关闭zookeeper,最后关闭hadoop,好了,现在,你可以带着你的好奇心,去放心大胆的尝试部署了
相关推荐
HBase 完全分布式集群搭建 HBase 是一个基于 Hadoop 的分布式 Nosql 数据库,可以提供高性能、可靠的数据存储和查询服务。为了搭建一个完全分布式的 HBase 集群,我们需要了解 HBase 的架构、组件和配置。 一、...
本文档详细介绍了HBase完全分布式集群的搭建过程,包括Hadoop集群的基础构建、JDK的安装、HBase的配置以及集群的启动和验证。通过遵循这些步骤,您可以轻松地在自己的环境中部署一个功能齐全的HBase集群。希望本指南...
HBase完全分布式安装和部署指南 HBase是一种开源的、分布式的、面向列的NoSQL数据库,基于Hadoop和HDFS构建。它提供了高性能、可扩展性强、支持大规模数据存储和处理的能力。本文将详细介绍HBase的安装和部署过程,...
在本章节中,将详细介绍如何安装和配置基于Hadoop3.x的分布式集群以及如何在该集群上安装和配置HBase。 在开始之前,需要完成几个关键步骤,包括节点规划、用户环境设置、网络配置和Java环境安装。节点规划涉及对...
### 基于VM+CentOS+hadoop2.7搭建Hadoop完全分布式集群的知识点解析 #### 一、概述 本文旨在详细介绍如何使用VMware Workstation(简称VM)结合CentOS 6.5操作系统来搭建Hadoop 2.7的完全分布式集群。此文档是根据...
### 基于集群的HBase安装和配置 #### Zookeeper简介 Zookeeper作为Hadoop生态中的关键组件,主要用于提供高可用性和分布式协调服务。它能够有效地管理Hadoop集群中的各种资源和服务,例如Hadoop NameNode管理和...
在搭建Hadoop完全分布式集群时,我们需要遵循一系列步骤,确保所有组件正确配置并协同工作。以下是基于三台机器的集群安装部署过程的详细说明: 1. **所需软件及版本** - Hadoop: 1.0.4 - JDK: 1.7.0_07 - 系统:...
本文档假设读者已经具备了一个运行良好的Hadoop集群,因此我们将安装完全分布式模式下的HBase。 2. **所需资源**:确保集群中的每台机器都已经正确配置了Hadoop环境,并准备好HBase的Linux压缩包。 ##### (二)...
3.集群能正常运行的条件是集群可节点宕机数应保证有超过集群机器总数一半的机器在运行,因此从经济和实用性来说,集群的节点一般是奇数个,本文部署4台机器,其容灾能力与部署3台机器一致,即只能宕机1台
"基于HBase的大数据解决方案" HBase是一个基于分布式文件系统的NoSQL数据库,专门为大数据应用设计,具有高可扩展性、可靠性、性能强等特点。在大数据领域,HBase是一个非常重要的解决方案,广泛应用于电商、新闻、...
以下将详细介绍如何搭建一个基于Hadoop的完全分布式平台。 首先,搭建环境配置是基础。确保所有节点之间网络畅通,操作系统一般选择Linux,因为Hadoop是基于Linux设计的。安装Java运行环境,Hadoop依赖Java,版本...
本项目将探讨如何在基于5台虚拟机的环境中实现Kafka的完全分布式配置,以便构建一个高可用、高性能的消息传递平台。我们将重点关注生产者和消费者的代码实现,以及与Hadoop等大数据框架的集成。 Kafka是一个开源的...
在"压缩包子文件的文件名称列表"中,我们看到有"HBASE完全分布式安装.doc",这通常是一份详细的文档,指导用户如何在分布式环境中安装和配置HBase。文档可能涵盖了以下内容: 1. **环境准备**:包括Java环境、...
HBase有三种运行模式:单机模式、伪分布式模式和完全分布式模式。这里主要讨论前两种模式,适用于学习和初步部署。 1. 对于单机模式,HBase会运行在本地文件系统上,无需特别配置,只需确保HBase环境变量和JDK已...
本文将介绍基于Hadoop的数据分析系统设计,涵盖Hadoop完全分布式集群的搭建过程和基于Hive的数据分析平台的设计与实现。 Hadoop概述 Hadoop是一个开源的分布式文件系统和并行计算编程模型,广泛应用于大数据处理和...
`phoenix-hbase-2.2-5.1.2-bin.tar.gz`这个压缩包包含了Phoenix 2.2版本与HBase 5.1.2版本的二进制文件,用户可以解压后在本地或集群环境中安装和运行。安装步骤通常包括配置环境变量、创建HBase和Phoenix的目录结构...
- 面向列:HBase是基于列族的数据库,这意味着数据存储和查询都是按列族进行的。 - 分布式:HBase是为大规模数据存储而设计的分布式数据库。 - NoSQL数据库:HBase属于NoSQL数据库的一种,它不使用传统的SQL语言...
1. Hadoop:在完全分布式环境下,Hadoop会模拟真实的生产环境,包括多个NameNode、DataNode、ResourceManager和NodeManager节点,确保高可用性和负载均衡。 2. Zookeeper:Zookeeper是一个分布式协调服务,用于管理...