如果只增加集群的存储量,建议增加Hadoop datanode节点。
方法:
-
•停掉集群包括Hadoop和hbase,当然也可以不停掉,直接在hadoop namenode的配置文件Slave里添加新节点的host,别忘了在host文件里也要添加新添加的host名。
•执行bin/start-all.sh启动集群
•如果不手动作平衡,插入的数据将会放在新添加的节点上。以趋于平衡。
•如果手动平衡,则 start-balancer.sh和调用bin/sHadoop balancer命令相似,也可加参数 -threshold 5(threshold 是平衡阈值,默认是10%,值越低各节点越平衡,但消耗时间也更长)。 在使用start-balancer.sh时,如果在hdfs-site.xml里面没有配置dfs.balance.bandwidthPerSec,那么集群hdfs内部默认使用1M/S的速度移动数据(so slowly...),我们可以通过在hdfs-site.xml里面配置dfs.balance.bandwidthPerSec来加快balance的速度。 最开始我们配置的是20m/S ,然后结果是导致job运行变得不稳定,出现一些意外的长map单元,某些reduce时间处理变长(整个集群负载满满的情况下,外加20m/s的balance),在前天的中国hadoop年会上听淘宝调整的为10m/s,需要调整后实验,看看情况如何。 另外再修改dfs.balance.bandwidthPerSec参数后,需要在namenode上运行stop-dfs.sh start-dfs.sh重启hdfs生效。我们可以通过stop-balancer.sh停掉平衡任务。作完平衡后,启动hbase,正常。 果cluster设置的副本数不为3(默认),需要先运行命令hadoop fs –setrep [-R] <path>
进行设置一个文件的副本系数。如果默认为3则不必。如果执行完平衡以后才改变副本数,会将新加入到新节点上的所有数据删除。
5.dfs.replication设置的副本系数只在文件系统写入时有效,并不影响在新添加节点时,平衡时的副本数
由于还有hbase数据库,因此,在运行完平衡以后,将hbase下的.META.文件删除(防止出错),启动hbase,执行hbase org.jruby.Main add_table /表名 来进行hbase表恢复
验证步骤:1namenode+3datanode+1master+2regionserver+3zookeeper
2、删除一个regionServer,
在需要删除的RegionServer上执行以下命令:$ ./bin/hbase-daemon.sh stop regionserver RegionServer将会关掉所有的region,然后此节点将会在Zookeeper消失。Master注意到了此RegionServer 掉了,它将会重新分配掉的这些Region。在停掉一个节点的时候,注意要关闭Load Balancer,因为Load Balancer可能要和Master的恢复机制争夺停掉的RegionServer。
hbase(main):001:0> balance_switch false
true
0 row(s) in 0.3590 seconds
hbase(main):002:0> balance_switch true
false
0 row(s) in 0.3590 seconds
$ ./bin/graceful_stop.sh
Usage: graceful_stop.sh [--config &conf-dir>] [--restart] [--reload] \
[--thrift] [--rest] &hostname>
thrift If we should stop/start thrift before/after the hbase stop/start
rest If we should stop/start rest before/after the hbase stop/start
restart If we should restart after graceful stop
reload Move offloaded regions back on to the stopped server
debug Move offloaded regions back on to the stopped server
hostname Hostname of server we are to stop
本篇文章来源于 Linux公社网站(www.linuxidc.com) 原文链接:http://www.linuxidc.com/Linux/2012-07/65909.htm
分享到:
相关推荐
通过监控HBase集群,可以实时了解系统的性能指标,从而提高系统的可维护性和可靠性。 HBase如何输出指标: HBase输出指标的框架是基于Hadoop的指标框架(metrics framework),该框架提供了一个统一的方式来输出...
HBase是一个开源、面向列的、可伸缩的分布式存储系统,它基于Google的Bigtable模型构建,用于存储...随着对HBase集群部署知识的掌握,可以使运维人员更加高效地管理和维护HBase集群,保证数据存储的高性能和高可靠性。
### 基于集群的HBase安装和配置 #### Zookeeper简介 Zookeeper作为Hadoop生态中的关键组件,主要用于...通过上述步骤,可以成功地在已有Hadoop集群的基础上搭建起HBase集群,实现大数据环境下的高效数据存储与管理。
《HBase集群搭建详解》 HBase,作为Apache的一个分布式列式存储系统,是构建大规模大数据处理的关键组件。...理解这些步骤对于管理和维护HBase集群至关重要,也是大数据环境下实现高效数据存储与查询的基础。
标题 "Hadoop Zookeeper HBase集群" 涉及到的是大数据处理领域中的三个关键组件:Hadoop、Zookeeper和HBase。这三个组件在构建分布式系统中起着至关重要的作用。 首先,Hadoop是Apache软件基金会开发的一个开源框架...
* ZooKeeper:负责维护 HBase 集群的元数据,例如节点的状态、Region 信息等。 * HRegion:HBase 的基本存储单元,包含多个 Store,Store 中包含多个 MemStore 和 StoreFile。 二、HBase 组件 HBase 的组件包括: ...
为了更好地管理和监控HBase集群,推荐使用HBase自带的Web UI或者第三方工具如Ambari、Cloudera Manager等。同时,定期进行健康检查,监控日志,以及对集群性能进行调优都是运维过程中的重要环节。 总之,HBase的...
提供的文档`hadoop_zookeeper_hbase集群配置.docx`应包含详细的步骤和配置示例,而`配置文件.rar`则可能包含了预设的配置模板,可以作为配置参考。在实际操作时,务必根据具体环境调整配置,确保所有节点之间的网络...
ZooKeeper 在 HBase 中用于维护集群状态信息,保证集群的稳定运行。 HBase 的列式存储结构为处理大数据提供了出色的数据压缩比和读写性能。HBase 的数据模型由行、列族和时间戳组成。数据在 HBase 中是按行存储的,...
### Hadoop+Zookeeper+Hbase集群搭建知识点详解 #### 一、安装环境要求 **1.1 HBase与JDK兼容性** - **Apache HBase** 的版本选择需考虑其与 Java Development Kit (JDK) 的兼容性。具体而言: - Apache HBase ...
以上步骤涵盖了从环境准备、软件安装到集群配置的全部过程,遵循这些指导可以成功搭建一个完整的Hadoop+HBase集群。在实际操作过程中,可能还会遇到各种问题,比如网络配置、安全策略等,需要根据具体情况灵活调整。...
性能优化是提升HBase集群效率的关键,主要涉及以下几个方面: 1. **硬件优化**:增加内存、使用SSD硬盘、提高网络带宽,这些都可以显著提升HBase的性能。 2. **表设计**:合理设计RowKey,避免热点问题;预分区表...
1. 使用HBase自带的JMX监控工具或第三方监控工具(如Ambari、Grafana)监控HBase集群的性能指标。 2. 定期进行健康检查,排查可能存在的问题,如Region不均、内存溢出等。 3. 对HBase进行定期备份,以防数据丢失。...
作为一名运维工程师,需要对Hbase进行日常维护和监控,以确保Hbase集群的稳定运行。本文档将为您提供Hbase运维手册,涵盖region情况检查、Region数量和大小调整、手动merge region和手动分配region等内容。 1. ...
2. **HBase集群规划**: - **Zookeeper Ensemble**: 使用Hadoop集群中的部分节点作为Zookeeper集群(这里使用Hadoop集群的所有节点)。 - **Regionserver**: 分布在3台Datanode节点上(IP地址:192.168.12.62, 192...
- `shutdown`命令会完全停止HBase集群,需要重新启动才能恢复服务;而`exit`仅退出Shell,不影响集群运行。 ### HBase Shell 命令示例 - **创建表**:`create 'tablename', {NAME => 'columnfamilyname'}` - **...
10. **扩展性**:随着数据的增长,可以通过增加RegionServer节点来横向扩展HBase集群,提高处理能力和存储容量。 11. **优化策略**:包括合理设置Region大小、预分区表、选择合适的Column Family、启用BlockCache等...
运维管理章节介绍了HBase的工具和实用程序,帮助管理员更好地维护和管理HBase集群。 ### 创建HBase 创建HBase的步骤涉及了搭建和部署HBase集群的基本流程,包括了需要的前期条件、配置细节以及如何添加数据。 综...