1 查看节点状态链接:
查看hmaster节点: http://hadoop3:60010/ hadoop3是我集群主节点名称
查看hregion节点: http://hadoop3:60030/ 下图可以进入看到存储节点各个属性数据
2 hbase查看 zk状态, 集群状态:
查看zookeeper状态:hbase>zk_dump eg: hbase(main):002:0> status "summary" 1 servers, 0 dead, 6.0000 average load hbase(main):003:0> status "simple" 1 live servers hadoop3:60020 1457256379217 requestsPerSecond=0.0, numberOfOnlineRegions=6, usedHeapMB=18, maxHeapMB=991, numberOfStores=9, numberOfStorefiles=9, storefileUncompressedSizeMB=0, storefileSizeMB=0, memstoreSizeMB=0, storefileIndexSizeMB=0, readRequestsCount=63, writeRequestsCount=5, rootIndexSizeKB=1, totalStaticIndexSizeKB=0, totalStaticBloomSizeKB=0, totalCompactingKVs=0, currentCompactedKVs=0, compactionProgressPct=NaN, coprocessors=[] 0 dead servers Aggregate load: 0, regions: 6 .........
查看集群状态:
查看集群状态: hbase>status "summary" ....... library for your platform... using builtin-java classes where applicable 1 servers, 0 dead, 6.0000 average load hbase>status "simple" 简要 hbase>status "detailed" 详细
检查不一致性
#hbase hbck -details linux命令行下执行,暂时不知道这个命令的用法
3 使用hbase shell管理集群
a) flush 了解: 并未实践过
将区域的数据写入磁盘 flush ' waln_log' 将内存数据写到storefile flush ' waln_log,1429239562047.14d5384d50968c26ec54d7d6e3ac10fc. ' 备注:如果发现regionserver的内存使用过大,造成该机的 regionserver很多线程block,可以执行一下flush操作,这个操作会造成hbase的storefile数量剧增,应尽量避免这个操 作,还有一种情况,在hbase进行迁移的时候,如果选择拷贝文件方式,可以先停写入,然后flush所有表,拷贝文件。
b) 查看hlog:
hbase hlog 在hdfs的位置:
进入hdfs默认路径: /hbase/WALs/下自然会看到hbase的servername,再点进去就可以看到hlog,如下图:
linux下执行命令,有可能因为hlog里面么有数据而看不到。
#hbase hlog /hbase/WALs/hadoop3,60020,1457256379217-splitting/hadoop3%2C60020%2C1457256379217.1457259990549
查看hfile:
a) hbase表所在hdfs目录位置如下:
b) hbase 表列族个数多少对应多少个hfile文件个数:
c) 查看hfile文件格式命令:
[root@hadoop3 ~]# hbase hfile -s -f /hbase/data/default/wlan/59a55e8840713dbaf8497f3a495d5596/cf/75a8b7ff0c68400088a80dd4c1e19b71
查看 hfile里面的内容 ,里面是二进制因此查看结果是乱码:
hdfs dfs -cat /hbase/data/default/wlan/59a55e8840713dbaf8497f3a495d5596/cf/75a8b7ff0c68400088a80dd4c1e19b71
4 hbase合并:
合并 ---> http://book.51cto.com/art/201312/420269.htm
1) 关闭自动合并: hbase-site.xml <property> <name>hbase.hregion.majorcompaction</name> <value>0</value> </property> 2)调整区域合并:分割过多的区域也会影响性能 <property> <name>hbase.hregion.max.filesize</name> <value>10734182400</value> 这里设置的是100G,不知道的情况下使用默认值,或者根据业务和你集群的大小设置 </property>
执行合并做法: 还没实践:
区域合并 compact ' waln_log' 指定表主合并 major_compact 'waln_log',1429239562047.14d5384d50968c26ec54d7d6e3ac10fc. 注意:选择一个晚上用户少的时间窗口手工major_compact,如果hbase更新不是太频繁,可以一个星期对所有表做一次 major_compact,这个可以在做完一次major_compact后,观看所有的storefile数量,如果storefile数量增加到 major_compact后的storefile的近二倍时,可以对所有表做一次major_compact,时间比较长,操作尽量避免高锋期
5 hbase负载均衡:
启用负载均衡 balance_switch true 查看集群负载均衡 balancer 备注:region在regionserver上的分布不均,这个时候需要手工的开启balance
相关推荐
HBase是一个开源、面向列的、可伸缩的分布式存储系统,它基于Google的Bigtable模型构建,用于存储...随着对HBase集群部署知识的掌握,可以使运维人员更加高效地管理和维护HBase集群,保证数据存储的高性能和高可靠性。
- **集群管理**:确保集群中服务的高可用性,例如通过选举机制确定当前活动的NameNode或HBase Master。 - **状态同步**:在集群中保持各个节点之间的状态同步,尤其是在故障转移场景中。 - **配置管理**:存储...
启动HBase集群,HBase集群将使用ZooKeeper集群进行协调管理。 #### 4.5 查看服务 启动HBase集群后,可以使用HBase的shell工具来查看服务的状态。 通过上述步骤,我们已经成功搭建了HBase集群环境。该环境将提供高...
在本文中,我们将深入探讨如何搭建一个Zookeeper和HBase集群,以及在过程中可能遇到的常见问题和解决方案。Zookeeper和HBase都是大数据处理领域的关键组件,Zookeeper作为一个分布式协调服务,而HBase是一个基于...
3. ZooKeeper:ZooKeeper是一个分布式协调服务,用于管理Hadoop和HBase集群。 二、机器集群结构分布 在本文中,我们将使用8台曙光服务器搭建集群,每台服务器的IP地址和主机名如下: | 主机名 | IP地址 | 安装的...
### HBase集群在月光宝盒项目中的应用与优化经验 #### 项目背景与目标 月光宝盒项目,作为阿里巴巴集团内部一个重要的数据分析平台,致力于提供全面的流量跟踪、实时与离线效果计算服务。该项目的核心目标是在“双...
6. **HBase集群管理**: 在这部分,会学习到如何通过自动化脚本管理和操作HBase集群,以及如何使用Shell进行用户权限管理,这有助于提升集群的稳定性和安全性。 7. **HBase编程开发**: 最后,实验手册涵盖了使用...
总结起来,"Hadoop Zookeeper HBase集群"是大数据处理的一种架构,通过Hadoop进行数据存储和处理,利用Zookeeper进行集群管理和协调,以及借助HBase实现大规模数据的实时查询。理解和熟练掌握这三个组件的原理和使用...
《HBase集群搭建详解》 HBase,作为Apache的一个分布式列式存储系统,是构建大规模大数据处理的关键组件。...理解这些步骤对于管理和维护HBase集群至关重要,也是大数据环境下实现高效数据存储与查询的基础。
* HMaster:负责管理 HBase 集群的节点,处理客户端的请求,并将数据分配给 RegionServer。 * RegionServer:负责存储和处理数据,处理客户端的读写请求。 * ZooKeeper:负责维护 HBase 集群的元数据,例如节点的...
### HBase集群搭建详解 #### 一、概述 HBase是一个分布式的、面向列的开源数据库,基于Google的Bigtable模型构建。它适用于实时数据处理,支持海量数据存储。本文将详细介绍如何搭建一个HBase集群,包括单机模式到...
在搭建HBase集群时,我们需要配置HBase的主RegionServer(Master)、RegionServer实例以及与Zookeeper的连接。此外,还要设置表和列族的属性,如块大小、缓存设置等,以优化性能。 在实际搭建过程中,首先,你需要...
为了更好地管理和监控HBase集群,推荐使用HBase自带的Web UI或者第三方工具如Ambari、Cloudera Manager等。同时,定期进行健康检查,监控日志,以及对集群性能进行调优都是运维过程中的重要环节。 总之,HBase的...
提供的文档`hadoop_zookeeper_hbase集群配置.docx`应包含详细的步骤和配置示例,而`配置文件.rar`则可能包含了预设的配置模板,可以作为配置参考。在实际操作时,务必根据具体环境调整配置,确保所有节点之间的网络...
### 基于Hadoop集群搭建HBase集群详解 #### 一、引言 随着大数据技术的迅猛发展,海量数据的高效存储与处理成为企业关注的重点。Hadoop作为一款能够处理大量数据的基础框架,被广泛应用于各类场景之中。然而,在...
### HBase集群搭建详解 HBase是基于Hadoop的一个分布式、可扩展的列式存储系统,主要用于处理海量数据。为了确保系统的稳定性和高效性,在实际部署时通常会采用集群模式进行搭建。本文将从以下几个方面对HBase集群...
Hbase2.2.0集群部署需要配置环境变量、配置Hbase配置文件、启动Hbase集群、使用Hbase Shell和Hbase DDL/DML语言等步骤。通过这些步骤,我们可以成功部署Hbase2.2.0集群,并使用Hbase Shell和Hbase DDL/DML语言来管理...