`
bupt04406
  • 浏览: 348844 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

hbase hbck

 
阅读更多

https://issues.apache.org/jira/browse/HBASE-5128 

https://github.com/jmhsieh/hbase-repair-scripts 

 

HBASE-5128之前版本的HBCK:

检查master、regionserver内存中的状态以及hdfs上面数据的状态之间的一致性 

 

(1)获取所有region的信息(regioninfo):通过zk获得-ROOT-地址,通过扫描-ROOT-表和.META.表,就获得了所有region的信息 

(2)遍历所有的region,获得所有表信息 

(3)通过ClusterStatus获得regionserver信息 

(4)多线程连接每个regionserver,获得这个regionserver上面online的region信息。记录下region是在那个regionserver上面 

(5)遍历hbase.rootdir,获得所有的table,多线程遍历各个table的目录,记录下region是在那个目录下面 

(6)通过zk获得所有disabled的tables 

(7)检查一致性,检查每一个region 

      正常的状态是: 

      【1】在META表中,hdfs上面有,表不是disabled的, region在某个regionserver的online region集合中,META表中记录的server信息和open了这个region的regionserver一致,并且没有被多个regionserver同时服务 

      【2】在META表中,region是split完的Parent region,没有被某个regionserver服务 

      【3】在META表中,表是disabled的,并且没有被某个regionserver服务 

      异常的状态是: 

     (7.1)如果一个region即不在META表中,又不在hdfs上面,但是在regionserver的online region集合中,那么输出NOT_IN_META_HDFS错误信息 

     (7.2)如果一个region不在META表中,又不在regionserver的online region集合中,但是在hdfs上面,输出NOT_IN_META_OR_DEPLOYED错误信息 

     (7.3)如果一个region不在META表中,但是在hdfs上面有,并且在regionserver的online region集合中,那么输出NOT_IN_META错误信息 

     (7.4)如果一个region在META表中,但是在hdfs上面没有,并且也不在regionserver的online region集合中,那么输出NOT_IN_HDFS_OR_DEPLOYED错误信息 

     (7.5)如果一个region在META表中,并且在regionserver的online region集合中有,但是在hdfs上面没有,那么输出NOT_IN_HDFS错误信息 

     (7.6)如果一个region在META表中,在hdfs上面也有,但是不再online region集合中,并且这个region所在的table不是Disabled的,那么输出NOT_DEPLOYED错误信息。 可以修复 

     (7.7)如果一个region在META表中,在hdfs上面有,在online region集合中,如果这个region所在的table是Disabled的,那么输出SHOULD_NOT_BE_DEPLOYED错误信息。 

     (7.8)如果一个region在META表中,在hdfs上面有,但是被在多个regionserver的online region集合中,那么输出MULTI_DEPLOYED错误信息。可以修复 

     (7.9)如果一个region在META表中,在hdfs上面也有,也应该被服务,但是META表中记录的regionserver和实际所在的regionserver不相符,那么输出SERVER_DOES_NOT_MATCH_META错误信息。可以修复 

     (7.10)如果是其他情况,输出UNKNOWN 

(8)检查完整性,以table为单位,遍历每个table 

     (8.1)table的第一个region的startKey必须是EMPTY_BYTE_ARRAY,否则输出FIRST_REGION_STARTKEY_NOT_EMPTY信息 

     (8.2)如果这个table有(startKey=endKey)的region,输出DEGENERATE_REGION信息 

     (8.3)如果两个region的区间有重叠,startKey相同输出DUPE_STARTKEYS信息,不相同输出OVERLAP_IN_REGION_CHAIN信息 

     (8.4)如果某个区间没有region,输出HOLE_IN_REGION_CHAIN信息(空洞) 

(9)打印table的总结信息 

 

 

hbck加上 -fix 可以自己修复下面三种情况: 

(7.6)如果一个region在META表中,在hdfs上面也有,但是不再online region集合中,并且这个region所在的table不是Disabled的,那么输出NOT_DEPLOYED错误信息。 

(7.8)如果一个region在META表中,在hdfs上面有,但是被在多个regionserver的online region集合中,那么输出MULTI_DEPLOYED错误信息。 

(7.9)如果一个region在META表中,在hdfs上面也有,也应该被服务,但是META表中记录的regionserver和实际所在的regionserver不相符,那么输出SERVER_DOES_NOT_MATCH_META错误信息。

 

原先的hbck检测region的一致性和table的完整性,但是需要管理员自己修复,修复后,如果一致性和完整性没有问题,通过OfflineMetaRepair来构造新的META表 

 

HBASE-5128 中的hbck能够检测region的一致性和table的完整性,并且可以修复完整性和一致性相关的问题 

所以有了新版的hbck,这个github上面的脚本用途不是特别大 

 

新版的hbck

 

新版本的 hbck 可以修复各种错误,修复选项是: 

(1)-fix,向下兼容用,被-fixAssignments替代 

(2)-fixAssignments,用于修复region assignments错误 

(3)-fixMeta,用于修复meta表的问题,前提是HDFS上面的region info信息有并且正确。 

(4)-fixHdfsHoles,修复region holes(空洞,某个区间没有region)问题 

(5)-fixHdfsOrphans,修复Orphan region(hdfs上面没有.regioninfo的region) 

(6)-fixHdfsOverlaps,修复region overlaps(区间重叠)问题 

(7)-fixVersionFile,修复缺失hbase.version文件的问题 

(8)-maxMerge <n> (n默认是5),当region有重叠是,需要合并region,一次合并的region数最大不超过这个值。 

(9)-sidelineBigOverlaps ,当修复region overlaps问题时,允许跟其他region重叠次数最多的一些region不参与(修复后,可以把没有参与的数据通过bulk load加载到相应的region) 

(10)-maxOverlapsToSideline <n> (n默认是2),当修复region overlaps问题时,一组里最多允许多少个region不参与 

由于选项较多,所以有两个简写的选项 

(11) -repair,相当于-fixAssignments -fixMeta -fixHdfsHoles -fixHdfsOrphans -fixHdfsOverlaps -fixVersionFile -sidelineBigOverlaps 

(12)-repairHoles,相当于-fixAssignments -fixMeta -fixHdfsHoles -fixHdfsOrphans 

 

 

 

新版本的 hbck 

(1)缺失hbase.version文件 

 加上选项 -fixVersionFile 解决 

(2)如果一个region即不在META表中,又不在hdfs上面,但是在regionserver的online region集合中 

 加上选项 -fixAssignments 解决 

(3)如果一个region在META表中,并且在regionserver的online region集合中,但是在hdfs上面没有 

 加上选项 -fixAssignments -fixMeta 解决,( -fixAssignments告诉regionserver close region),( -fixMeta删除META表中region的记录) 

(4)如果一个region在META表中没有记录,没有被regionserver服务,但是在hdfs上面有 

加上选项 -fixMeta -fixAssignments 解决,( -fixAssignments 用于assign region),( -fixMeta用于在META表中添加region的记录) 

(5)如果一个region在META表中没有记录,在hdfs上面有,被regionserver服务了 

加上选项 -fixMeta 解决,在META表中添加这个region的记录,先undeploy region,后assign 

(6)如果一个region在META表中有记录,但是在hdfs上面没有,并且没有被regionserver服务 

加上选项 -fixMeta 解决,删除META表中的记录 

(7)如果一个region在META表中有记录,在hdfs上面也有,table不是disabled的,但是这个region没有被服务 

加上选项 -fixAssignments 解决,assign这个region 

(8)如果一个region在META表中有记录,在hdfs上面也有,table是disabled的,但是这个region被某个regionserver服务了 

加上选项 -fixAssignments 解决,undeploy这个region 

(9)如果一个region在META表中有记录,在hdfs上面也有,table不是disabled的,但是这个region被多个regionserver服务了 

加上选项 -fixAssignments 解决,通知所有regionserver close region,然后assign region 

(10)如果一个region在META表中,在hdfs上面也有,也应该被服务,但是META表中记录的regionserver和实际所在的regionserver不相符 

加上选项 -fixAssignments 解决 

 

(11)region holes 

需要加上 -fixHdfsHoles ,创建一个新的空region,填补空洞,但是不assign 这个 region,也不在META表中添加这个region的相关信息 

(12)region在hdfs上面没有.regioninfo文件 

-fixHdfsOrphans 解决 

(13)region overlaps 

需要加上 -fixHdfsOverlaps 

 

 

说明: 

(1)修复region holes时,-fixHdfsHoles 选项只是创建了一个新的空region,填补上了这个区间,还需要加上-fixAssignments -fixMeta 来解决问题,( -fixAssignments 用于assign region),( -fixMeta用于在META表中添加region的记录),所以有了组合拳 -repairHoles 修复region holes,相当于-fixAssignments -fixMeta -fixHdfsHoles -fixHdfsOrphans 

(2) -fixAssignments,用于修复region没有assign、不应该assign、assign了多次的问题 

(3)-fixMeta,如果hdfs上面没有,那么从META表中删除相应的记录,如果hdfs上面有,在META表中添加上相应的记录信息 

(4)-repair 打开所有的修复选项,相当于-fixAssignments -fixMeta -fixHdfsHoles -fixHdfsOrphans -fixHdfsOverlaps -fixVersionFile -sidelineBigOverlaps 

 

新版本的hbck从(1)hdfs目录(2)META(3)RegionServer这三处获得region的Table和Region的相关信息,根据这些信息判断并repair

分享到:
评论

相关推荐

    HBase hbck 2.0 jar包下载

    该文件为hbase hbck2 jar;适用于hbase 2.x维护,hbase 1.x不适用;对于HBase跨集群HD集群迁移,当HDFS文件迁移后,使用HBCK客户端,完成HBase元数据修复。当前版本:hbase-hbck2-1.3.0.jarhbase hbck -j /opt/...

    hbase hbck2修复工具hbase-operator-tools-1.0.0.1.0.0.0-618-bin.tar.gz

    hbase hbck2修复工具hbase-operator-tools-1.0.0.1.0.0.0-618-bin.tar.gz,hbase1版本的hbck已经不支持修复命令,hbase2.1版本需要用这个新版的工具

    hbase2.x-hbck2 jar包及测试命令

    在HBase 2.x版本中,HBCK2(HBase FileSystem Check Tool 2)是一个重要的工具,用于检查和修复HBase表和Region的不一致性。HBCK2是HBase维护和故障排查的重要组成部分,尤其在处理数据丢失、Region分裂不正确或者元...

    hbase hbck2 jar

    hbase hbck2 jar; 完整打包;...使用命令:hbase hbck -j hbase-hbck2-1.3.0-SNAPSHOT.jar fixMeta,最后两个参数分别代表 hbck2 jar包路径,维护命令(hbase-hbck2-1.3.0-SNAPSHOT.jar fixMeta)

    hbase-hbck2-1.1.0-SNAPSHOT.jar

    hbase-hbck2-1.1.0-SNAPSHOT.jar

    hbase-hbck2-1.2.0-SNAPSHOT.jar

    HBCK是HBase1.x中的命令,到了HBase2.x中,HBCK命令不适用,且它的写功能(-fix)已删除; HBCK2已经被剥离出HBase成为了一个单独的项目,如果你想要使用这个工具,需要根据自己HBase的版本,编译源码。其GitHub地址...

    hbase 修复工具,hbck 编译好

    hbase 修复工具,hbck 编译好

    hbase-hbck2-1.2.0,支持hbase[2.0.3, 2.0.5,2.1.1, 2.2.0, 3.0.0]版本

    hbase 2.x以后取消了hbase hbck,需要使用hbase hbck2,我编译的这个版本可以支持hbase[2.0.3, 2.0.5, 2.1.1, 2.2.0, 3.0.0],具体怎么使用,可以参考 https://bbs.huaweicloud.com/blogs/353333,或者留言问我哈。

    hbase-hbck2-1.0.0.jar

    Hbase修复工具 示例情景: Q:缺失hbase.version文件 A:加上选项 -fixVersionFile 解决 Q:如果一个region即不在META表中,又不在hdfs上面,但是在regionserver的online region集合中 A:加上选项 -...

    hbase和hadoop数据块损坏处理

    HBase hbck 工具是一个非常有用的工具,可以检查 HBase 集群的健康状态。HBase.RegionServer 可能会因为机器硬件、网络、时间同步、GC 等原因挂掉,导致 HBase 冲突问题。hbck 工具可以检查 HBase 集群的健康状态,...

    HBase2.x之RIT问题解决.docx

    在HBase 1.x系列中,RIT问题通常可以通过hbase hbck –repair命令完成修复。但是在HBase 2.x系列中,该命令还没有支持,所以暂时无法通过这种命令完成修复。 方案三:执行assign或unassign命令 根据RIT状态执行...

    hbase-0.94.1手动数据迁移.docx

    在HBase的bin目录下执行`./hbase hbck -fixMeta`命令,目的是修复可能因迁移导致的元数据不一致问题。元数据包括关于表、Region和分配信息的详细记录。 5. **重新分配Region**: 迁移后,可能需要重新分配Region以...

    1-5+HBase+在网易的探索实践.pdf

    HBCK是HBase的健康检查工具,用于检测和修复HBase集群的一致性和完整性问题。它主要检查以下方面: 1. **Region一致性**:确保每个region都正确地分配并部署到唯一的RegionServer上,且在内存、hbase:meta表和...

    基于HBase的大数据解决方案.pdf

    HBCK提供了多种检查命令,例如"./bin/hbase hbck"、"./bin/hbase hbck –details"等。HBCK也提供了多种修复命令,例如"-fixAssignments"、"-fixMeta"等。 HBCK局部低危修复 HBCK局部低危修复用于修复HBase集群中的...

    hbase-exporter:HBase Prometheus导出器

    hbase-exporterHBase Prometheus导出器收集指标并中继JMX指标以供Prometheus使用由于JMX中一些重要的指标缺失或为空,因此我们另外分析了HBase主界面,例如“过渡中的过时区域” 解析“ hbase hbck”命令的输出以...

    hadoop+hbase+zookeeper集群配置流程及文件

    3. 初始化HBase:执行`hbase hbck -fix`检查和修复HBase元数据。 4. 启动HBase:通过`start-hbase.sh`命令启动Master和RegionServer。 Zookeeper3.4.12是一个分布式协调服务,用于管理Hadoop和HBase的元数据。配置...

    HBase 应用平台 balancer 功能

    例如,使用`hbase hbck -balance`命令可以强制执行一次负载均衡。同时,管理员也可以通过HBase的Web UI或JMX接口来监控和控制balancer的状态。 总之,HBase的`balancer`功能是保证集群高效运行的关键组件。它通过...

    HBASE安装包及安装手册使用指南

    2. **Region服务器负载均衡**:通过`hbase hbck -fix`和`hbase balancer`命令实现Region服务器间的负载均衡。 3. **监控与调优**:使用HBase提供的监控界面或通过JMX接口监控系统性能,根据监控数据调整HBase配置以...

    hbase-hbck2-1.2.0

    处理hbase异常工具

Global site tag (gtag.js) - Google Analytics