`
bupt04406
  • 浏览: 348424 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

hbase hbck

 
阅读更多

https://issues.apache.org/jira/browse/HBASE-5128 

https://github.com/jmhsieh/hbase-repair-scripts 

 

HBASE-5128之前版本的HBCK:

检查master、regionserver内存中的状态以及hdfs上面数据的状态之间的一致性 

 

(1)获取所有region的信息(regioninfo):通过zk获得-ROOT-地址,通过扫描-ROOT-表和.META.表,就获得了所有region的信息 

(2)遍历所有的region,获得所有表信息 

(3)通过ClusterStatus获得regionserver信息 

(4)多线程连接每个regionserver,获得这个regionserver上面online的region信息。记录下region是在那个regionserver上面 

(5)遍历hbase.rootdir,获得所有的table,多线程遍历各个table的目录,记录下region是在那个目录下面 

(6)通过zk获得所有disabled的tables 

(7)检查一致性,检查每一个region 

      正常的状态是: 

      【1】在META表中,hdfs上面有,表不是disabled的, region在某个regionserver的online region集合中,META表中记录的server信息和open了这个region的regionserver一致,并且没有被多个regionserver同时服务 

      【2】在META表中,region是split完的Parent region,没有被某个regionserver服务 

      【3】在META表中,表是disabled的,并且没有被某个regionserver服务 

      异常的状态是: 

     (7.1)如果一个region即不在META表中,又不在hdfs上面,但是在regionserver的online region集合中,那么输出NOT_IN_META_HDFS错误信息 

     (7.2)如果一个region不在META表中,又不在regionserver的online region集合中,但是在hdfs上面,输出NOT_IN_META_OR_DEPLOYED错误信息 

     (7.3)如果一个region不在META表中,但是在hdfs上面有,并且在regionserver的online region集合中,那么输出NOT_IN_META错误信息 

     (7.4)如果一个region在META表中,但是在hdfs上面没有,并且也不在regionserver的online region集合中,那么输出NOT_IN_HDFS_OR_DEPLOYED错误信息 

     (7.5)如果一个region在META表中,并且在regionserver的online region集合中有,但是在hdfs上面没有,那么输出NOT_IN_HDFS错误信息 

     (7.6)如果一个region在META表中,在hdfs上面也有,但是不再online region集合中,并且这个region所在的table不是Disabled的,那么输出NOT_DEPLOYED错误信息。 可以修复 

     (7.7)如果一个region在META表中,在hdfs上面有,在online region集合中,如果这个region所在的table是Disabled的,那么输出SHOULD_NOT_BE_DEPLOYED错误信息。 

     (7.8)如果一个region在META表中,在hdfs上面有,但是被在多个regionserver的online region集合中,那么输出MULTI_DEPLOYED错误信息。可以修复 

     (7.9)如果一个region在META表中,在hdfs上面也有,也应该被服务,但是META表中记录的regionserver和实际所在的regionserver不相符,那么输出SERVER_DOES_NOT_MATCH_META错误信息。可以修复 

     (7.10)如果是其他情况,输出UNKNOWN 

(8)检查完整性,以table为单位,遍历每个table 

     (8.1)table的第一个region的startKey必须是EMPTY_BYTE_ARRAY,否则输出FIRST_REGION_STARTKEY_NOT_EMPTY信息 

     (8.2)如果这个table有(startKey=endKey)的region,输出DEGENERATE_REGION信息 

     (8.3)如果两个region的区间有重叠,startKey相同输出DUPE_STARTKEYS信息,不相同输出OVERLAP_IN_REGION_CHAIN信息 

     (8.4)如果某个区间没有region,输出HOLE_IN_REGION_CHAIN信息(空洞) 

(9)打印table的总结信息 

 

 

hbck加上 -fix 可以自己修复下面三种情况: 

(7.6)如果一个region在META表中,在hdfs上面也有,但是不再online region集合中,并且这个region所在的table不是Disabled的,那么输出NOT_DEPLOYED错误信息。 

(7.8)如果一个region在META表中,在hdfs上面有,但是被在多个regionserver的online region集合中,那么输出MULTI_DEPLOYED错误信息。 

(7.9)如果一个region在META表中,在hdfs上面也有,也应该被服务,但是META表中记录的regionserver和实际所在的regionserver不相符,那么输出SERVER_DOES_NOT_MATCH_META错误信息。

 

原先的hbck检测region的一致性和table的完整性,但是需要管理员自己修复,修复后,如果一致性和完整性没有问题,通过OfflineMetaRepair来构造新的META表 

 

HBASE-5128 中的hbck能够检测region的一致性和table的完整性,并且可以修复完整性和一致性相关的问题 

所以有了新版的hbck,这个github上面的脚本用途不是特别大 

 

新版的hbck

 

新版本的 hbck 可以修复各种错误,修复选项是: 

(1)-fix,向下兼容用,被-fixAssignments替代 

(2)-fixAssignments,用于修复region assignments错误 

(3)-fixMeta,用于修复meta表的问题,前提是HDFS上面的region info信息有并且正确。 

(4)-fixHdfsHoles,修复region holes(空洞,某个区间没有region)问题 

(5)-fixHdfsOrphans,修复Orphan region(hdfs上面没有.regioninfo的region) 

(6)-fixHdfsOverlaps,修复region overlaps(区间重叠)问题 

(7)-fixVersionFile,修复缺失hbase.version文件的问题 

(8)-maxMerge <n> (n默认是5),当region有重叠是,需要合并region,一次合并的region数最大不超过这个值。 

(9)-sidelineBigOverlaps ,当修复region overlaps问题时,允许跟其他region重叠次数最多的一些region不参与(修复后,可以把没有参与的数据通过bulk load加载到相应的region) 

(10)-maxOverlapsToSideline <n> (n默认是2),当修复region overlaps问题时,一组里最多允许多少个region不参与 

由于选项较多,所以有两个简写的选项 

(11) -repair,相当于-fixAssignments -fixMeta -fixHdfsHoles -fixHdfsOrphans -fixHdfsOverlaps -fixVersionFile -sidelineBigOverlaps 

(12)-repairHoles,相当于-fixAssignments -fixMeta -fixHdfsHoles -fixHdfsOrphans 

 

 

 

新版本的 hbck 

(1)缺失hbase.version文件 

 加上选项 -fixVersionFile 解决 

(2)如果一个region即不在META表中,又不在hdfs上面,但是在regionserver的online region集合中 

 加上选项 -fixAssignments 解决 

(3)如果一个region在META表中,并且在regionserver的online region集合中,但是在hdfs上面没有 

 加上选项 -fixAssignments -fixMeta 解决,( -fixAssignments告诉regionserver close region),( -fixMeta删除META表中region的记录) 

(4)如果一个region在META表中没有记录,没有被regionserver服务,但是在hdfs上面有 

加上选项 -fixMeta -fixAssignments 解决,( -fixAssignments 用于assign region),( -fixMeta用于在META表中添加region的记录) 

(5)如果一个region在META表中没有记录,在hdfs上面有,被regionserver服务了 

加上选项 -fixMeta 解决,在META表中添加这个region的记录,先undeploy region,后assign 

(6)如果一个region在META表中有记录,但是在hdfs上面没有,并且没有被regionserver服务 

加上选项 -fixMeta 解决,删除META表中的记录 

(7)如果一个region在META表中有记录,在hdfs上面也有,table不是disabled的,但是这个region没有被服务 

加上选项 -fixAssignments 解决,assign这个region 

(8)如果一个region在META表中有记录,在hdfs上面也有,table是disabled的,但是这个region被某个regionserver服务了 

加上选项 -fixAssignments 解决,undeploy这个region 

(9)如果一个region在META表中有记录,在hdfs上面也有,table不是disabled的,但是这个region被多个regionserver服务了 

加上选项 -fixAssignments 解决,通知所有regionserver close region,然后assign region 

(10)如果一个region在META表中,在hdfs上面也有,也应该被服务,但是META表中记录的regionserver和实际所在的regionserver不相符 

加上选项 -fixAssignments 解决 

 

(11)region holes 

需要加上 -fixHdfsHoles ,创建一个新的空region,填补空洞,但是不assign 这个 region,也不在META表中添加这个region的相关信息 

(12)region在hdfs上面没有.regioninfo文件 

-fixHdfsOrphans 解决 

(13)region overlaps 

需要加上 -fixHdfsOverlaps 

 

 

说明: 

(1)修复region holes时,-fixHdfsHoles 选项只是创建了一个新的空region,填补上了这个区间,还需要加上-fixAssignments -fixMeta 来解决问题,( -fixAssignments 用于assign region),( -fixMeta用于在META表中添加region的记录),所以有了组合拳 -repairHoles 修复region holes,相当于-fixAssignments -fixMeta -fixHdfsHoles -fixHdfsOrphans 

(2) -fixAssignments,用于修复region没有assign、不应该assign、assign了多次的问题 

(3)-fixMeta,如果hdfs上面没有,那么从META表中删除相应的记录,如果hdfs上面有,在META表中添加上相应的记录信息 

(4)-repair 打开所有的修复选项,相当于-fixAssignments -fixMeta -fixHdfsHoles -fixHdfsOrphans -fixHdfsOverlaps -fixVersionFile -sidelineBigOverlaps 

 

新版本的hbck从(1)hdfs目录(2)META(3)RegionServer这三处获得region的Table和Region的相关信息,根据这些信息判断并repair

分享到:
评论

相关推荐

    IncompatibleClassChangeError(解决方案).md

    IncompatibleClassChangeError(解决方案).md

    中国智慧工地行业市场研究(2023)Word(63页).docx

    智慧工地,作为现代建筑施工管理的创新模式,以“智慧工地云平台”为核心,整合施工现场的“人机料法环”关键要素,实现了业务系统的协同共享,为施工企业提供了标准化、精益化的工程管理方案,同时也为政府监管提供了数据分析及决策支持。这一解决方案依托云网一体化产品及物联网资源,通过集成公司业务优势,面向政府监管部门和建筑施工企业,自主研发并整合加载了多种工地行业应用。这些应用不仅全面连接了施工现场的人员、机械、车辆和物料,实现了数据的智能采集、定位、监测、控制、分析及管理,还打造了物联网终端、网络层、平台层、应用层等全方位的安全能力,确保了整个系统的可靠、可用、可控和保密。 在整体解决方案中,智慧工地提供了政府监管级、建筑企业级和施工现场级三类解决方案。政府监管级解决方案以一体化监管平台为核心,通过GIS地图展示辖区内工程项目、人员、设备信息,实现了施工现场安全状况和参建各方行为的实时监控和事前预防。建筑企业级解决方案则通过综合管理平台,提供项目管理、进度管控、劳务实名制等一站式服务,帮助企业实现工程管理的标准化和精益化。施工现场级解决方案则以可视化平台为基础,集成多个业务应用子系统,借助物联网应用终端,实现了施工信息化、管理智能化、监测自动化和决策可视化。这些解决方案的应用,不仅提高了施工效率和工程质量,还降低了安全风险,为建筑行业的可持续发展提供了有力支持。 值得一提的是,智慧工地的应用系统还围绕着工地“人、机、材、环”四个重要因素,提供了各类信息化应用系统。这些系统通过配置同步用户的组织结构、智能权限,结合各类子系统应用,实现了信息的有效触达、问题的及时跟进和工地的有序管理。此外,智慧工地还结合了虚拟现实(VR)和建筑信息模型(BIM)等先进技术,为施工人员提供了更为直观、生动的培训和管理工具。这些创新技术的应用,不仅提升了施工人员的技能水平和安全意识,还为建筑行业的数字化转型和智能化升级注入了新的活力。总的来说,智慧工地解决方案以其创新性、实用性和高效性,正在逐步改变建筑施工行业的传统管理模式,引领着建筑行业向更加智能化、高效化和可持续化的方向发展。

    java大题啊实打实的

    123

    asdjhfjsnlkdmv

    asdjhfjsnlkdmv

    二手车价格预测,代码核心任务是通过机器学习模型(如线性回归、随机森林和KNN回归)预测车辆的价格(current price),并使用评估指标(如 R² 和 MSE)来衡量不同模型的预测效果

    该代码实现了基于机器学习的车辆价格预测模型,利用不同回归算法(如线性回归、随机森林回归和 KNN 回归)对车辆的当前价格(current price)进行预测。代码首先进行数据加载与预处理,包括删除无关特征、归一化处理等;然后使用不同的机器学习模型进行训练,并评估它们的表现(通过 R²、MAE、MSE 等指标);最后通过可视化工具对模型预测效果进行分析。目的是为车辆价格预测任务找到最合适的回归模型。 适用人群: 数据科学家和机器学习工程师:对于需要进行回归建模和模型选择的从业者,尤其是对车辆数据或类似领域有兴趣的。 企业数据分析师:在汽车行业或二手车市场中,需要对车辆价格进行预测和分析的专业人员。 机器学习学习者:希望学习如何使用 Python 实现机器学习模型、数据预处理和评估的初学者或中级学习者。 使用场景及目标: 汽车定价与估值:用于为汽车或二手车定价,尤其是当需要预测车辆的当前市场价格时。 汽车行业市场分析:通过数据分析和回归预测,帮助汽车销售商、经销商或市场分析师预测未来的市场价格趋势。 二手车市场:为二手车买卖双方提供价格参考,帮助制定合理的交易价格。

    基于模型预测控制(mpc)的车辆道,车辆轨迹跟踪,道轨迹为五次多项式,matlab与carsim联防控制

    基于模型预测控制(mpc)的车辆道,车辆轨迹跟踪,道轨迹为五次多项式,matlab与carsim联防控制

    StoreError解决办法.md

    StoreError解决办法.md

    白色精致风格的个人简历模板下载.zip

    白色精致风格的个人简历模板下载.zip

    白色宽屏风格的房产介绍服务网站模板下载.zip

    白色宽屏风格的房产介绍服务网站模板下载.zip

    基于Python实现的医疗知识图谱的知识问答系统源码毕业设计(高分项目)

    基于Python实现的医疗知识图谱的知识问答系统源码毕业设计(高分项目),本资源中的源码都是经过本地编译过可运行的,评审分达到98分,资源项目的难度比较适中,内容都是经过助教老师审定过的能够满足学习、毕业设计、期末大作业和课程设计使用需求,如果有需要的话可以放心下载使用。 基于Python实现的医疗知识图谱的知识问答系统源码毕业设计(高分项目)基于Python实现的医疗知识图谱的知识问答系统源码毕业设计(高分项目)基于Python实现的医疗知识图谱的知识问答系统源码毕业设计(高分项目)基于Python实现的医疗知识图谱的知识问答系统源码毕业设计(高分项目)基于Python实现的医疗知识图谱的知识问答系统源码毕业设计(高分项目)基于Python实现的医疗知识图谱的知识问答系统源码毕业设计(高分项目)基于Python实现的医疗知识图谱的知识问答系统源码毕业设计(高分项目)基于Python实现的医疗知识图谱的知识问答系统源码毕业设计(高分项目)基于Python实现的医疗知识图谱的知识问答系统源码毕业设计(高分项目)基于Python实现的医疗知识图谱的知识问答系统源码毕业设计(高分项目)基于

    白色宽屏风格的生物医疗实验室企业网站模板.rar

    白色宽屏风格的生物医疗实验室企业网站模板.rar

    C# 操作Access数据库

    C# 操作Access数据库

    NSFileSystemError如何解决.md

    NSFileSystemError如何解决.md

    白色简洁风格的商户销售统计图源码下载.zip

    白色简洁风格的商户销售统计图源码下载.zip

    白色简洁风格的室内设计整站网站源码下载.zip

    白色简洁风格的室内设计整站网站源码下载.zip

    侧吸式油烟机sw16可编辑全套技术资料100%好用.zip

    侧吸式油烟机sw16可编辑全套技术资料100%好用.zip

    matlab人脸识别代码

    在 MATLAB 中进行人脸识别可以通过使用内置的工具箱和函数来实现。MATLAB 提供了计算机视觉工具箱(Computer Vision Toolbox),其中包含了用于图像处理、特征提取以及机器学习的函数,可以用来构建一个人脸识别系统。下面是一个简化的教程,介绍如何使用 MATLAB 进行人脸识别。 ### 准备工作 1. **安装必要的工具箱**:确保你已经安装了“计算机视觉工具箱”和“深度学习工具箱”。如果没有,可以通过 MATLAB 的附加功能管理器安装它们。 2. **获取数据集**:准备一个包含不同个体的人脸图像的数据集。你可以自己收集图片,或者使用公开的数据集如 AT&T Faces Database 或 LFW (Labeled Faces in the Wild) 数据集。 3. **安装预训练模型(可选)**:如果你打算使用深度学习方法,MATLAB 提供了一些预训练的卷积神经网络(CNN)模型,比如 AlexNet, GoogLeNet 等,可以直接加载并用于特征提取或分类。 ### 步骤指南 #### 1. 加载人脸检测器 ```matlab face

    白色宽屏风格的建筑设计公司企业网站源码下载.zip

    白色宽屏风格的建筑设计公司企业网站源码下载.zip

    智慧工地产品方案Word(179页).doc

    智慧工地,作为现代建筑施工管理的创新模式,以“智慧工地云平台”为核心,整合施工现场的“人机料法环”关键要素,实现了业务系统的协同共享,为施工企业提供了标准化、精益化的工程管理方案,同时也为政府监管提供了数据分析及决策支持。这一解决方案依托云网一体化产品及物联网资源,通过集成公司业务优势,面向政府监管部门和建筑施工企业,自主研发并整合加载了多种工地行业应用。这些应用不仅全面连接了施工现场的人员、机械、车辆和物料,实现了数据的智能采集、定位、监测、控制、分析及管理,还打造了物联网终端、网络层、平台层、应用层等全方位的安全能力,确保了整个系统的可靠、可用、可控和保密。 在整体解决方案中,智慧工地提供了政府监管级、建筑企业级和施工现场级三类解决方案。政府监管级解决方案以一体化监管平台为核心,通过GIS地图展示辖区内工程项目、人员、设备信息,实现了施工现场安全状况和参建各方行为的实时监控和事前预防。建筑企业级解决方案则通过综合管理平台,提供项目管理、进度管控、劳务实名制等一站式服务,帮助企业实现工程管理的标准化和精益化。施工现场级解决方案则以可视化平台为基础,集成多个业务应用子系统,借助物联网应用终端,实现了施工信息化、管理智能化、监测自动化和决策可视化。这些解决方案的应用,不仅提高了施工效率和工程质量,还降低了安全风险,为建筑行业的可持续发展提供了有力支持。 值得一提的是,智慧工地的应用系统还围绕着工地“人、机、材、环”四个重要因素,提供了各类信息化应用系统。这些系统通过配置同步用户的组织结构、智能权限,结合各类子系统应用,实现了信息的有效触达、问题的及时跟进和工地的有序管理。此外,智慧工地还结合了虚拟现实(VR)和建筑信息模型(BIM)等先进技术,为施工人员提供了更为直观、生动的培训和管理工具。这些创新技术的应用,不仅提升了施工人员的技能水平和安全意识,还为建筑行业的数字化转型和智能化升级注入了新的活力。总的来说,智慧工地解决方案以其创新性、实用性和高效性,正在逐步改变建筑施工行业的传统管理模式,引领着建筑行业向更加智能化、高效化和可持续化的方向发展。

    履带车底盘sw16全套技术资料100%好用.zip

    履带车底盘sw16全套技术资料100%好用.zip

Global site tag (gtag.js) - Google Analytics