splitlog是保证在重启或rs挂掉后,恢复hlog的重要手段。master需要将hlog写到各个region目录下的recovered.edits目录中,然后由各台rs自行replay这个目录来恢复数据。这个过程中,master会启动一个读线程和多个写线程,一边读到内存中,一边将内存队列中的数据写到各个目录中去。
当master将.logs下的数据写到recovered.edits后,会把.logs目录下的文件mv到.oldlogs中。如果splitlog期间master挂掉,下次启动时会重复以上过程。但是杯具的是,master并不会等待recovered.edits写完以后再将.logs下的文件mv到.oldlogs中,而是当.logs下的文件读入内存结束以后就执行mv操作。因此如果这些数据在内存还没有写完成recovered.edits时,mv操作又结束时master就挂掉,则数据就丢失了。当然实际情况出现的概率还是比较小的,因为master并不是一次把.logs全部读入内存,而是128MB地读,所以只有当最后一个128MB在内存中时,才会执行mv操作,这时就有丢失数据的风险了。应对以下代码做调整:
Index: src/main/java/org/apache/hadoop/hbase/regionserver/wal/HLogSplitter.java
===================================================================
--- src/main/java/org/apache/hadoop/hbase/regionserver/wal/HLogSplitter.java (revision 99281)
+++ src/main/java/org/apache/hadoop/hbase/regionserver/wal/HLogSplitter.java (working copy)
@@ -289,10 +289,10 @@
"Discovered orphan hlog after split. Maybe the "
+ "HRegionServer was not dead when we started");
}
- archiveLogs(srcDir, corruptedLogs, processedLogs, oldLogDir, fs, conf);
} finally {
LOG.info("Finishing writing output logs and closing down.");
splits = outputSink.finishWritingAndClose();
+ archiveLogs(srcDir, corruptedLogs, processedLogs, oldLogDir, fs, conf);
}
return splits;
}
即将mv操作移动到等所有写线程结束以后再做。这样数据就不会丢失了。带来的副作用是在异常退出而下次启动时有可能在recovered.edits下面重复写log文件(因为上次退出时有可能留下一些文件)。但这最多增加一点重启的时间,总要比丢失数据好。
分享到:
相关推荐
`readme.txt`文件通常包含有关如何使用或配置`splitlog.cmd`的说明,例如执行脚本的步骤、所需权限、可能遇到的问题及解决方法等。它为用户提供了执行此日志分割方案的指南。 总的来说,这种自动分割日志的方法旨在...
面向对象程序设计是Java SE(标准版)的核心特性之一,任务101主要涉及文件和流的操作,以及图像处理。在此任务中,我们将探讨如何利用Java...完成这个任务,不仅可以深化Java编程技能,还能提升处理实际问题的能力。
/hbase/archive (1) 进行snapshot或者升级的时候使用到的归档目录。compaction删除hfile的时 候,也会把旧的hfile归档到这里等。 /hbase/corrupt (2) splitlog的corrupt目录,以及corrupt hfile的目录。
LogSplitter是Apache的日志处理程序,结合了rotatelog,splitlog和(部分)cronolog的功能。
三相LCL并网逆变器:高精度快速响应的有功无功解耦控制技术,三相LCL并网逆变器,有功无功解耦控制,控制精度高,响应速度快。 ,三相LCL并网逆变器; 有功无功解耦控制; 高控制精度; 快速响应。,三相LCL逆变器高精度快速响应解耦控制
一种基于Lifelogging视频的文本标签生成模型.pdf
基于黏菌优化算法(SMA)的改进与复现——融合EO算法更新策略的ESMA项目报告,黏菌优化算法(SMA)复现(融合EO算法改进更新策略)——ESMA。 复现内容包括:改进算法实现、23个基准测试函数、多次实验运行并计算均值标准差等统计量、与SMA对比等。 程序基本上每一步都有注释,非常易懂,代码质量极高,便于新手学习和理解。 ,SMA复现;EO算法改进;算法实现;基准测试函数;实验运行;统计量;SMA对比;程序注释;代码质量;学习理解。,标题:ESMA算法复现:黏菌优化与EO算法融合改进的实证研究
免费JAVA毕业设计 2024成品源码+论文+数据库+启动教程 启动教程:https://www.bilibili.com/video/BV1SzbFe7EGZ 项目讲解视频:https://www.bilibili.com/video/BV1Tb421n72S 二次开发教程:https://www.bilibili.com/video/BV18i421i7Dx
基于数据挖掘的教师教育质量评价指标体系的构建.pdf
内容概要:本实验报告旨在介绍将正则表达式(RE)转化为非确定有限自动机(NFA)的过程与技术细节。内容包括了理论背景的介绍,比如为什么需要这样的转换以及它背后的数学逻辑;详细解释如何通过编写特定功能的程序完成从正则表达式到NFA的状态迁移图构建;并且探讨了后续将这个NFA再转变成DFA(确定有限自动机)并进行优化的方法。最后,通过一组具体的例子来进行验证性的实践操作,并讨论在整个过程中遇到的各种挑战及解决方案。此外,报告还包含了对于不同设计方案的选择考量,以及对于所选技术和工具的应用评估。 适用人群:对于希望深入理解编译原理、特别是形式语言和自动机构造的学生或专业人士来说是一份宝贵的学习资料。 使用场景及目标:本篇文章主要用于教育指导,适用于大学本科计算机科学专业相关课程的教学辅助材料,帮助学生更好地理解复杂概念之间的联系。通过动手实践可以强化他们对该领域关键知识点的记忆和技术能力。 其他说明:文中提供的源代码实例和图表有助于使用者更直观地领会转换过程的具体步骤,同时也有助于培养解决问题的能力和思维方式。
nodejs010-1.2-29.el6.centos.alt.x86_64.rpm
"基于萤火虫算法优化麻雀算法的深度置信网络FSSSA-DBN数据分类预测模型及其Matlab代码详解",基于萤火虫算法改进麻雀算法优化深度置信网络(FSSSA-DBN)的数据分类预测 matlab代码注释详细, ,核心关键词:基于萤火虫算法; 改进麻雀算法; 优化深度置信网络(FSSSA-DBN); 数据分类预测; MATLAB代码注释详细。,基于FSSSA-DBN的深度分类预测算法的MATLAB代码注释
基于自适应粒子群算法的源储容量配置优化策略:考虑合作博弈与Shapley分配模型的研究报告,考虑合作博弈的源储容量配置代码 采用自适应粒子群算法编写 考虑shapley分配模型对收益进行分配 容量配置+优化调度 本人亲自编写,附参考文献,可改写性强,可。 ,合作博弈; 自适应粒子群算法; 容量配置优化调度; 收益分配模型(Shapley); 参考注释。,基于Shapley分配的容量配置优化与调度代码:自适应粒子群算法的实现
nodejs010-nodejs-editor-0.0.5-1.el6.centos.alt.noarch.rpm
免费JAVA毕业设计 2024成品源码+论文+录屏+启动教程 启动教程:https://www.bilibili.com/video/BV1SzbFe7EGZ 项目讲解视频:https://www.bilibili.com/video/BV1Tb421n72S 二次开发教程:https://www.bilibili.com/video/BV18i421i7Dx
《深入解析与复现:基于ICMIC混沌初始化的SHSSA算法及其与SSA的对比研究》,麻雀搜索算法(SSA)复现:《螺旋探索与自适应混合变异的麻雀搜索算法_陈功》 策略为:ICMIC混沌初始化种群+螺旋探索改进发现者策略+精英差分扰动策略+随机反向扰动策略——SHSSA 复现内容包括:改进SSA算法实现、23个基准测试函数、改进策略因子画图分析、相关混沌图分析、与SSA对比等。 程序基本上每一步都有注释,非常易懂,代码质量极高,便于新手学习和理解。 ,麻雀搜索算法(SSA)复现; 螺旋探索; 自适应混合变异; ICMIC混沌初始化种群; 策略因子画图分析; 代码质量高; 对比实验。,麻雀搜索算法(SSA)的SHSSA策略复现与对比分析
免费JAVA毕业设计 2024成品源码+论文+数据库+启动教程 启动教程:https://www.bilibili.com/video/BV1SzbFe7EGZ 项目讲解视频:https://www.bilibili.com/video/BV1Tb421n72S 二次开发教程:https://www.bilibili.com/video/BV18i421i7Dx
基于MATLAB/SIMULINK仿真的永磁同步电动机双闭环控制系统研究:变频侧五电平控制与整流侧三电平控制的实现与优化(默认MATLAB 2018b环境),MATLAB,SIMULINK仿真 永磁同步电动机,转速电流双闭环 变频侧五电平控制,整流侧三电平控制 默认MATLAB2018b ,MATLAB; SIMULINK仿真; 永磁同步电动机; 转速电流双闭环; 五电平控制; 三电平控制; MATLAB2018b,MATLAB中永磁同步电机双闭环五电平控制策略研究
《利用HFSS软件自制的角锥(矩形)喇叭天线模型:结果展示与参数化调整教程》,HFSS角锥(矩形)喇叭天线 天线模型,附带结果,可改参数,HFSS软件包 自己做的,保证正确(有教程,具体到每一步,可以自己做出来参考bao gao) ,HFSS; 角锥喇叭天线; 矩形; 天线模型; 附带结果; 可改参数; HFSS软件包; 自制; 保证正确; 教程,HFSS软件角锥喇叭天线模型:可改参数保证正确结果
1、文件内容:publican-redhat-2.7-6.el7.rpm以及相关依赖 2、文件形式:tar.gz压缩包 3、安装指令: #Step1、解压 tar -zxvf /mnt/data/output/publican-redhat-2.7-6.el7.tar.gz #Step2、进入解压后的目录,执行安装 sudo rpm -ivh *.rpm 4、安装指导:私信博主,全程指导安装