`
无尘道长
  • 浏览: 161497 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

Split Region详细解读

阅读更多

//HRegionServer类的splitRegion方法,该方法封装了手动split的实现逻辑

public void splitRegion(HRegionInfo regionInfo, byte[] splitPoint)

      throws NotServingRegionException, IOException {

    region.flushcache(); //刷新memstore

region.forceSplit(splitPoint);//设置splitRequest状态为true,以便强制split

//通过线程池完成split,线程池大小通过hbase.regionserver.thread.split配置(默认为1),具体的split逻辑请参阅接下来的SplitRequestrun方法

    compactSplitThread.requestSplit(region, region.checkSplit());

}

 

public byte[] checkSplit() {

    // Can't split ROOT/META

    if (this.regionInfo.isMetaTable()) {

      return null;

    }

 

    //如果splitRequest=true或者发现一个大小达到split条件的store(注意:一个store对应一个列族,有多个storefile文件和一个Memstore)则返回true,如果不是强制splitsplitRequest=false)且该region下存在一个storefilereference类型的文件则不能splitreference文件只会存在split期间)

    if (!splitPolicy.shouldSplit()) {

      return null;

    }

  

   //如果在split时指定了rowkey直接返回,否则执行以下逻辑:循环所有的store,找出最大并且不包含referencestore,采用该storesplitPoint作为regionsplitPointstoresplitPoint采用最大的storeFile,的中间rowKey作为splitPoint,因此split实际上并不是完全的等分,可能一个region会比另一个大很多

    byte[] ret = splitPolicy.getSplitPoint();

 

    if (ret != null) {

      try {

        checkRow(ret, "calculated split");

      } catch (IOException e) {

        LOG.error("Ignoring invalid split", e);

        return null;

      }

    }

    return ret;

  }

 

//SplitRequestrun方法

public void run() {

    SplitTransaction st = new SplitTransaction(parent, midKey);

    if (!st.prepare()) return;

    st.execute(this.server, this.server);

  }

 

// SplitTransactionprepare方法

public boolean prepare() {

//如果regionclose或者正在close或者有reference类型的storefile则不split,只有split过程中才会产生referencestorefile文件

    if (!this.parent.isSplittable()) return false;

HRegionInfo hri = this.parent.getRegionInfo();

byte [] startKey = hri.getStartKey();

    byte [] endKey = hri.getEndKey();

long rid = getDaughterRegionIdTimestamp(hri);

//创建两个新的region对象

    this.hri_a = new HRegionInfo(hri.getTableName(), startKey, this.splitrow, false, rid);

    this.hri_b = new HRegionInfo(hri.getTableName(), this.splitrow, endKey, false, rid);

    return true;

  }

 

// SplitTransactionexcuete方法

public PairOfSameType<HRegion> execute(final Server server,

      final RegionServerServices services)

  throws IOException {

    //关闭被splitregion,生成两个新的regionA B

PairOfSameType<HRegion> regions = createDaughters(server, services);

//打开split后生成的A B两个region

openDaughters(server, services, regions.getFirst(), regions.getSecond());

//修改zk中保存的split状态由splitingsplitmaster获知该状态后会删除zk中的该状态节点

该方法会在循环中检测master是否获得了通知,每次检测会休眠100ms

    transitionZKNode(server, services, regions.getFirst(), regions.getSecond());

    return regions;

  }

 

PairOfSameType<HRegion> createDaughters(final Server server,

      final RegionServerServices services) throws IOException {

//设置split超时时间(默认为3000ms,可通过hbase.regionserver.fileSplitTimeout项配置)

    boolean testing = server == null? true:

      server.getConfiguration().getBoolean("hbase.testing.nocluster", false);

    this.fileSplitTimeout = testing ? this.fileSplitTimeout :

      server.getConfiguration().getLong("hbase.regionserver.fileSplitTimeout", this.fileSplitTimeout);

 

 //zk创建一个临时的节点,保存split状态:

    RS_ZK_REGION_CLOSED       (2),   // RS has finished closing a region

    RS_ZK_REGION_OPENING      (3),   // RS is in process of opening a region

    RS_ZK_REGION_OPENED       (4),   // RS has finished opening a region

    RS_ZK_REGION_SPLITTING    (5),   // RS has started a region split

    RS_ZK_REGION_SPLIT        (6),   // RS split has completed.

    RS_ZK_REGION_FAILED_OPEN  (7),   // RS failed to open a region

    if (server != null && server.getZooKeeper() != null) {

      try {

        createNodeSplitting(server.getZooKeeper(), this.parent.getRegionInfo(), server.getServerName());

      } catch (KeeperException e) {

        throw new IOException("Failed creating SPLITTING znode on " +this.parent.getRegionNameAsString(), e);

      }

    }

    this.journal.add(JournalEntry.SET_SPLITTING_IN_ZK);

    if (server != null && server.getZooKeeper() != null) {

      try {

        this.znodeVersion = transitionNodeSplitting(server.getZooKeeper(),

            this.parent.getRegionInfo(), server.getServerName(), -1);

      } catch (KeeperException e) {

        throw new IOException("Failed setting SPLITTING znode on " + this.parent.getRegionNameAsString(), e);

      }

}

//hdfs创建一个split目录:{ region dir}/splits

    createSplitDir(this.parent.getFilesystem(), this.splitdir);

    this.journal.add(JournalEntry.CREATE_SPLIT_DIR);

 

    List<StoreFile> hstoreFilesToSplit = null;

    Exception exceptionToThrow = null;

try{

//关闭当前region,不再提供任何服务,在关闭region前会等待该region的所有compactflush均完成(compactflush是异步的操作),并且如果发现memstore的大小等于或者大于hbase.hregion.preclose.flush.size配置的值(默认为5M)时,会进行preFlushclose前的flush),这些操作完成后才设置regionclosing状态为true,设置closing状态后会分配一个writelock,此时拒绝任何服务了,直到关闭完全,设置closedtrue,最后释放写锁

      hstoreFilesToSplit = this.parent.close(false);

    } catch (Exception e) {

      exceptionToThrow = e;

    }

    //RSonlineRegions中删除被splitregion,在下线region后的这段时间里client请求该region的数据会失败,client会不断尝试(尝试时间间隔会随着次数的增加而增大,前几次为采用hbase.client.pause配置的值,默认值为1000ms)直到split后形成的A B region上线,此过程比较快,没有复杂的处理,总之split时可能会出现超过1秒的访问。

    if (!testing) {

      services.removeFromOnlineRegions(this.parent.getRegionInfo().getEncodedName());

    }

    this.journal.add(JournalEntry.OFFLINED_PARENT);

 

//通过线程池split storeFile,池大小=storeFile个数,具体的split逻辑请参阅StoreFileSplittersplitStoreFile()

    splitStoreFiles(this.splitdir, hstoreFilesToSplit);

    this.journal.add(JournalEntry.STARTED_REGION_A_CREATION);

    HRegion a = createDaughterRegion(this.hri_a, this.parent.rsServices);

    this.journal.add(JournalEntry.STARTED_REGION_B_CREATION);

    HRegion b = createDaughterRegion(this.hri_b, this.parent.rsServices);

    this.journal.add(JournalEntry.PONR);

 

if (!testing) {

  //.META.表中下线splitregion,修改.META.表的该region信息,把offline split设置为true,并且添加两列:splitAsplitB

      MetaEditor.offlineParentInMeta(server.getCatalogTracker(),

        this.parent.getRegionInfo(), a.getRegionInfo(), b.getRegionInfo());

    }

    return new PairOfSameType<HRegion>(a, b);

  }

 

//StoreFileSplitter类的splitStoreFile逻辑

private void splitStoreFile(final StoreFile sf, final Path splitdir)

  throws IOException {

    FileSystem fs = this.parent.getFilesystem();

    byte [] family = sf.getFamily();

    String encoded = this.hri_a.getEncodedName();

    Path storedir = Store.getStoreHomedir(splitdir, encoded, family);

    StoreFile.split(fs, storedir, sf, this.splitrow, Range.bottom);

    encoded = this.hri_b.getEncodedName();

    storedir = Store.getStoreHomedir(splitdir, encoded, family);

    StoreFile.split(fs, storedir, sf, this.splitrow, Range.top);

  }

// StoreFilesplit方法

static Path split(final FileSystem fs,

                    final Path splitDir,

                    final StoreFile f,

                    final byte [] splitRow,

                    final Reference.Range range)

      throws IOException {

    // 检查splitrow是否是在该store file范围内

    if (range == Reference.Range.bottom) {

      KeyValue splitKey = KeyValue.createLastOnRow(splitRow);

      byte[] firstKey = f.createReader().getFirstKey();

      if (f.getReader().getComparator().compare(splitKey.getBuffer(),

          splitKey.getKeyOffset(), splitKey.getKeyLength(),

          firstKey, 0, firstKey.length) < 0) {

        return null;

      }     

    }

    else {

      KeyValue splitKey = KeyValue.createFirstOnRow(splitRow);

      byte[] lastKey = f.createReader().getLastKey();     

      if (f.getReader().getComparator().compare(splitKey.getBuffer(),

          splitKey.getKeyOffset(), splitKey.getKeyLength(),

          lastKey, 0, lastKey.length) > 0) {

        return null;

      }

    }

//reference store,生成的reference stroe的名称格式例如:0959f79e6f7141aba1d81450ac891884.a00556374994fa5b3369e884b45492d3,其中a00556374994fa5b3369e884b45492d3为被splitregionid0959f79e6f7141aba1d81450ac891884为引用的storeFile的名称,该引用的storefile的内容是用于split的中间rowkey,两个新的regionreference文件的个数均与split regionstoreFile文件个数相同,通过hbase的管理界面看到

    Reference r = new Reference(splitRow, range);

    String parentRegionName = f.getPath().getParent().getParent().getName();

    Path p = new Path(splitDir, f.getPath().getName() + "." + parentRegionName);

    return r.write(fs, p);

  }

 

//打开split生成的两个region

void openDaughters(final Server server,

      final RegionServerServices services, HRegion a, HRegion b)

      throws IOException {

      DaughterOpener aOpener = new DaughterOpener(server, a);

      DaughterOpener bOpener = new DaughterOpener(server, b);

      aOpener.start();

      bOpener.start();

      aOpener.join();//等待open完成

      bOpener.join();

      //如果包含referencestorefile或者storefile数量超过了配置的限制大小时会requestCompactcompact后,reference文件变为实际文件

      //增加region信息到.META.

      services.postOpenDeployTasks(b, server.getCatalogTracker(), true);

//添加region对象到RegionServeronlineRegions列表中,此时可以对外服务

      services.addToOnlineRegions(b);

      services.postOpenDeployTasks(a, server.getCatalogTracker(), true);

      services.addToOnlineRegions(a);

    }

  }

分享到:
评论

相关推荐

    Ext4详细解读

    ### Ext4详细解读 #### 一、Accordion布局详解 Accordion布局是一种特殊类型的布局方式,它在用户界面设计中被广泛采用。Accordion布局也被称为“手风琴”布局,这种布局的特点是在任何时间里,只有一个面板处于...

    HBase性能深度分析

    当region文件大小达到由“hbase.hregion.max.filesize”参数决定的上限(默认256MB),触发region split操作,原region一分为二,以提高数据读写效率与分布均衡性。 在此过程中,“.splits”目录的引入,有效避免了...

    《永磁无刷直流电机控制系统与软件综合研究-集成电机计算软件、电机控制器及电磁设计软件的创新设计与实践》,永磁无刷直流电机计算与控制软件:高效电机控制器与电磁设计工具,永磁无刷直流电机计算软件,电机控

    《永磁无刷直流电机控制系统与软件综合研究——集成电机计算软件、电机控制器及电磁设计软件的创新设计与实践》,永磁无刷直流电机计算与控制软件:高效电机控制器与电磁设计工具,永磁无刷直流电机计算软件,电机控制器,无刷电机设计软件,电机电磁设计软件 ,永磁无刷直流电机计算软件; 电机控制器; 无刷电机设计软件; 电机电磁设计软件,无刷电机设计专家:永磁无刷直流电机计算与控制器设计软件

    新能源汽车VCU开发模型及策略详解:从控制策略到软件设计全面解析,新能源汽车VCU开发模型及策略详解:从控制策略到软件设计全面解析,新能源汽车VCU开发模型及控制策略,MBD电控开发 新能源汽车大势所

    新能源汽车VCU开发模型及策略详解:从控制策略到软件设计全面解析,新能源汽车VCU开发模型及策略详解:从控制策略到软件设计全面解析,新能源汽车VCU开发模型及控制策略,MBD电控开发 新能源汽车大势所向,紧缺VCU电控开发工程师,特别是涉及新能源三电系统,工资仅仅低于无人驾驶、智能驾驶岗位。 ——含控制策略模型 整车控制策略详细文档 通讯协议文档 接口定义 软件设计说明文档 等(超详细,看懂VCU电控策略开发就通了) 内容如下: 新能源汽车整车控制器VCU学习模型,适用于初学者。 1、模型包含高压上下电,行驶模式管理,能量回馈,充电模式管理,附件管理,远程控制,诊断辅助功能。 2、软件说明书(控制策略说明书) 3、模型有部分中文注释 对想着手或刚开始学习整车控制器自动代码生成或刚接触整车控制器有很大帮助。 ,新能源汽车VCU开发模型; 控制策略; MBD电控开发; 模型学习; 代码生成; 整车控制器; 能量回馈; 诊断辅助功能,新能源汽车电控开发详解:VCU控制策略模型及学习手册

    Python读取Excel文件的方法详解及应用场景

    内容概要:本文详细介绍了两种利用 Python 读取 Excel 文件的不同方法,分别是基于 pandas 和 openpyxl。对于想要利用Python 处理 Excel 数据的读者来说,文中不仅提供了简洁明了的具体代码片段以及执行效果展示,还针对每个库的应用特性进行了深度解析。此外,文档提到了一些进阶应用技巧如只读特定的工作薄、过滤某些列等,同时强调了需要注意的地方(像是路径设置、engine 参数调整之类),让读者可以在面对实际项目需求时做出更加明智的选择和技术选型。 适合人群:对 Python 有基本掌握并希望提升数据读取能力的开发人员。 使用场景及目标:适用于任何涉及到批量数据导入或是与 Excel 进行交互的业务流程。无论是做初步的数据探索还是深入挖掘隐藏于电子表格背后的故事,亦或是仅为了简化日常办公自动化任务都可以从中受益。最终目标帮助使用者熟悉两大主流 Excel 解决方案的技术特性和最佳实践。 阅读建议:本文既是一份详尽的学习指南也是一份方便随时查阅的手册。因此初学者应当认真研究所提供的示例,而有一定经验者也可以快速定位到感兴趣的部分查看关键要点。

    毕设springboot基于springboot的医护人员排班系统.zip

    # 医护人员排班系统 ## 1. 项目介绍 本系统是一个基于SpringBoot框架开发的医护人员排班管理系统,用于医院管理医护人员的排班、调班等工作。系统提供了完整的排班管理功能,包括科室管理、人员管理、排班规则配置、自动排班等功能。 ## 2. 系统功能模块 ### 2.1 基础信息管理 - 科室信息管理:维护医院各科室基本信息 - 医护人员管理:管理医生、护士等医护人员信息 - 排班类型管理:配置不同的排班类型(如:早班、中班、晚班等) ### 2.2 排班管理 - 排班规则配置:设置各科室排班规则 - 自动排班:根据规则自动生成排班计划 - 排班调整:手动调整排班计划 - 排班查询:查看各科室排班情况 ### 2.3 系统管理 - 用户管理:管理系统用户 - 角色权限:配置不同角色的操作权限 - 系统设置:管理系统基础配置 ## 3. 技术架构 ### 3.1 开发环境 - JDK 1.8 - Maven 3.6 - MySQL 5.7 - SpringBoot 2.2.2 ### 3.2 技术栈 - 后端框架:SpringBoot - 持久层:MyBatis-Plus - 数据库:MySQL - 前端框架:Vue.js - 权限管理:Spring Security ## 4. 数据库设计 主要数据表: - 科室信息表(keshixinxi) - 医护人员表(yihurengyuan) - 排班类型表(paibanleixing) - 排班信息表(paibanxinxi) - 用户表(user) ## 5. 部署说明 ### 5.1 环境要求 - JDK 1.8+ - MySQL 5.7+ - Maven 3.6+ ### 5.2 部署步骤 1. 创建数据库并导入SQL脚本 2. 修改application.yml中的数据库配置 3. 执行maven打包命令:mvn clean package 4. 运行jar包:java -jar xxx.jar ## 6. 使用说明 ### 6.1 系统登录 - 管理员账号:admin - 初始密码:admin ### 6.2 基本操作流程 1. 维护基础信息(科室、人员等) 2. 配置排班规则 3. 生成排班计划 4. 查看和调整排班 ## 7. 注意事项 1. 首次使用请及时修改管理员密码 2. 定期备份数据库 3. 建议定期检查和优化排班规则

    MATLAB仿真的夫琅禾费衍射强度图:圆孔、圆环、矩形孔定制研究,MATLAB仿真:夫琅禾费衍射强度图的可定制性-以圆孔、圆环及矩形孔为例的研究分析,MATLAB夫琅禾费衍射强度图仿真 圆孔,圆环

    MATLAB仿真的夫琅禾费衍射强度图:圆孔、圆环、矩形孔定制研究,MATLAB仿真:夫琅禾费衍射强度图的可定制性——以圆孔、圆环及矩形孔为例的研究分析,MATLAB夫琅禾费衍射强度图仿真 圆孔,圆环,矩形孔可定制。 ,MATLAB; 夫琅禾费衍射; 强度图仿真; 圆孔; 圆环; 矩形孔; 可定制。,MATLAB仿真夫琅禾费衍射强度图:定制孔型(圆孔/圆环/矩形)

    商道融绿ESG评级20241231.xlsx

    详细介绍及样例数据:https://blog.csdn.net/samLi0620/article/details/145652300

    基于Dugoff轮胎模型与B08-01基础建模的七自由度车辆动力学模型验证:利用MATLAB 2018及以上版本与CarSim 2020.0软件的仿真对比研究,基于Dugoff轮胎模型与B08-01框

    基于Dugoff轮胎模型与B08_01基础建模的七自由度车辆动力学模型验证:利用MATLAB 2018及以上版本与CarSim 2020.0软件的仿真对比研究,基于Dugoff轮胎模型与B08_01框架的七自由度车辆动力学模型验证——使用MATLAB 2018及以上版本与CarSim 2020.0软件进行仿真对比研究,七自由度车辆动力学模型验证(Dugoff轮胎模型,B08_01基础上建模) 1.软件: MATLAB 2018以上;CarSim 2020.0 2.介绍: 基于Dugoff轮胎模型和车身动力学公式,搭建7DOF车辆动力学Simulink模型,对相关变量(质心侧偏角,横摆角速度,纵、横向速度及加速度)进行CarSim对比验证。 ,核心关键词:七自由度车辆动力学模型验证; Dugoff轮胎模型; B08_01建模基础; MATLAB 2018以上; CarSim 2020.0; Simulink模型; 变量对比验证。,基于Dugoff轮胎模型的七自由度车辆动力学模型验证与CarSim对比

    【毕业设计】基于Java+servlet+jsp+css+js+mysql实现“转赚”二手交易平台_pgj.zip

    【毕业设计】基于Java+servlet+jsp+css+js+mysql实现“转赚”二手交易平台_pgj

    恋爱聊妹术V2小程序源码4.1.0多开版.zip

    微猫恋爱聊妹术小程序源码介绍: 微猫恋爱聊妹术小程序源码是一款全新升级的聊天工具,它采用全新主题和UI,完美支持分享朋友圈功能。同时,它的独立后台也进行了大规模更新,让操作更加简单。其中,课堂页面、搜索页面和子话术列表页面等,均增加了流量主展示,具有超多的功能。 安装教程: 您可以先加入微猫恋爱聊妹术小程序源码的赞助群,然后在群内找到魔方安装说明。根据源码编号找到相应的安装说明,非常详细,让您轻松完成安装。

    电气安装工程安全技术规程-蒋凯,杨华甫,马仲范,王清禄译;孙照森校;鞍钢工程技术编委会编.pdf

    电气安装工程安全技术规程_蒋凯,杨华甫,马仲范,王清禄译;孙照森校;鞍钢工程技术编委会编

    基于Copula函数的风光空间相关性联合场景生成与K-means聚类削减MATLAB研究,基于Copula函数的风光空间相关性联合场景生成与K-means聚类削减算法研究,基于copula的风光联合场

    基于Copula函数的风光空间相关性联合场景生成与K-means聚类削减MATLAB研究,基于Copula函数的风光空间相关性联合场景生成与K-means聚类削减算法研究,基于copula的风光联合场景生成?K-means聚类并削减 MATLAB 由于目前大多数研究的是不计风光出力之间的相关性影响,但是地理位置相近的风电机组和光伏机组具有极大的相关性。 因此,采用 Copula 函数作为风电、光伏联合概率分布,生成风、光考虑空间相关性联合出力场景,在此基础上,基于Kmeans算法,分别对风光场景进行聚类,从而实现大规模场景的削减,削减到5个场景,最后得出每个场景的概率与每个对应场景相乘求和得到不确定性出力 ,基于Copula的风光联合场景生成; K-means聚类削减; 空间相关性; 概率分布; 场景削减,基于Copula与K-means的风光联合场景生成与削减研究

    模块化多电平变流器MMC的VSG控制技术研究:基于MATLAB-Simulink的仿真分析与定制实现-支持三相与任意电平数,构网型模块化多电平变流器MMC的VSG控制策略与仿真模型:三相负荷变动下的

    模块化多电平变流器MMC的VSG控制技术研究:基于MATLAB-Simulink的仿真分析与定制实现——支持三相与任意电平数,构网型模块化多电平变流器MMC的VSG控制策略与仿真模型:三相负荷变动下的虚拟同步发电机控制研究,构网型 模块化多电平变流器 MMC 的VSG控制 同步发电机控制 MATLAB–Simulink仿真模型,可按需求定制 10电平.14电平,任意电平可做。 三相MMC,采用VSG控制。 设置负荷变动,调整有功无功,保持电网电压和频率 ,构网型模块化多电平变流器; MMC的VSG控制; 虚拟同步发电机控制; MATLAB–Simulink仿真模型; 任意电平可做; 三相MMC; 负荷变动; 有功无功调整; 电网电压和频率保持。,基于VSG控制的模块化多电平变流器(MMC)的构网型仿真模型

    暗通道算法DCP-Python实现

    暗通道算法DCP-Python实现

    南师大实验室安全准入知识供学习

    南师大实验室安全准入知识供学习

    纯openMV寻迹小车.zip

    纯openMV寻迹小车.zip

    【毕业设计】基于Java mvc架构开发的完整购物网站.zip

    【毕业设计】基于Java mvc架构开发的完整购物网站

    以下是针对初学者的 **51单片机入门教程**,内容涵盖基础概念、开发环境搭建、编程实践及常见应用示例,帮助你快速上手

    以下是针对初学者的 **51单片机入门教程**,内容涵盖基础概念、开发环境搭建、编程实践及常见应用示例,帮助你快速上手。

    springboot医院信管系统--.zip

    springboot医院信管系统--

Global site tag (gtag.js) - Google Analytics