solr5和solr6相同集群共存冲突解决

mozhenghua

浏览: 328226 次
性别:
来自: 杭州

最近访客更多访客>>

huang_love_ok

wang_eye

贝铃-Turing

joechl

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

solr

solr 版本冲突

问题背景

公司内部从2015年9月开始部署了Solr5.3 搜素引擎服务，到今年年初Solr的版本已经发展到了Solr6.x，无奈开源社区的发张的确很快，因为Solr6服务端整合了Facebook的prestodb数据库的Sql解析引擎（ http://prestodb-china.com/），可以让Solr6服务端支持简单的sql语句查询，一时间搜索引擎可以支持Sql语句查询，虽然目前只能支持很简单的单表查询语句和集中功能简单的聚合查询，总之Solr在nosql DB方面走出了坚实的一步。更加方便的是Solrj代码包中提供了一个实现了jdbc接口的API包，这样使得一般的开发工程师可以轻松编写基于搜索引擎的查询操作。

这么好的功能我们当然是尝试用一下的，所以当时以很快的速度在老版本Solr集群之上部署了新Solr6的collection，不过没有过多久发现了一个严重的问题。问题是，当调用类似以下API会出现问题：

http://10.1.5.19:8080/solr/admin/collections?action=CREATE&name=collection1

当调用admin/collections的API 来向集群提交一个创建新Collection的请求的时候，操作往往会超时，报序列化异常相关的异常，无论通过这个api创建的collection是solr5还是solr6的都会有问题，不能能成功创建。

其他几个api也无一例外的有这样的问题。比如：

curl 'http://localhost:8080/solr/admin/collections?action=DELETE&name=search4totalpay'

原因分析

找原因的时候，很容易联想到是不是因为在原本只有solr5节点的集群中添加了版本为solr6的节点呢？最后看了一堆代码之后发现的确是因为在老集群中。

先来看一幅执行“/admin/collections” api的集群调用流程图，如下：

集群创建collection流程说明：

对solr集群任何一个节点发起/admin/collections?action=CREATE 这样的API请求(对应处理类：org.apache.solr.handler.admin.CollectionsHandler)，
节点收收到请求之后，向zookeeper中写一个临时节点，节点内容是这次执行任务的内容（格式为json）,在OverseerCollectionProcessor中的run() 方法中执行，最终执行任务会代理到org.apache.solr.cloud.OverseerCollectionProcessor.Runner 类上执行。
上图中背景标注为黄色的节点（该节点为监工节点，是由所有节点竞争出来的）认领zookeeper临时节点的任务，
监工（overseer）节点执行该节点中的任务，当action=CREATE时，就是向其他节点再分发创建collection replic节点的命令了,对应该的命令路径为“/admin/cores”
等到所有replic都创建成功之后，有overseer节点再向zookeeper中写一个执行成功的标记，最终用户就能感知到本次任务已经执行成功了（当然该任务的执行也能够通过异步的方式来执行）

到此，问题的关键点就明白了，关键在第二和第三步，由solr6向solr5节点（高版本节点向低版本）发送/admin/collections 这类请求是存在问题，Solr API在向前兼容上存在问题，但是测试中发现由solr5向solr6发送请求是没有问题，也就是Solr向后兼容没有问题

解决之法：

了解了问题点，现在就能着手解决了。很简单，只需要在Solr6引擎节点启的时候，将Solr6节点参与Overseer角色竞争的流程去掉，让Solr6节点没有机会成为Overseer角色，要达到这个目的，先要了解一下Overseer竞选相关的代码结构。

先看以下类图：

ZkController初始化时，会初始化LeaderElector对象，LeaderElector会将本地节点信息预先写到/overseer_elect/election 节点下参与leader竞选。solr有两种场景需要竞选Leader，一种是上面说到的集群监工负责执行提交给cloud任务，另外一个是执行share内master任务的节点。

执行逻辑分别被封装在OverseerElectionContext 和ShardLeaderElectionContextBase中。

需要修改的点是，ZkController中init()方法中：

 private void init(CurrentCoreDescriptorProvider registerOnReconnect) {
    try {
      createClusterZkNodes(zkClient);
      zkStateReader.createClusterStateWatchersAndUpdate();
      // start the overseer first as following code may need it's processing
      if (!zkRunOnly) {
    //▼▼▼▼▼▼20161022 baisui add for solr6和solr5的节点在同一个集群中，solr的节点会抢overseer的角色但是执行不正常所以就把它抢overseer的
    // 的功能去掉，这样overseer的角色只会有solr5的节点抢夺到
        overseerElector = new LeaderElector(zkClient){

			@Override
			public int joinElection(ElectionContext context, boolean replacement)
					throws KeeperException, InterruptedException, IOException {
				return 0;
			}
			@Override
			public int joinElection(ElectionContext context, boolean replacement, boolean joinAtHead)
					throws KeeperException, InterruptedException, IOException {
				return 0;
			}
			@Override
			void retryElection(ElectionContext context, boolean joinAtHead)
					throws KeeperException, InterruptedException, IOException {
			}
        };
        //▲▲▲▲▲▲
        this.overseer = new Overseer(cc.getShardHandlerFactory().getShardHandler(), cc.getUpdateShardHandler(),
            CommonParams.CORES_HANDLER_PATH, zkStateReader, this, cloudConfig);
        ElectionContext context = new OverseerElectionContext(zkClient,
            overseer, getNodeName());
        overseerElector.setup(context);
        overseerElector.joinElection(context, false);
      }

      Stat stat = zkClient.exists(ZkStateReader.LIVE_NODES_ZKNODE, null, true);
      if (stat != null && stat.getNumChildren() > 0) {
        publishAndWaitForDownStates();
      }

      // Do this last to signal we're up.
      createEphemeralLiveNode();
    } catch (IOException e) {
      log.error("", e);
      throw new SolrException(SolrException.ErrorCode.SERVER_ERROR,
          "Can't create ZooKeeperController", e);
    } catch (InterruptedException e) {
      // Restore the interrupted status
      Thread.currentThread().interrupt();
      log.error("", e);
      throw new ZooKeeperException(SolrException.ErrorCode.SERVER_ERROR,
          "", e);
    } catch (KeeperException e) {
      log.error("", e);
      throw new ZooKeeperException(SolrException.ErrorCode.SERVER_ERROR,
          "", e);
    }

  }

如上只需要重载LeaderElector的三个方法，joinElection()，retryElection()在方法体中什么事儿都不干就能让Solr节点竞选集群监工的流程去掉了。

总结

至此，Solr5和Solr6 可以在一个Zookeeper域中共存，正常执行了。当然，最简单的办法是，另外启一个zk集群，把solr6的索引完全放到一个独立的集群中去，但是这样无形中增加了集群维护成本，得不偿失。

查看图片附件

分享到：

Solr /export 海量数据导出实现 | 编写hive udf

2016-11-04 12:41
浏览 2009
评论(0)
分类:互联网
查看更多

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

2024大数据生态技术介绍: - **优势**：提高了Hadoop集群的利用率和灵活性，支持多种计算框架共存。 6. **Hive**： - **功能**：一种数据仓库工具，用于查询和管理Hadoop中的结构化数据。 - **特点**：提供SQL-like查询语言HQL，使得处理...

FPGA电机控制方案解析：基于Verilog与Nios2的软硬协同设计: 内容概要：本文详细介绍了基于FPGA的电机控制系统设计方案，重点探讨了Verilog和Nios2软核的协同工作。系统通过将底层驱动（如编码器处理、坐标变换、SVPWM生成等）交给Verilog实现，确保实时性和高效性；同时，复杂的算法（如Park变换、故障保护等）则由Nios2处理。文中展示了多个具体实现细节，如四倍频计数、定点数处理、查表法加速、软硬件交互协议等。此外，还讨论了性能优化方法，如过调制处理、五段式PWM波形生成以及故障保护机制。适合人群：具备一定FPGA和嵌入式系统基础知识的研发人员，尤其是从事电机控制领域的工程师。使用场景及目标：适用于希望深入了解FPGA在电机控制中的应用，掌握软硬件协同设计方法，提高系统实时性和效率的技术人员。目标是通过学习本方案，能够独立设计并实现高效的电机控制系统。其他说明：本文不仅提供了详细的代码片段和技术细节，还分享了许多实践经验，如调试技巧、常见错误及其解决办法等。这对于实际工程项目非常有帮助。

模拟太阳系、轨道进动、时间延迟、光线偏折、黑洞阴影、星团以及航天器轨迹 matlab代码.rar: 1.版本：matlab2014/2019a/2024a 2.附赠案例数据可直接运行matlab程序。 3.代码特点：参数化编程、参数可方便更改、代码编程思路清晰、注释明细。 4.适用对象：计算机，电子信息工程、数学等专业的大学生课程设计、期末大作业和毕业设计。

计算机数控(CNC)装置.pdf: 计算机数控(CNC)装置.pdf

西门子PLC与TiA博途实现冷热水恒压供水系统的变频器控制及多参数调控: 内容概要：本文详细介绍了使用西门子PLC和TiA博途软件构建冷热水恒压供水系统的具体方法和技术要点。主要内容涵盖变频器控制、模拟量输入输出处理、温度控制、流量计算控制及配方控制等方面。文中不仅提供了具体的编程实例，如LAD和SCL语言的应用，还分享了许多实用的经验和技巧，例如模拟量处理中的滤波方法、PID控制的优化策略、流量计算的高精度算法等。此外，针对实际应用中的常见问题，如信号干扰和参数整定，作者也给出了有效的解决方案。适合人群：从事自动化控制系统开发的技术人员，尤其是对西门子PLC和TiA博途有一定了解并希望深入掌握冷热水恒压供水系统设计的专业人士。使用场景及目标：适用于工业环境中需要精确控制水压、温度和流量的冷热水供应系统的设计与维护。主要目标是帮助工程师理解和实施基于西门子PLC和TiA博途的冷热水恒压供水系统，提高系统的稳定性和效率。其他说明：文中提到的实际案例和编程代码片段对于初学者来说非常有价值，能够加速学习进程并提升实际操作能力。同时，关于硬件配置的选择建议也为项目规划提供了指导。

基于PLC的自动蜂窝煤生产线五传送带控制系统设计与实现: 内容概要：本文详细介绍了基于PLC（可编程逻辑控制器）的自动蜂窝煤生产线中五条传送带的控制系统设计。主要内容涵盖IO分配、梯形图程序编写、接线图原理图绘制以及组态画面的设计。通过合理的IO分配，确保各个输入输出点正确连接；利用梯形图程序实现传送带的启动、停止及联动控制；接线图确保电气连接的安全性和可靠性；组态画面提供人机交互界面，便于操作员远程监控和操作。此外，还分享了一些实际调试中的经验和教训，如传感器安装位置、硬件接线注意事项等。适合人群：从事自动化控制领域的工程师和技术人员，尤其是对PLC编程和工业自动化感兴趣的读者。使用场景及目标：适用于需要设计和实施自动化生产线的企业和个人。目标是提高生产线的自动化程度，减少人工干预，提升生产效率和产品质量。其他说明：文中提到的具体实例和代码片段有助于读者更好地理解和掌握相关技术和方法。同时，强调了硬件和软件相结合的重要性，提供了实用的调试技巧和经验总结。

自动驾驶仿真中OpenScenario XML语法与场景构建详解: 内容概要：本文详细介绍了OpenScenario场景仿真的结构及其应用，特别是通过具体的XML代码片段解释了各个参数的作用和配置方法。文中提到的思维导图帮助理解复杂的参数关系，如Storyboard、Act、ManeuverGroup等层级结构，以及它们之间的相互作用。同时，文章提供了多个实用案例，如跟车急刹再加速、变道场景等，展示了如何利用这些参数创建逼真的驾驶场景。此外，还特别强调了一些常见的错误和解决方法，如条件触发器的误用、坐标系转换等问题。适用人群：从事自动驾驶仿真研究的技术人员，尤其是对OpenScenario标准有一定了解并希望深入掌握其应用场景的人。使用场景及目标：适用于需要精确控制交通参与者行为的自动驾驶仿真项目，旨在提高开发者对OpenScenario的理解和运用能力，减少开发过程中常见错误的发生。其他说明：文章不仅提供了理论指导，还包括大量实践经验分享，如调试技巧、参数优化等，有助于快速解决问题并提升工作效率。

基于Maxwell仿真的30kW自启动永磁同步电机6极72槽设计方案及性能优化: 内容概要：本文详细介绍了30kW、1000rpm、线电压380V的自启动永磁同步电机的6极72槽设计方案及其性能优化过程。首先，通过RMxprt进行快速建模，设定基本参数如电机类型、额定功率、速度、电压、极数和槽数等。接着，深入探讨了定子冲片材料选择、转子结构设计、绕组配置以及磁密波形分析等方面的技术细节。文中特别强调了双层绕组设计、短距跨距选择、磁密波形优化、反电势波形验证等关键技术手段的应用。此外，还讨论了启动转矩、效率曲线、温升控制等方面的优化措施。最终，通过一系列仿真和实测数据分析，展示了该设计方案在提高效率、降低谐波失真、优化启动性能等方面的显著成果。适合人群：从事电机设计、电磁仿真、电力电子领域的工程师和技术人员。使用场景及目标：适用于希望深入了解永磁同步电机设计原理及优化方法的专业人士，旨在为类似项目的开发提供参考和借鉴。其他说明：文章不仅提供了详细的参数设置和代码示例，还分享了许多实践经验，如材料选择、仿真技巧、故障排除等，有助于读者更好地理解和应用相关技术。

基于S7-1200 PLC和WinCC的燃油锅炉控制系统设计与实现: 内容概要：本文详细介绍了如何使用S7-1200 PLC和WinCC搭建一个完整的燃油锅炉自动控制系统。首先明确了系统的IO分配，包括数字量输入输出和模拟量输入输出的具体连接方式。接着深入讲解了梯形图编程的关键逻辑，如鼓风机和燃油泵的联锁控制、温度PID调节等。对于接线部分，强调了强电弱电线缆分离以及使用屏蔽线的重要性。WinCC组态方面，则着重于创建直观的操作界面和有效的报警管理。此外，还分享了一些调试技巧和常见问题的解决方案。适合人群：从事工业自动化领域的工程师和技术人员，尤其是对PLC编程和SCADA系统有一定了解的人群。使用场景及目标：适用于需要构建高效稳定的燃油锅炉控制系统的工业环境，旨在提高系统的可靠性和安全性，降低故障率并提升工作效率。其他说明：文中提供了丰富的实践经验，包括具体的硬件选型、详细的程序代码片段以及实用的故障排查方法，有助于读者快速掌握相关技能并在实际工作中应用。

电力电子领域中逆变器输出纹波电流预测与变开关频率PWM控制的Simulink仿真: 内容概要：本文详细探讨了逆变器输出纹波电流的来源及其对系统稳定性的影响，并提出了一种基于变开关频率PWM控制策略的解决方案。文中首先分析了纹波电流产生的原因，包括开关元件的导通关断、电感电流的非理想特性和电源电压波动。接着介绍了变开关频率PWM控制的基本原理，通过实时调整开关频率来优化纹波电流和开关损耗之间的平衡。随后，利用傅里叶变换建立了纹波电流预测模型，并通过Simulink仿真模型进行了验证。仿真结果显示，变开关频率控制能够显著减小纹波电流的幅值，提高系统的稳定性和效率。此外，文章还提供了具体的MATLAB/Simulink建模步骤以及一些优化建议，如提高开关频率上限、采用低纹波PWM算法和增加电感电流反馈。适合人群：从事电力电子系统设计和优化的研究人员和技术人员，尤其是关注逆变器性能提升的专业人士。使用场景及目标：适用于需要优化逆变器输出质量、提高系统稳定性和效率的应用场合。目标是通过变开关频率PWM控制策略，解决传统固定开关频率控制中存在的纹波电流大、效率低等问题。其他说明：文章不仅提供了理论分析，还包括详细的仿真建模指导和优化建议，有助于读者更好地理解和应用相关技术。同时，文中提到的一些实用技巧和注意事项对于实际工程应用具有重要参考价值。

数据结构领域中平衡树的原理及其应用解析: 内容概要：本文详细介绍了平衡树的基本概念、发展历程、不同类型（如AVL树、红黑树、2-3树）的特点和操作原理。文中解释了平衡树如何通过自平衡机制克服普通二叉搜索树在极端情况下的性能瓶颈，确保高效的数据存储和检索。此外，还探讨了平衡树在数据库索引和搜索引擎等实际应用中的重要作用，并对其优缺点进行了全面分析。适合人群：计算机科学专业学生、软件工程师、算法爱好者等对数据结构有兴趣的人群。使用场景及目标：帮助读者理解平衡树的工作原理，掌握不同类型平衡树的特点和操作方法，提高在实际项目中选择和应用适当数据结构的能力。其他说明：本文不仅涵盖了理论知识，还包括具体的应用案例和技术细节，旨在为读者提供全面的学习资料。

计算机三级网络技术机试100题和答案.pdf: 计算机三级网络技术机试100题和答案.pdf

LabVIEW与YOLOv5结合：基于ONNX Runtime的多模型并行推理DLL封装及工业应用: 内容概要：本文详细介绍了将YOLOv5模型集成到LabVIEW环境中进行目标检测的方法。作者通过C++封装了一个基于ONNX Runtime的DLL，实现了YOLOv5模型的高效推理，并支持多模型并行处理。文中涵盖了从模型初始化、视频流处理、内存管理和模型热替换等多个方面的具体实现细节和技术要点。此外，还提供了性能测试数据以及实际应用场景的经验分享。适合人群：熟悉LabVIEW编程，有一定C++基础，从事工业自动化或计算机视觉相关领域的工程师和技术人员。使用场景及目标：适用于需要在LabVIEW环境下进行高效目标检测的应用场景，如工业质检、安防监控等。主要目标是提高目标检测的速度和准确性，降低开发难度，提升系统的灵活性和扩展性。其他说明：文中提到的技术方案已在实际项目中得到验证，能够稳定运行于7x24小时的工作环境。GitHub上有完整的开源代码可供参考。

逻辑回归ex2-logistic-regression-ex2data1: 逻辑回归ex2-logistic-regression-ex2data1

MATLAB仿真单相高功率因数整流器：单周期控制与优化实践: 内容概要：本文详细介绍了使用MATLAB/Simulink搭建单相高功率因数整流器仿真的全过程。作者通过单周期控制（OCC）方法，使电感电流平均值跟随电压波形，从而提高功率因数。文中涵盖了控制算法的设计、主电路参数的选择、波形采集与分析以及常见问题的解决方案。特别是在控制算法方面，通过动态调整占空比，确保系统的稳定性，并通过实验验证了THD低于5%，功率因数达到0.98以上的优异性能。适合人群：电力电子工程师、科研人员、高校师生等对高功率因数整流器仿真感兴趣的读者。使用场景及目标：适用于研究和开发高效电源转换设备的技术人员，旨在通过仿真手段优化整流器性能，降低谐波失真，提高功率因数。其他说明：文章提供了详细的代码片段和调试经验，帮助读者更好地理解和应用单周期控制技术。同时提醒读者注意仿真与实际硬件之间的差异，强调理论计算与实际调试相结合的重要性。

计算机设备采购合同.pdf: 计算机设备采购合同.pdf

计算机三级网络技术考试资料大全.pdf: 计算机三级网络技术考试资料大全.pdf

基于Simulink的燃料电池系统建模与先进控制策略研究: 内容概要：本文详细介绍了如何在Simulink中构建质子交换膜燃料电池（PEMFC）和固体氧化物燃料电池（SOFC）的仿真模型及其控制策略。主要内容涵盖各子系统的建模方法，如气体流道、温度、电压、膜水合度等模块的具体实现细节；探讨了几种先进的控制算法，包括模糊PID、自抗扰控制（ADRC）、RBF神经网络PID以及它们的应用场景和优势；并通过具体案例展示了不同控制器在处理复杂工况时的表现差异。此外，文中还分享了一些实用技巧，如避免模型参数调校中的常见错误、提高仿真的稳定性和准确性。适合人群：从事燃料电池研究与开发的专业人士，尤其是具有一定Matlab/Simulink基础的研究人员和技术工程师。使用场景及目标：帮助读者掌握燃料电池系统建模的基本流程和技术要点，理解各种控制算法的特点及其应用场景，从而能够独立完成相关项目的开发与优化工作。其他说明：文章提供了大量MATLAB代码片段作为实例支持，便于读者理解和实践。同时强调了理论联系实际的重要性，在介绍每种技术时均结合具体的实验数据进行分析讨论。

IMX662 sensor原理图: IMX662 sensor板原理图.dsn参考资料

数据结构解析：线性表顺序表示的原理、操作及应用: 内容概要：本文详细介绍了线性表及其顺序表示的概念、原理和操作。线性表作为一种基础数据结构，通过顺序表示将元素按顺序存储在连续的内存空间中。文中解释了顺序表示的定义与原理，探讨了顺序表与数组的关系，并详细描述了顺序表的基本操作，包括初始化、插入、删除和查找。此外，文章分析了顺序表的优点和局限性，并讨论了其在数据库索引、图像处理和嵌入式系统中的实际应用。最后，对比了顺序表和链表的性能特点，帮助读者根据具体需求选择合适的数据结构。适合人群：计算机科学专业的学生、软件开发人员以及对数据结构感兴趣的自学者。使用场景及目标：①理解线性表顺序表示的原理和实现；②掌握顺序表的基本操作及其时间复杂度；③了解顺序表在实际应用中的优势和局限性；④学会根据应用场景选择合适的数据结构。其他说明：本文不仅提供了理论知识，还附带了具体的代码实现，有助于读者更好地理解和实践线性表的相关概念和技术。

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论