`

Solr源码掘金之 SolrCloud中的zookeeper使用分析

阅读更多

 

本文链接: http://quentinXXZ.iteye.com/blog/2149891

上一周,对公司搜索引擎工作流程的做改造工作。涉及到不同角色服务器之间的沟通工作。我们试图应用zookeeper到我们的场景,实现应用模块之间的解耦。本文深入到solr源码,从中掘金,看看solr是如何使用zookeeper的。

在做本次改造的时候,公司同事对于zookeeper的使用,提供了很好的建议,其中一个重要原则就是“谁创建,谁修改”,也就是各个服务应用自己创造自己的结点,自己去修改配置自己的最新状态。一般情况下,对结点的修改是结点的创建者,而不应该是其它对些结点数据的关注者,不然会增加操作复杂度与不确定性。

在阅读solr源码会发现,solrzookeeper的使用,使用的是另一种思想,虽然增加了复杂度,但更适用于cloud中各结点角色不确定的场景。

这里涉及的相关代码,主要在package org.apache.solr.cloud中。

 

说明

本人一开始阅读的是4.4的版本的代码,最新的是4.10.1, 后来简单看了一下最新代码,没有发现多少变动。

别看我在这里一本正经地给大家作源码分析,但毕竟一个人看,总有疏漏的地方,存在理解不当的地方,如果错误,请大家指正。

 

solrzookeeper中的结点





 

       1aliases.json colletion别名,另有妙用(solrcloudbuild search分离),以后再写博客说明。

2clusterstate.json  重要信息文件。包含了colletion ,shard replica的具体描述信息。

3live_nodes ,下面都是瞬时的zk结点,代表当前存活的solrcloud中的节点。

4overseer solrcloud中的重要角色。下面存有三个重要的分布式队列,代表待执行solrcloud相关的zookeeper操作的任务队列。collection-queue-work是存放与collection相关的特办操作,如createcollection reloadcollectioncreatealiasdeletealias splitshard 等。

5queue则存放了所有与collection无关的操作,例如deletecoreremovecollectionremoveshardleadercreateshardupdateshardstate,还有包括节点的状态(downactiverecovering)的变化。

6queue-work是一个临时队列,指正在处理中的消息。操作会先保存到/overseer/queue,在overseser进行处理时,被移到/overseer/queue-work中,处理完后消息之后在从/overseer/queue-work中删除。如果overseer中途挂了,新选举的overseer会选将/overseer/queue-work中的操作执行完,再去处理/overseer/queue中的操作。

注意:以上队列中存放的所有子结点,都是PERSISTENT_SEQUENTIAL类型的。

7overseer_elect ,用于overseer的选举工作

8colletcion,存放当前collection一些简单信息(主要信息都在clusterstate.json中)。 下面的leader_elect自然是用于collectionshard中副本集的leader选举的。

 

 

Overseer zk写流程

在看solrcloud的官方文档的时候,几乎也很少有overseer的这个角色的说明介绍。相信不少成功配置solrcloud的开发者,也没有意识到这个角色的存在。

Overseer,顾名思义,是一个照看全局的角色,做总控工作。体现在代码与zk的相关操作中,就是zookeeper中大多的写操作,是由overseer去处理的,并且维护好clusterstate.josnaliases.json这两个zk结点的内容。与我们“谁创建,谁修改”做法不同。由各个solr node发起的操作,都会publish/overseer结点下面相应的queue中去,再由overseer去些分布式队列中去取这些操作信息,做相应的zk修改,并将整个solrcloud中相关的具体状态信息,更新到cluseterstate.json中去,最终会将个操作,从queue中删除,表示完成操作。

以一个solr node将自身状态标记为down为例。该node会将这种“stateoperation的相关信息,publish/overseer/queue中。由Overseer去从中取得这个操作,然后将node statedown的信息写入clusterstate.json。最后删除queue中的这个结点。

当然overseer这个角色,是利用zookeepersolrcloud中内部选举出来的。

 

一般的zk读操作

  Solr将最重要且信息最全面的内容都放在了cluseterstate.json中。这样做减少了,普通solr node需要关注的zk 结点数。除了clusterstate.json,普通的solr node在需要当前collection整体状态的时候,还会获取zk/live_nodes中的信息,根据live_nodes中的信息,得知collection存活的node, 再从clusterstate.json获得这些node的信息。

 这种处理,其实也好理解。假如一个solr node非正常下线,clusterstate.json中不一定会有变化,但/live_nodes中这个node对应的zk结点就消失了(因为是瞬时的)。

 

总结

看过这部份原码后,跟同事讨论了一下。Solrzookeeper的这种使用方法,比角色分明集群系统,确实复杂得多。但solr为达到群集自感知,高可用,最终形成cloud的效果,内部的角色是动态变化的,所以大家需要一个统一管理的角色。而使用分布式队列,由一个overseer统一处理操作的好处,在于保证了操作的有序,这点也很重要。将最要信息集中在clusterstate.json的作法,减少了其他solr nodezk的关注逻辑的复杂度。

 

  • 大小: 21.1 KB
3
1
分享到:
评论

相关推荐

    solrcloud5结合zookeeper应用视频教程

    solrcloud5结合zookeeper搭建、使用详解,是一部难得的好教程

    solrCloud5.2.1 + tomcat7 + zookeeper3.4.6

    在实际应用中,你需要根据业务需求和硬件资源来决定Tomcat和Solr实例的数量,以及Zookeeper集群的规模。同时,不要忘记对Solr的配置文件(如`solrconfig.xml`和`schema.xml`)进行相应的调整,以满足特定的搜索需求...

    solr_v440_5001+zookeeper2181

    在SolrCloud中,ZooKeeper的角色至关重要,它监控Solr节点的状态,管理索引分片的分布,以及在节点之间进行故障转移。 部署SolrCloud的步骤大致如下: 1. **安装ZooKeeper**:首先,我们需要部署一个稳定的...

    solrcloud-zookeeper-docker:在Docker环境中运行Solrcloud和Zookeeper

    该项目旨在帮助在Docker环境中尝试最新版本SolrCloud(和Zookeeper)的开发人员和新手。 此项目的版本完全基于较新的Solr和Zookeeper官方图像。 先决条件 Mac-OS或Linux环境 泊坞窗最新版本- 多克尔-撰写最新...

    solrcloud与zookeeper

    ### SolrCloud与Zookeeper深度解析 #### 一、Zookeeper概述 Zookeeper是一个高性能、分布式的、开源的分布式应用协调服务。它提供了一系列简单原始的功能,这些功能可以帮助分布式应用程序实现更高级的服务,例如...

    solrcloud-zookeeper-kubernetes:在Kubernetes环境中运行Solrcloud和Zookeeper

    该项目旨在帮助在Kubernetes环境中尝试使用最新版本的SolrCloud(和Zookeeper)的开发人员和新手。 在这里,您将发现基本上两种不同的配置: 一个(或多个)Solr实例和一个Zookeeper配置为“独立”节点 一个(或多...

    solr-6.2.0源码

    5. 改进了Zookeeper集成:提升了SolrCloud模式下的集群管理能力。 四、源码解析 通过分析Solr 6.2.0的源码,我们可以深入了解其内部工作机制,包括索引构建、查询处理、分布式协调等核心模块。源码中包含了丰富的...

    集群搭建(zookeeper集群+solr集群)

    1. **配置管理**:所有SolrCloud实例共享同一套配置信息,这些配置存储在Zookeeper中,便于管理和更新。 2. **集群协调**:Zookeeper负责监控SolrCloud集群的状态,包括节点的加入和离开,以及节点的状态变化等。当...

    solr6.6.0源码

    在Solr 6.6.0中,SolrCloud提供了分布式搜索和管理能力。它依赖于ZooKeeper进行集群管理和数据分配。ZooKeeper负责节点的注册、状态监控、分片分配和领导者选举等任务。 五、优化与性能 1. **缓存机制**:Solr包含...

    zookeeper-solr集群

    操作系统选择的是Linux,而Solr服务使用的是版本4.8.1,与之配合的Tomcat服务器是7.0.54版本,同时还需要Zookeeper服务器,这里选择的是3.4.6版本。Zookeeper在SolrCloud中起到关键作用,它是集群中的协调者,负责...

    lucene-solr源码,编译成的idea项目源码

    本人用ant idea命令花了214分钟,35秒编译的lucene-solr源码,可以用idea打开,把项目放在D:\space\study\java\lucene-solr路径下,再用idea打开就行了

    SolrCloud集群搭建和使用步骤

    - **创建集合**:在ZooKeeper中定义集合的分区策略、复制因子等参数,创建索引的数据分布模型。 - **数据上传**:使用Solr提供的工具或者API将数据导入到SolrCloud,可能涉及Shard分配和副本同步。 - **查询与...

    solrcloud 高可用集群搭建

    SolrCloud高可用集群搭建是实现大规模、分布式搜索引擎的关键步骤,它通过集成Zookeeper来管理和协调各个Solr节点,确保数据的一致性和可用性。在搭建过程中,我们需要遵循一定的步骤和配置,以下是一些关键的知识点...

    solr4.9+tomcat+zookeeper集群

    6. **创建并分发索引**: 在Zookeeper中创建新的索引集合,Solr会自动将它们分片和复制到各个节点。 五、Solr 4.9集群的管理和监控 1. **Solr Admin UI**: 使用内置的Web管理界面,可以查看集群状态、创建和管理索引...

    solr 数据迁移工具

    使用多线程方式 通过solrj 接口向solr新增索引信息

    solr源码及文档

    solr全文检索,里面包含文档,源代码,jar包,使用的是solr4.2,东西比较全,安装文档就能跑起来,,适合参考借鉴

    Solr4+SolrCloud安装使用手册和详细说明,参考官方文档整理.

    Solr 是一个基于 Lucene 的全文检索服务器,用于构建企业级搜索应用。...安装过程中,需正确配置 Solr Home、上传配置到 ZooKeeper 并创建和管理集合。持续优化和监控是确保 SolrCloud 高效稳定运行的关键。

    ZooKeeper实例 + Solr(tomcat)集群部署

    从Oracle官方网站下载JDK安装包,本例中使用的是JDK 7,解压后配置环境变量,确保Solr和Tomcat能够正确识别Java路径。 2. **安装Solr与Tomcat**:在安装了JDK的环境下,下载Solr的最新版本并解压,同时确保Tomcat也...

    solrcloud windows 环境搭建

    1. **集中式配置管理**:所有配置信息集中存储于Zookeeper中,便于统一管理和维护。 2. **自动容错机制**:支持自动检测并恢复故障节点,确保服务的连续性和稳定性。 3. **近实时搜索**:能够实现近乎实时的数据更新...

Global site tag (gtag.js) - Google Analytics