`
phinecos
  • 浏览: 351754 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

深入剖析SolrCloud(二)

    博客分类:
  • Java
 
阅读更多

上一篇介绍了SolrCloud的基本概念,从这一篇开始我将深入到其实现代码中进行剖析。

SolrCloud最重要的一点就是引入了ZooKeeper来统一管理各种配置和状态信息。zookeeper是一个开源分布式的服务,它提供了分布式协作,分布式同步,配置管理等功能. 其实现的功能与google的chubby基本一致.zookeeper的官方网站已经写了一篇非常经典的概述性文章,请大家参阅:ZooKeeper: A Distributed Coordination Service for Distributed Applications.

        上一篇的示例中是在启动每个solr服务器前,内嵌启动了一个Zookeeper服务器,再将这几台Zookeeper服务器组成一个集群,确保Solr集群信息的高可用性和容错性。

      构建一个可用的Zookeeper集群,这就是SolrCloud要做的第一件工作。下面来看下SolrCloud是如何实现这一功能的:

1) 首先在web.xml中配置了一个filter

<filter>
    <filter-name>SolrRequestFilter</filter-name>
    <filter-class>org.apache.solr.servlet.SolrDispatchFilter</filter-class>
</filter>

  在web容器启动时会去加载并初始化SolrDispatchFilter这个filter,它的init方法会被调用,这个方法中做的最主要的事情是初始化一个Solr核容器。

CoreContainer.Initializer init = createInitializer();
    // web.xml configuration
    this.pathPrefix = config.getInitParameter( "path-prefix" );
this.cores = init.initialize();

  2) 初始化Solr核容器时,首先找到solr的根目录,这个目录下最重要的是solr.xml这个配置文件,这个配置文件用于初始化容器中加载的各个solr核,如果没有提供solr.xml,则会启用默认的配置信息:

private static final String DEF_SOLR_XML ="<?xml version=\"1.0\" encoding=\"UTF-8\" ?>\n" +
          "<solr persistent=\"false\">\n" +
          "  <cores adminPath=\"/admin/cores\" defaultCoreName=\"" + DEFAULT_DEFAULT_CORE_NAME + "\">\n" +
          "    <core name=\""+ DEFAULT_DEFAULT_CORE_NAME + "\" shard=\"${shard:}\" instanceDir=\".\" />\n" +
          "  </cores>\n" +
          "</solr>";

  3) 初始化过程的其中一步就是初始化Zookeeper服务器,你可以选择单机的Zookeeper服务器,也可以构建Zookeeper集群,下面以集群为例进行代码分析。

if (zkRun != null) {
      zkServer = new SolrZkServer(zkRun, zookeeperHost, solrHome, hostPort);
      zkServer.parseConfig();
      zkServer.start();
      
      // set client from server config if not already set
      if (zookeeperHost == null) {
        zookeeperHost = zkServer.getClientString();
      }
}
  SolrZkServer类就是伴随solr启动的内嵌的Zookeeper服务器,首先来看parseConfig方法,它负责解析zoo.cfg文件,读取Zookeeper启动时所需要的配置信息,这些配置信息由SolrZkServerProps类表示,

首先设置Zookeeper存储数据的目录

if (zkProps == null) {
      zkProps = new SolrZkServerProps();
      // set default data dir
      // TODO: use something based on IP+port???  support ensemble all from same solr home?
      zkProps.setDataDir(solrHome + '/' + "zoo_data");
      zkProps.zkRun = zkRun;
      zkProps.solrPort = solrPort;
}

 然后读取zoo.cfg配置文件中的信息,为启动zookeeper服务器提供完整的配置信息,

props = SolrZkServerProps.getProperties(solrHome + '/' + "zoo.cfg");
      SolrZkServerProps.injectServers(props, zkRun, zkHost);
      zkProps.parseProperties(props);

  下面是一个示例配置文件:

tickTime=2000
dataDir=/var/zookeeper/
clientPort=2181
initLimit=5
syncLimit=2
server.1=zoo1:2888:3888
server.2=zoo2:2888:3888
server.3=zoo3:2888:3888
  注意,server.x这些行就指明了zookeeper集群所包含的机器名称,每台Zookeeper服务器会使用3个端口来进行工作,其中第一个端口(端口1)用来做运行期间server间的通信,第二个端口(端口2)用来做leader election,另外还有一个端口(端口0)负责接收客户端请求。那么一台机器怎样确定自己是谁呢?这是通过dataDir目录下的myid文本文件确定。myid文件只包含一个数字,内容就是所在Server的ID:QuorumPeerConfig.myid。

1) 准备好集群所需要的配置信息后,就可以启动Zookeeper集群了。启动时是生成一个Zookeeper服务器线程,根据配置信息来决定是单机还是集群模式,如果是单机模式,则生成ZooKeeperServerMain对象并启动,如果是集群模式,则使用QuorumPeerMain对象启动。最后将服务器线程设置为Daemon模式,就完成了Zookeeper服务器的启动工作了。

public void start() {
        zkThread = new Thread() {
            @Override
            public void run() {
                try {
                    if (zkProps.getServers().size() > 1) {//zk集群
                        QuorumPeerMain zkServer = new QuorumPeerMain();
                        zkServer.runFromConfig(zkProps);
                        if (logger.isInfoEnabled()) {
                            logger.info("启动zk服务器集群成功");
                        }
                    } else {//单机zk
                        ServerConfig sc = new ServerConfig();
                        sc.readFrom(zkProps);
                        ZooKeeperServerMain zkServer = new ZooKeeperServerMain();
                        zkServer.runFromConfig(sc);
                        if (logger.isInfoEnabled()) {
                            logger.info("启动单机zk服务器成功");
                        }
                    }
                    logger.info("ZooKeeper Server exited.");
                } catch (Throwable e) {
                    logger.error("ZooKeeper Server ERROR", e);
                    throw new SolrException(SolrException.ErrorCode.SERVER_ERROR, e);                    
                }
            }
        };
        if (zkProps.getServers().size() > 1) {
            logger.info("STARTING EMBEDDED ENSEMBLE ZOOKEEPER SERVER at port " + zkProps.getClientPortAddress().getPort());
        } else {
            logger.info("STARTING EMBEDDED STANDALONE ZOOKEEPER SERVER at port " + zkProps.getClientPortAddress().getPort());            
        }
        
        zkThread.setDaemon(true);
        zkThread.start();
        try {
            Thread.sleep(500); // pause for ZooKeeper to start
        } catch (Exception e) {
            logger.error("STARTING ZOOKEEPER", e);
        }
    }

  为了验证集群是否启动成功,可以使用Zookeeper提供的命令行工具进行验证,进入bin目录下,运行:

zkCli.cmd –server zookeeper服务器地址1:端口

   这是连接到集群中1台Zookeeper服务器,然后创建一个ZNode,往其中加入一些数据,你再连接到集群中其他的服务器上,查看数据是否一致,即可知道Zookeeper集群是否已经构建成功。

 

 

 

作者:洞庭散人

出处:http://phinecos.cnblogs.com/    

本博客遵从Creative Commons Attribution 3.0 License,若用于非商业目的,您可以自由转载,但请保留原作者信息和文章链接URL。

0
0
分享到:
评论

相关推荐

    深入剖析NGINGX

    深入剖析NGINGX深入剖析NGINGX深入剖析NGINGX深入剖析NGINGX深入剖析NGINGX深入剖析NGINGX深入剖析NGINGX深入剖析NGINGX深入剖析NGINGX深入剖析NGINGX深入剖析NGINGX深入剖析NGINGX深入剖析NGINGX深入剖析NGINGX深入...

    《深入剖析 Tomcat》PDF版本下载.txt

    根据提供的文件信息,本文将对《深入剖析 Tomcat》这一资料进行详细的知识点解析。Tomcat作为一款开源的Servlet容器,被广泛应用于Java Web应用程序的部署与运行环境中。本资料旨在帮助读者深入了解Tomcat的工作原理...

    《深入剖析TOMCAT.pdf》(中文版,带目录)

    带目录的《深入剖析TOMCAT》中文版,带目录,便于大家阅读

    《计算的本质:深入剖析程序和计算机》_编程的本质_《计算的本质:深入剖析程序和计算机》_计算机_tunegua_

    《计算的本质:深入剖析程序和计算机》是一本深入探讨编程理论和计算机科学核心概念的书籍。作者通过使用 Ruby 语言的实例,使复杂的计算概念变得易于理解,旨在帮助读者掌握编程语言设计的基础知识。 首先,我们要...

    计算的本质:深入剖析程序和计算机(完整版 电子书 文字版)Tom Stuart

    《计算的本质:深入剖析程序和计算机》借助简单的Ruby代码示例,全面、深入地介绍计算理论和编程语言设计。作者注重实用性,在读者熟知的背景知识下,以明晰的可工作代码阐释了形式语义、自动机理论,以及通过lambda...

    全面深入剖析SaaS

    深入剖析SaaS之二: SaaS介绍 9 深入剖析SaaS之三: SaaS的特性 18 深入剖析SaaS之四: SaaS的好处 22 SaaS在中国抓住“长尾”需特殊商业模式 30 SaaS在中国的产生及发展 32 IBM博士孙伟:软件产业正经历裂变 SaaS渐成...

    tomcat深入剖析

    tomcat深入剖析tomcat深入剖析tomcat深入剖析tomcat深入剖析tomcat深入剖析tomcat深入剖析tomcat深入剖析

    linux深入剖析基于0.11

    linux深入剖析基于0.11linux深入剖析基于0.11linux深入剖析基于0.11

    Oracle11g体系结构深入剖析和运维管理(一)

    资源名称:Oracle 11g体系结构深入剖析和运维管理(一)资源目录:【】1_Oracle学习前奏【】2_Oracle软件安装准备工作【】3_Oracle软件安装和数据库的创建【】4_Oracle数据库及相关软件的启动和关闭【】5_计算机工作...

    内存管理深入剖析内存管理深入剖析内存管理深入剖析

    _内存管理深入剖析 第1章 内存初学者指南 计算机内存的类型: 长期或短期 计算机内存的发展 应用程序如何寻找内存 内存管理程序如何工作 典型问题 第2章 计算机如何看待内存 微处理器 INTEL微处理器系列的发展 内存...

    深入剖析TOMCAT_高清中文_带完整章节目录多版本

    《深入剖析Tomcat》是一本专门针对Java领域的Web服务器Tomcat进行深度解析的权威书籍。这本书以高清中文的形式呈现,包含完整的章节目录,旨在帮助读者全面理解和掌握Tomcat的内部工作原理及其在实际开发中的应用。...

    深入剖析Tomcat-高清-书签

    深入剖析Tomcat 高清带书签 深入剖析Tomcat 高清带书签

    Windows深入剖析(初始化篇).

    Windows深入剖析(初始化篇).Windows深入剖析(初始化篇).

    深入剖析TOMCAT中文版

    本书深入剖析Tomcat4和Tomcat5中的每个组件,并揭示其内部工作原理。通过学习本书,你将可以自行开发Tomcat组件,或者扩展已有的组件。Tomcat是目前比较流行的Web服务器之一。作为一个开源和小型的轻量级应用服务器...

    WindowsXP 深入剖析

    WindowsXP 深入剖析-王達時

    深入剖析Visual C++编程技术及应用实例

    《深入剖析Visual C++编程技术及应用实例》通过主流开发领域内的若干具有代表性的实例,向读者深入细致地讲解了利用Visual C++6.0进行Windows高级软件开发的相关技术。本书涉及的领域包括用户界面、文件系统、图形...

    Oracle11g体系结构深入剖析和运维管理(五)

    资源名称:Oracle 11g体系结构深入剖析和运维管理(五)资源目录:【】37_深入剖析事务槽及Oracle多种提交方式【】38_OracleIMU及RedoPrivateStrands技术【】39_读一致性(ORA-01555错误机制分析)及Undo表空间大小设置...

    深入剖析tomcat (完整目录)

    【深入剖析Tomcat——完整目录】 Tomcat是Apache软件基金会的Jakarta项目中的一个核心项目,是一个开源的、免费的Web应用服务器,主要用于运行Java Servlet和JavaServer Pages(JSP)。Tomcat以其轻量级、易用性...

    深入剖析Tomcat+源码

    《深入剖析Tomcat》是一本专注于Java Web服务器Tomcat的深度解析资料,包含了对Tomcat源码的细致分析。此资料包提供了多个文件,包括"深入剖析Tomcat源码.rar","深入剖析tomcat.pdf",以及"apache-tomcat-7.0.32-...

Global site tag (gtag.js) - Google Analytics