最近一直在研究Solr的相关源代码,今天开始记录!
1.SolrCore启动
首先我们看solrcore的核心构造方法,如下:
public SolrCore(String name, String dataDir, SolrConfig config, IndexSchema schema, CoreDescriptor cd, UpdateHandler updateHandler, IndexDeletionPolicyWrapper delPolicy, SolrCore prev)
整个solrcore的初始化有这个构造方法完成,主要做了如下几件事情:
1):initDirectoryFactory()通过solrconfig.xml文件中<directoryFactory/>配置初始化directory工厂,如果没有配置默认则采用NRTCachingDirectoryFactory
2)获取solr索引根目录,配置在solrConfig.xml文件中
3) initListeners();初始化后监听器newSearcher。firstSearcher
4)initIndex():初始化Directory(NRTCachingDirectory)和indexfactory,其中对directory进行缓存
5)initWriters(),initQParsers();initValueSourceParsers(); initTransformerFactories();后续介绍
6)通过solrConfig文件初始化相关RequestHandler
7)getSearcher(false, false, null, true)初始化searcher(下面重点分析这个方法)
在solrcore的构造方法中有如下一段代码
// cause the executor to stall so firstSearcher events won't fire // until after inform() has been called for all components. // searchExecutor must be single-threaded for this to work searcherExecutor.submit(new Callable<Void>() { public Void call() throws Exception { latch.await(); return null; } });
这个有一段注解,大概意识是说:阻塞线程池,直到所有的组件都初始化完成前不执行firstSearcher这个事件,为什么要这样做了,和我们接下来要分析的getSearcher(false, false, null, true)这个方法有莫大的关系。
方法定义如下:
public RefCounted<SolrIndexSearcher> getSearcher(boolean forceNew, boolean returnSearcher, final Future[] waitSearcher, boolean updateHandlerReopens) forceNew:true表示强制创建searcher returnSearcher:true表示返回创建的searcher本质就是searcher引用加1
我们具体代码来分析,首先
if (_searcher!=null && !forceNew) { if (returnSearcher) { _searcher.incref(); return _searcher; } else { return null; } }在solrcore初始化的时候_searcher=null,根据上面提到的参数做相关的处理;
相关推荐
lucene&solr原理分析,lucene搜索引擎和solr搜索服务器原理分析。
Solr技术分析及运用主要涉及的是Apache Solr这一开源全文搜索引擎服务器的使用和配置。Solr基于Lucene,提供了一套高效、可扩展的搜索解决方案。以下是对Solr的详细说明: 1. Solr简介: - Solr是Java开发的搜索...
7. **分析链**:Solr的分析链允许用户自定义输入数据的预处理过程,如分词、标准化和过滤,这在处理不同语言和文本格式时非常有用。 8. **搜索性能优化**:Solr提供了多种优化手段,包括使用倒排索引、缓存策略、...
solr技术分析及运用超详细教程solr开发指南,包括solr服务器搭建,新增数据库配置,配置增量更新,配置分词器,常见异常,删除默认字段,调试技巧,solr日志,,solr基本查询语法,solr多字段匹配,solri集成solr...
6. **性能调优**:分析索引大小、硬件资源、网络延迟等因素对Solr性能的影响,以及如何通过调整配置参数来提升性能。 7. **日志和监控**:了解如何配置和使用Solr的日志系统,以及利用工具如Zabbix或Grafana来监控...
Solr-9.0.0是该软件的最新版本,此版本可能包含了一些新的特性和改进,比如性能优化、新的查询语法、更强大的分析器等。 在Solr-9.0.0的压缩包中,通常会包含以下组件: 1. **bin** 文件夹:这个目录下有启动和...
7. **contrib 目录**:包含了一些社区贡献的模块,如数据分析器、搜索组件和请求处理器等,这些可以扩展Solr的功能。 在Solr 8.11.1版本中,可能包含以下特性: - **性能优化**:Solr团队不断努力提升查询速度和...
通过分析Solr 6.2.0的源码,我们可以深入了解其内部工作机制,包括索引构建、查询处理、分布式协调等核心模块。源码中包含了丰富的注释和示例,帮助开发者深入理解Solr的设计思想和实现细节。 总结来说,Solr 6.2.0...
源码分析是深入理解一个软件系统工作原理的重要途径,对于Solr这样的复杂系统尤其如此。这里我们将围绕"solr-9.0.0-src.tgz"这个源码包,详细探讨其主要组成部分、核心功能以及开发过程中的关键知识点。 1. **Solr...
默认情况下,Solr使用标准查询分析器(Standard Query Parser),但有时我们可能需要针对特定字段定制查询行为,例如,处理特殊查询语法或执行精确匹配。这就是`match-query-parser`发挥作用的地方。 `match-query-...
Solr服务器是Apache Lucene项目的一个子项目,是一款开源的企业级搜索平台,专门用于处理大量文本数据的全文检索、搜索和分析。它基于Java开发,能够处理多种数据源,包括XML、JSON、CSV等,提供了高效、可扩展的...
Apache Solr 是一个开源的全文搜索引擎,广泛应用于各种企业级数据搜索和分析场景。增量更新是Solr的一个关键特性,它允许系统仅处理自上次完整索引以来发生更改的数据,从而提高了性能并降低了资源消耗。"apache-...
Solr 7.4.0版本引入了许多新特性,比如增强的查询分析器,支持更丰富的JSON查询语法,以及性能上的优化。此外,它还支持动态字段和字段类型,方便处理各种数据结构。SolrCloud模式允许你构建高可用和可扩展的搜索...
1. **Apache Solr**:Solr是一个开源的企业级全文搜索引擎,它提供了高效、可扩展的搜索和分析功能。它支持多种数据源,可以处理大量结构化和非结构化数据,提供快速的全文搜索、近实时搜索、富文本处理、地理位置...
- **新功能和模块**:例如,添加了对地理位置搜索的支持,增强了数据分析处理能力等。 2. **安装 Solr 4.4.0**: - 首先,你需要在 Linux 系统上下载并解压“solr-4.4.0.tgz”文件,可以使用 `tar -zxvf solr-...
由于描述中提到的PDF文档主要聚焦于Solr的内部架构分析和设计,我们可以从以下几个方面展开知识点的详细解释。 首先,从Solr源码架构分析设计角度来讲,内部设计是复杂且多层次的。这涉及到几个主要的组件和概念,...
6. **测试分词器**:最后,你可以通过Solr的分析界面(通常在`http://your-solr-url/admin/analysis.jsp`)输入文本,检查IK分词器是否正确工作。 在实际应用中,可能还需要根据具体需求调整分词策略,例如添加...
索引过程包括分析、字段处理、倒排索引等步骤,这些都使得Solr能够在大量数据中快速找到相关结果。查询时,Solr支持多种查询语法和过滤器,可以进行复杂查询和排序。 3. **配置与部署**:Solr的配置文件位于`conf`...