`
JLK
  • 浏览: 235753 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

solr一些概念

    博客分类:
  • solr
阅读更多

一、 醒目显示的查询参数1. q Solr 中用来搜索的查询。有关该语法的完整描述,请参阅 参考资料 中的 “Lucene QueryParser Syntax”。可以通过追加一个分号和已索引且未进行断词的字段(下面会进行解释)的名称来包含排序信息。默认的排序是 score desc,指按记分降序排序。 q=myField:Java AND otherField:developerWorks; date asc
此查询搜索指定的两个字段并根据一个日期字段对结果进行排序。

2. start
将初始偏移量指定到结果集中。可用于对结果进行分页。默认值为 0 start=15
返回从第 15 个结果开始的结果。

3. rows
返回文档的最大数目。默认值为 10 rows=25 

4. fq
提供一个可选的筛选器查询。查询结果被限制为仅搜索筛选器查询返回的结果。筛选过的查询由 Solr 进行缓存。它们对提高复杂查询的速度非常有用。 任何可以用 q 参数传递的有效查询,排序信息除外。

5. hl
hl=true 时,在查询响应中醒目显示片段。默认为 false。参看醒目显示参数上的 Solr Wiki 部分可以查看更多选项 hl=true 

6. fl
作为逗号分隔的列表指定文档结果中应返回的 Field 集。默认为 “*”,指所有的字段。“score” 指还应返回记分。 *,score 

二、对性能因素进行索引1. useCompoundFile 通过将很多 Lucene 内部文件整合到单一一个文件来减少使用中的文件的数量。这可有助于减少 Solr 使用的文件句柄数目,代价是降低了性能。除非是应用程序用完了文件句柄,否则 false 的默认值应该就已经足够。

2. mergeFactor
决定低水平的 Lucene 段被合并的频率。较小的值(最小为 2)使用的内存较少但导致的索引时间也更慢。较大的值可使索引时间变快但会牺牲较多的内存。

3. maxBufferedDocs
在合并内存中文档和创建新段之前,定义所需索引的最小文档数。段 是用来存储索引信息的 Lucene 文件。较大的值可使索引时间变快但会牺牲较多的内存。

4.maxMergeDocs
控制可由 Solr 合并的 Document 的最大数。较小的值 (< 10,000) 最适合于具有大量更新的应用程序。

5. maxFieldLength
对于给定的 Document,控制可添加到 Field 的最大条目数,进而截断该文档。如果文档可能会很大,就需要增加这个数值。然而,若将这个值设置得过高会导致内存不足错误。

6. unlockOnStartup unlockOnStartup
告知 Solr 忽略在多线程环境中用来保护索引的锁定机制。在某些情况下,索引可能会由于不正确的关机或其他错误而一直处于锁定,这就妨碍了添加和更新。将其设置为 true 可以禁用启动锁定,进而允许进行添加和更新。

三、智能缓存

1. filterCache
通过存储一个匹配给定查询的文档 id 的无序集,过滤器让 Solr 能够有效提高查询的性能。缓存这些过滤器意味着对 Solr 的重复调用可以导致结果集的快速查找。更常见的场景是缓存一个过滤器,然后再发起后续的精炼查询,这种查询能使用过滤器来限制要搜索的文档数。 可以预热

2. queryResultCache
为查询、排序条件和所请求文档的数量缓存文档 id 的有序 集合。 可以 预热

3. documentCache
缓存 Lucene Document,使用内部 Lucene 文档 id(以便不与 Solr 惟一 id 相混淆)。由于 Lucene 的内部 Document id 可以因索引操作而更改,这种缓存不能自热。 不可以预热

Named caches
命名缓存是用户定义的缓存,可被 Solr 定制插件 所使用。 可以,如果实现了 org.apache.solr.search.CacheRegenerator 的话。

四、请求处理

若现有的功能不能满足业务需求,Solr 允许应用程序实现其自身的请求处理功能。比如,您可能想要支持您自己的查询语言或想要将 Solr 与您的用户配置文件相集成来提供个性化的效果。SolrRequestHandler 接口定义了实现定制请求处理所需的方法。实际上,除了所使用的那些默认的标准请求处理程序之外,Solr 还定义了其他几个请求处理程序:

1.
默认的 StandardRequestHandler 使用 Lucene Query Parser 语法处理查询,添加了排序和层面浏览。

2. DisMaxRequestHandler
被设计用来通过更为简单的语法来跨多个 Field 进行搜索。它也支持排序(使用与标准处理程序稍有不同的语法)和层面浏览。

3. IndexInfoRequestHandler
可以检索有关索引的信息,比如索引中的文档数或 Field 数。

4.
请求处理程序是由请求中的 qt 参数指定的。Solr servlet 使用参数值来查找给定的请求处理程序并将输入用于请求处理程序的处理。请求处理程序的声明和命名通过 solrconfig.xml 中的 <requestHandler> 标记指定。要添加其他的内容,只需实现定制的 SolrRequestHandler 线程安全的实例即可,将其添加到 上述 定义好的 Solr,并将其包括到 如前所述 的类路径中,之后就可以通过 HTTP GET POST 方法开始向其发送请求了。


五、响应处理

与请求处理类似,也可以定制响应输出。必须要支持老式的搜索输出或必须要使用二进制或加密输出格式的应用程序可以通过实现 QueryResponseWriter 来输出所需的格式。然而,在添加您自己的 QueryResponseWriter 之前,需要先深入研究一下 Solr 所自带的实现,如表 4 所示:
XMLResponseWriter
这个最为常用的响应格式以 XML 格式输出结果,如 第 1 部分 的博客应用程序所示。
XSLTResponseWriter XSLTResponseWriter
XMLResponseWriter 的输出转换成指定的 XSLT 格式。请求中的 tr 参数指定了要使用的 XSLT 转换的名称。指定的转换必须存在于 Solr Home conf/xslt 目录。有关 XSLT Response Writer 的更多内容,请参见 参考资料。
JSONResponseWriter
JavaScript Object Notation (JSON) 格式输出结果。JSON 是一种简单、人类可读的数据转换格式,而且非常易于机器解析。
RubyResponseWriter RubyResponseWriter
是对 JSON 格式的扩展以便在 Ruby 中安全地使用结果。若有兴趣将 Ruby Solr 结合使用,可以参考 参考资料 中给出的到 acts_as_solr Flare 的链接。
PythonResponseWriter
JSON 输出格式的扩展以便在 Python eval 方法中安全地使用。

分享到:
评论

相关推荐

    solr概念介绍

    ### Solr概念与关键技术知识点详解 #### 一、Solr简介 - **Solr** 是一个高度可伸缩的企业级搜索引擎平台,支持多种语言,并且提供了丰富的API接口,包括REST风格的HTTP/XML和JSON API。它能够高效地处理大规模数据...

    solr服务器_solr_

    在Solr中,主要涉及以下几个核心概念: 1. **索引**:索引是Solr处理数据的基础,它是对文档进行预处理后的结果,用于快速查询。Solr使用倒排索引技术,将文档中的每个词映射到包含该词的文档列表,大大提高了搜索...

    solr的学习

    通过上述内容,我们不仅了解了 Solr 的基本概念、Solr 与 Lucene 的区别,还学习了如何安装和配置 Solr,以及如何使用 Solr 进行索引的创建和搜索。Solr 作为一款企业级的搜索引擎,凭借其强大的功能和灵活性,在...

    Solr项目源码及solr资源包

    7. **Solr核心概念**: - **Collection/Core**:Solr中的数据集,对应于数据库中的表,每个Core有自己的schema和配置。 - **Document**:索引的基本单位,类似于数据库中的记录。 - **Field**:文档中的属性,...

    solr入门java工程

    首先,让我们了解Solr的基本概念。Solr的核心功能是提供高效的全文检索、命中高亮、拼写检查、分类、 faceting(分面导航)和更多其他高级功能。它基于Lucene库,提供了更易用的API和配置方式,使得开发者可以快速...

    solr4.9开发所需jar包

    1. **Solr核心概念**:如集合(Collections)、索引、查询、请求处理器、过滤器等,这些都是构建搜索应用的基础。 2. **配置文件**:如`solrconfig.xml`和`schema.xml`,前者定义了Solr的行为,后者定义了字段类型...

    solr-7.1.0.zip solr搜索引擎安装包

    首先,我们来了解一下Solr的核心概念。Solr索引是用于快速搜索的文档集合,这些文档经过分词和分析,便于搜索。每个文档都有一个唯一的标识符(ID),并且可以包含多个字段,如标题、内容、作者等。Solr通过建立倒排...

    solr-4.10.3.rar

    Solr 4.10.3是一个稳定版本,它包含了之前版本的所有修复和改进,并可能引入了一些新的功能。在深入探讨这个版本之前,让我们先理解一下Solr的基本架构和工作原理。 1. **SolrCloud**:从4.0版本开始,Solr引入了...

    solr-dataimport-scheduler.jar 可使用于solr7.x版本

    在理解这个知识点之前,我们需要先了解Solr的基本概念以及数据导入处理(DataImportHandler,DIH)。 Apache Solr是一个开源的全文搜索引擎,它提供了高效、可扩展的搜索和分析功能。Solr能够对大量数据进行快速的...

    solr search

    在本文中,我们将深入探讨Solr的核心概念、关键特性以及如何使用Solr进行搜索。 一、Solr核心概念 1. 索引:Solr中的索引类似于数据库的索引,用于快速查找文档。它通过分词和建立倒排索引来实现高效的文本搜索。 2...

    solr课件还有安装原件

    在本套课件中,我们将深入探讨Solr的核心概念、安装配置以及Ik分词器的使用。 首先,让我们从"solr.docx"开始。这可能是一个包含Solr基础教程的文档,涵盖了Solr的基本概念,如索引、查询、优化和集群配置。Solr的...

    配置好的solr启动环境

    这些是Solr在实际应用中涉及的重要概念: 1. **同义词**:在Solr中,可以使用Solr的同义词扩展来处理词汇的同义关系。例如,"车"和"汽车"可以视为同义词,当用户搜索"车"时,也能匹配到包含"汽车"的文档。这通过...

    solr全文检索中需要用到的apache-solr-1.4.1.zip

    首先,我们来了解一下Solr的核心概念和主要特点: 1. **核心概念**: - **索引**:Solr通过建立倒排索引来加速查询,其中包含了文档ID和关键词之间的映射关系。 - **文档**:在Solr中,文档是信息的基本单元,...

    solr-6.6.0压缩包

    1. **Solr核心概念** - **索引**:Solr通过建立倒排索引来加速文本搜索,这是其高效查询的关键。 - **集合(Collections)与核心(Cores)**:集合是Solr中的逻辑数据分区,而核心是实际的数据存储和处理单元,每...

    solr文件下载即用

    1. **Solr的基本概念**: - **Solr核心(Core)**:是Solr处理数据的基本单元,每个核心包含自己的配置、索引和日志文件。 - **索引(Index)**:Solr通过构建索引来提高搜索效率,索引存储了文档的关键信息,便于...

    SOLR的应用教程

    **SOLR应用教程** **一、概述** ...这个SOLR应用教程涵盖了从基础概念到实际应用,包括安装配置、索引和搜索操作、SolrJ的使用以及性能优化等多个方面,为读者提供了一个全面了解和掌握Solr的路径。

    solr_开发入门例子

    本文将基于"solr_开发入门例子"这一主题,详细解释Solr的基础知识,包括其核心概念、安装配置、索引创建与查询,以及相关的开发工具。 1. **Solr核心概念** - **索引**: Solr通过建立倒排索引来实现快速全文检索。...

    solr项目和相关资源.rar

    压缩包可能提供了一些最佳实践或示例,帮助用户提升Solr的性能。 10. **监控与日志**:SolR提供了一套监控系统,可以通过Solr Admin界面查看索引状态、查询性能等信息。日志文件对排查问题和分析系统行为非常有帮助...

    solr教材-PDF版

    ### Solr教材知识点详解 ...以上是关于《solr教材-PDF版》的详细知识点介绍,涵盖了从Solr的基本概念到具体应用场景,再到性能调优等多个方面,旨在帮助读者全面了解和掌握Solr的核心技术和最佳实践。

Global site tag (gtag.js) - Google Analytics