`
hankesi2000
  • 浏览: 96639 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

SOLR优化-filter cache

阅读更多
原文链接:http://java.dzone.com/news/merge-policy-internals-solr?mz=33057-solr_lucene

今天我们关注一个solr的cache类型:filter cache。接下来,我会解释它是什么、怎么配置它以及如何更好的使用它。

What it is used for?
先从内部机制开始。FilterCache存储了一些无序的文档标识号(ID)。这些ID并不是我们在schema.xml里配置的unique key,而是solr内部的一个文档标识。请记住这个。

FilterCache的任务是保持与用户过滤的结果关联。另外,cache可以辅助facet机制(在使用TermEnum时),在solrconfig.xml中的<useFilterForSortedQuery/>参数设为true时,还可以进行排序。

Definition
FilterCache的标准定义如下:
<filterCache
    class="solr.FastLRUCache"
    size="16384"
    initialSize="4096"
    autowarmCount="4096" />


有以下的配置可供选择:
class:实现类。建议使用solr.FastLRUCache,它能在大量的GET、PUT操作下,提供更好的性能。
size:cache的最大值。
initialSize:cache的初始化值。
autowarmCount:从旧的cache到新的cache时,需要被复制的数量。
minSize:在full restoraton的情况下,将cache减小后的值
acceptableSize:如果minSize没有设置,则该值会替代之
cleanupThread:默认false,如果设为true则会使用一个分离的topic来清理cache。

大部分情况下,设置initialSize和autowarmCount就已经足够了。

How to configure?
cache的大小,需要根据基本的查询语句而定;maximum大小应该至少等于我们使用的过滤字段的大小。举个例子说明:如果在某个时间内,你的应用程序使用了2000个查询参数,则minimum的大小应该最小设为2000。

Efficient use
然而,光有配置是不够的,我们还需要让查询能够使用它。请看下面的例子:

q=name:solr+AND+category:ksiazka+AND+section:ksiazki


初看起来,查询语句是正确的。但是有个问题:它并没有用到filterCache。所有的请求将会绑定到queryResultCache中并创建一个单独的条目。我们来作一下修改:

q=name:solr&fq=category:ksiazka&fq=section:ksiazki


有什么变化呢?在这个例子中,一个条目会写入到queryResultCache中;另外,还会有两个条目会写入到filterCache中。现在看一下下面的语句:

q=name:lucene&fq=category:ksiazka&fq=section:ksiazki


这个查询会创建一个条目到queryResultCache中,但是会使用filterCache中两个已经存在的条目。这样查询的执行时间会降低,IO的使用也会节省。

然而,对于下面的查询:
q=name:lucene+AND+category:ksiazka+AND+section:ksiazki


solr不能使用任何cache并且需要从lucene索引中收集所有的信息。

Last few words
就像你所看到的,配置cache 的正确方法不是如何保证solr能够使用它,而是如何构建查询语句来提升性能。当考虑查询的时候,请考虑这一点。


分享到:
评论

相关推荐

    solr中cache综述

    ### Solr中Cache综述及优化策略 #### 一、概述 Apache Solr是一个高性能、可伸缩的企业级搜索平台,它基于Lucene构建,在实际应用中为了提高查询效率和性能,内置了一系列缓存机制(Cache)。这些缓存机制不仅能够...

    linux+tomcat+mysql+solr调优

    filter_cache = 6G document_cache = 500000 ``` #### 四、Solr调优 虽然给定的部分内容中没有提及具体的Solr调优方法,但在实际应用中,Solr的性能优化可以从以下几个方面着手: 1. **索引结构优化**:合理设计...

    solr搜索引擎支持分页

    Solr提供了一种跳转分页的方式,即通过`fq`参数配合`cache`和`query`,避免计算所有结果,从而提高性能。 6. SolrCloud与分布式分页: 在SolrCloud模式下,Solr支持分布式搜索和分片,这意味着分页请求会被自动...

    solrconfig.xml和schema.xml说明

    &lt;str name="solr.hdfs.blockcache.enabled"&gt;${solr.hdfs.blockcache.enabled:true} &lt;str name="solr.hdfs.blockcache.global"&gt;${solr.hdfs.blockcache.global:true} ``` **codecFactory** - **定义**:编解码...

    solr千亿检索设计说明.zip

    Solr提供了多种查询优化策略,如查询过滤器缓存(Query Result Filter Cache)、文档缓存(Document Cache)和查询解析器(Query Parsers)的优化。合理设置这些缓存和解析策略,能显著提升查询速度。 5. **实时...

    大数据各类性能调优

    - **Parquet元数据buildScan优化**: 使用Filter Pushdown等。 - **ParquetRelationInputSplits优化**: 调整Split大小。 - **Limit优化**: 减少不必要的数据处理。 - **LimitScan优化**: 减少数据扫描量。 - **...

    spring boot 实践学习案例,与其它组件整合

    - Spring Boot 缓存,包括redis、ehcache、spring-cache、memcached、使用redis实现session共享 等。 - springboot-templates - Spring Boot 模板,包括thymeleaf、freemarker、jsp、表单校验 等。 - ...

    wpsolr配置文件

    在WordPress中,WPSOLR是一款强大的搜索引擎优化插件,它通过集成Apache Solr服务器提升网站的搜索性能。本文将深入探讨两个关键的配置文件——`schema.xml`和`solrconfig.xml`,它们对于WPSOLR的正确配置和高效运行...

    lucene高级应用

    2. 使用Filter:通过TermQuery、RangeQuery或自定义Filter,可以限制搜索范围,减少不必要的计算,提高查询效率。 3. Boosting:对重要的关键词进行加权,可以提升相关度高的结果排名。 4. 使用缓存:对于频繁执行...

    人工智能-机器学习-移动互联网信息集成和位置检索的关键技术研究与应用.pdf

    《人工智能-机器学习-移动互联网信息集成和位置检索的关键技术研究与应用》这篇论文深入探讨了在移动互联网时代,如何运用人工智能和机器学习技术优化信息集成和位置检索服务。随着移动设备的普及,用户对信息获取的...

    spring-boot-reference.pdf

    31.1. Supported Cache Providers 31.1.1. Generic 31.1.2. JCache (JSR-107) 31.1.3. EhCache 2.x 31.1.4. Hazelcast 31.1.5. Infinispan 31.1.6. Couchbase 31.1.7. Redis 31.1.8. Caffeine 31.1.9. Simple 31.1....

    Lucene实战源码(Lucene in Action Source Code)part1

    源码可能会演示如何使用这些搜索类型以及如何优化搜索性能,比如使用过滤器(Filter)和缓存(Cache)来减少不必要的计算。 在实际应用中,Lucene通常与其他技术结合使用,例如Solr或Elasticsearch,它们提供了更...

    spring-boot-demo:Spring Boot和Spring Cloud和Spring Security演示案例(Spring学习示例实战项目)

    SpringCache的 定时器 搜索ES 搜索 项目工程: 三, MVC篇 过滤器 项目工程: 基本使用姿势: filter优先级: 拦截器 获取/发布/放置/删除等http方法支持 参数绑定(get / post参数解析,自定义参数解析器)

Global site tag (gtag.js) - Google Analytics