`
wutao8818
  • 浏览: 618292 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

solr 几个有用的过滤器

阅读更多
http://lucene.apache.org/solr/tutorial.html

Text Analysis

Example queries demonstrating relevancy improving transformations:

    * A search for power-shot matches PowerShot, and adata matches A-DATA due to the use of WordDelimiterFilter and LowerCaseFilter.

可以通过WordDelimiterFilter去除字符间的分割符
LowerCaseFilter 取消大小写区分。这2个filter对中文搜索没什么大的意义。

    * A search for name:printers matches Printer, and features:recharging matches Rechargeable due to stemming with the EnglishPorterFilter.

EnglishPorterFilter 英文单词近似。中文没用。

    * A search for "1 gigabyte" matches things with GB, and pixima matches Pixma due to use of a SynonymFilter.

同义词管理,这个对中文搜索还是有意义的。
分享到:
评论

相关推荐

    solr分词器

    分词器的工作流程通常包括以下几个步骤: 1. 读取文本:从输入的文档或查询中获取原始的文本内容。 2. 分词:根据分词规则将文本切分成一个个单独的词语。 3. 过滤:对分词结果进行过滤,去除停用词(如“的”、“和...

    solr5的ik中文分词器源码

    "ik-analyzer-solr5-master"目录下的源码结构一般包含以下几个部分: - `src/main/java`:存放核心Java代码,如分词器的实现、词典管理等。 - `src/main/resources`:存放词典文件和其他资源,如字典、配置文件等...

    solr(ik分词器)需要的jar包

    在提供的压缩包文件列表中,我们有以下几个文件: 1. `mydict.dic`:这是自定义词典,用户可以在这里添加自己的专业词汇或者专有名词,以确保它们在分词过程中被正确识别。 2. `stopword.dic`:停用词表,通常包含...

    k-analyzer-solr solr分词器

    在Solr中,分词器(Analyzer)和过滤器(Filter)共同作用于输入文本,完成诸如分词、去除停用词、词形还原等任务,以便提高搜索质量和效率。 **Solr分词器配置** 配置Solr分词器主要涉及以下几个步骤: 1. **...

    solr中cache综述

    Apache Solr是一个高性能、可伸缩的企业级搜索平台,它基于Lucene构建,在实际应用中为了提高查询效率和性能,内置了一系列缓存机制(Cache)。这些缓存机制不仅能够有效减少对底层索引的直接访问次数,还能够在很大...

    apache-solr7.7

    6. **分析器与过滤器**:Solr允许自定义文本分析流程,包括分词器(Tokenizers)、过滤器(Filters)和 CharFilters。这些组件可以用于处理文本,如去除停用词、词干提取、大小写转换等,以优化搜索性能。 7. **...

    Solr3.5开发应用指导

    - **1.4.1 目录结构说明**:Solr的核心源码主要由几个关键部分组成,如`src/main/java`包含Java源代码,`src/main/resources`存放配置文件等。 - **1.4.2 Solrhome说明**:Solrhome是Solr运行时使用的根目录,包含了...

    最新版windows solr-8.7.0.zip

    在Solr 8.7.0中,有几个关键知识点值得一提: 1. **分布式搜索**:Solr 8.7.0支持多节点集群,可以将索引分散在多个服务器上,实现分布式搜索。这使得Solr能够处理PB级别的数据,并在高可用性和性能之间取得平衡。 ...

    基于Solr的多表join查询加速方法

    - **查询优化**:利用Solr的查询过滤器(Filter Queries)和查询结果缓存,减少不必要的文档扫描,提高查询效率。 - **数据预处理**:在索引阶段,预先计算join结果并存储在Solr文档中,查询时直接读取,避免运行时...

    solr-4.10.3.zip

    Solr是中国Apache软件基金会...同时,根据业务需求,可能还需要对Solr进行定制,例如开发自定义查询解析器、过滤器或数据导入处理程序。总之,Solr 4.10.3是一个强大且灵活的搜索平台,适用于各种规模的企业和项目。

    solr cloud6.1.0拼音分词

    在Solr中,拼音分词主要依赖于特定的分析器和过滤器。这些组件在索引和查询阶段处理文本,将汉字转化为拼音,以便于匹配。例如,"北京大学"会被转化为"bei da xue jia"。Solr 提供了若干种实现这个功能的插件,如...

    solr教材-PDF版

    - **3.6.4 Solr分词器、过滤器、分析器**:解释如何使用不同的分词器、过滤器和分析器来处理索引数据。 - **3.6.5 Solr高亮使用**:指导如何在搜索结果中突出显示关键词。 #### 四、SolrJ的用法 **4.1 搜索接口的...

    solr讲解,案例分析

    案例分析部分通常会涵盖以下几个方面: 1. **部署与配置**:如何设置Solr服务器,包括下载、解压、启动和配置Solr实例。这可能涉及修改solrconfig.xml和schema.xml文件,以适应特定的数据模型。 2. **索引构建**:...

    solr_3.5_配置及应用

    首先,配置 Solr 3.5 包括以下几个主要步骤: 1. **环境搭建**:你需要先安装 Java Development Kit (JDK) 并设置好环境变量,因为 Solr 是基于 Java 的。下载 Solr 3.5 安装包并解压,然后配置 `solr/home` 目录,...

    solr自学详细教程,吐血总结

    一旦Solr安装并配置完毕,你可以开始创建索引、定义字段、配置查询分析器和过滤器,以及设置高亮显示、排序等高级特性。Solr还提供了一个管理界面,用于查看和调整配置,监控索引状态和搜索性能。 总的来说,Solr是...

    solr文档solr文档

    1. **Solr的基本概念**:了解什么是索引、查询处理、分词器、过滤器、评分机制等核心概念,它们是构建Solr搜索系统的基础。 2. **安装与部署**:Solr的下载、解压、启动和停止过程,以及如何配置Solr服务器,包括...

    apache-solr-ref-guide-7.4(官方英文-文字版本)

    6. **过滤器描述**:详细列出了 Solr 中提供的各种过滤器的功能和配置方法。 7. **字符过滤器工厂**:介绍了 Solr 中字符过滤器的使用方法,包括 HTML 去除、Unicode 规范化等。 8. **语言分析**:解释了如何...

    图片上传下载 整合solr 引擎搜索

    4. 搜索优化:Solr允许设置过滤器和查询解析器,以提高搜索性能和准确度。例如,可以设置短语查询、模糊查询或排除某些词汇。 项目中的"Maven"提及表明项目使用了Maven作为构建工具,这使得依赖管理和项目构建变得...

    apache solr 源文件 3.6.1

    在Apache Solr 3.6.1中,我们可以关注以下几个关键知识点: 1. **索引结构**:Solr的核心是基于Lucene的倒排索引。在源文件中,你可以看到如何构建、存储和查询这些索引。主要涉及`org.apache.solr.index`包下的类...

    solr-4.10.3

    在“solr-4.10.3”这个版本中,我们可以深入探讨以下几个关键知识点: 1. **Solr架构**:Solr基于Java,运行在Jetty或其他Servlet容器之上。它的核心架构由索引、查询、分布式处理和配置文件组成。索引负责存储和...

Global site tag (gtag.js) - Google Analytics