`

solr 同义词搜索

    博客分类:
  • solr
阅读更多

solr 同义词搜索

 

solr-synonym功能(同义词)

 

1) 配置 

 

==========================schema.xml START=================================================

<fieldType name="textMaxWord" class="solr.TextField" >^M

      <analyzer type="index">
        <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="max-word"/>^M
        <filter class="solr.StopFilterFactory" ignoreCase="false" words="stopwords.txt"/>
        <filter class="solr.StandardFilterFactory"/>
        <filter class="solr.RemoveDuplicatesTokenFilterFactory"/>
      </analyzer>

      <analyzer type="query">
        <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="max-word"/>^M
        <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
        <filter class="solr.StopFilterFactory" ignoreCase="false" words="stopwords.txt"/>
        <filter class="solr.StandardFilterFactory"/>
        <filter class="solr.RemoveDuplicatesTokenFilterFactory"/>
      </analyzer>
    </fieldType>

 

……

<field name="title" type="textMaxWord" indexed="true" stored="true" termVectors="true"/>

……

==========================schema.xml END=================================================

 

==========================conf/synonyms.txt START=================================================

# Some synonym groups specific to this example
GB,gib,gigabyte,gigabytes
MB,mib,megabyte,megabytes
Television, Televisions, TV, TVs
中国,美国,德国,法国
==========================conf/synonyms.txt END=================================================

2)使用

搜索title:中国  结果包括美国、中国的结果都会出现

 

引自:http://hi.baidu.com/liwei_8/blog/item/6e0197dfd376700a63279886.html

1
1
分享到:
评论
2 楼 dandongsoft 2016-02-29  
你写的不好用啊
1 楼 zha_zi 2011-10-09  
这个不错,以前没有发现过solr有这个功能

相关推荐

    solr-lemmatization:从维基词典的维基媒体工具服务器定义转储中构建用于词形还原的 Solr 同义词文件的项目

    Apache Solr 是一个流行的开源全文搜索引擎,它提供了丰富的特性和功能来提升搜索体验,其中之一就是词形还原(Lemmatization)和同义词处理。本文将深入探讨这两个概念以及如何通过 Java 语言和特定项目 "solr-...

    solr实现京东搜索

    除了基本功能,Solr还可以实现如拼音搜索、同义词扩展、高亮显示搜索结果、相关性评分等高级特性,进一步提升用户体验。例如,通过添加拼音分析器,用户可以用汉字拼音进行搜索;利用Solr的自定义相似度函数,可以...

    人工智能-项目实践-搜索引擎-基于solr的中文搜索引擎框架

    在中文环境下,搜索引擎的构建相比英文环境更具挑战性,因为中文的分词问题、多音字和同义词等都需要特殊处理。 标签“搜索引擎”、“人工智能”和“solr”进一步细化了主题。搜索引擎是信息检索的核心技术,它涉及...

    配置好的solr启动环境

    1. **同义词**:在Solr中,可以使用Solr的同义词扩展来处理词汇的同义关系。例如,"车"和"汽车"可以视为同义词,当用户搜索"车"时,也能匹配到包含"汽车"的文档。这通过配置同义词文件和同义词过滤器实现。 2. **...

    solr-7.1.0.zip solr搜索引擎安装包

    Solr通过建立倒排索引来实现高效的搜索,将每个词与包含它的文档关联起来。 在Solr 7.1.0中,用户可以创建多个独立的搜索“集合”或“核心”,每个集合都可以有自己的索引和配置。这样,你可以为不同的数据集或业务...

    电商solr用扩展词库商品名称大全关键词库ext.dic

    可做为电商搜索引擎solr的扩展词库,20W+专业名词,txt文件可修改后缀名,不定时更新。

    训练 Word2Vec 模型或 LSA 模型,并在 Solr\Lucene 中实现概念搜索\语义搜索_python

    然后可以使用同义词文件结合一些 solr 插件将这个过程的输出嵌入到 solr(或一些其他搜索引擎)中,以在搜索引擎中提供概念搜索功能。输出也可以在其他搜索引擎中使用,只要它们支持同义词文件。概念搜索也称为语义...

    solr6.2.1项目包

    对于大型企业或者需要处理大量数据的场景,Solr 6.2.1提供了强大的搜索能力,包括拼写纠错、同义词处理、评分机制等,能有效提升用户体验。同时,其丰富的API和社区支持,使得定制化需求得以满足。总之,Solr 6.2.1...

    solr-8.0.0.tgz

    1. **全文检索**:Solr以其强大的文本分析能力而闻名,它支持多种语言的分词,可以进行复杂的查询操作,如模糊匹配、短语查询和同义词搜索。 2. **多字段索引**:Solr允许用户为不同的数据字段创建独立的索引,这...

    ikanalyzer-solr8.4.0_solr8_solr_ikanalyzer_中文分词_

    ikanalyzer 提供了丰富的扩展性,用户可以根据自己的需求定制词典,支持自定义停用词、同义词等,以满足不同场景的分词需求。同时,ikanalyzer 还提供了全模式和最细粒度模式两种分词策略,全模式尽可能切出更多的词...

    最新版linux solr-8.8.2.tgz

    了解这些基础知识后,你就可以开始探索 Solr 8.8.2 的高级特性,如实时增删改查、多字段排序、高亮显示、同义词处理、地理位置搜索以及更复杂的查询表达式等。通过熟练掌握 Solr,你将能够构建强大而高效的全文搜索...

    solr和sql映射工具

    1. **全文搜索**:Solr支持复杂的全文搜索功能,可以对文本内容进行模糊匹配、短语搜索和同义词搜索等。 2. **高性能**:通过内存缓存和倒排索引技术,Solr能够在大规模数据集上提供快速的搜索响应。 3. **可扩展...

    Solr服务器

    它内置了词干提取、同义词扩展和停用词过滤等自然语言处理工具,以提高搜索精度。 2. **分面导航(Faceting)**:Solr允许用户通过分面来过滤和细化搜索结果,这在电子商务网站和大型信息库中非常常见,用户可以...

    solr 4.10&

    - **分词和索引**:它使用Lucene库进行文本分析和索引,能进行词语拆分、同义词扩展和停用词过滤等操作。 - **字段存储和检索**:Solr允许用户为不同字段设置不同的检索策略,如精确匹配、范围查询等。 - **排序...

    solr-8.1.1-src.tgz

    - 同义词处理,确保搜索的广泛性和准确性。 10. **复制和恢复**: - 数据备份和恢复机制,确保数据的安全性和一致性。 11. **插件体系**: - Solr允许开发者编写自己的分析器、查询解析器、过滤器等插件,以...

    人工智能-项目实践-搜索引擎-一个用Solr做企业应用内的搜索引擎的SpringBoot项目

    同义词搜索则扩大了查询的覆盖范围,当用户搜索的词与实际内容有同义关系时,仍能获得准确结果。 **Solr**是基于Lucene库构建的,它简化了索引构建、管理和查询的过程。定时全量索引和实时增量索引是Solr的重要特性...

    solr-4.10.3

    6. **拼音和同义词支持**:Solr内置了对中文拼音和同义词的支持,可以通过配置扩展其自然语言处理能力,提升中文搜索的准确度。 7. **配置与定制**:Solr的配置主要通过XML文件进行,包括核心配置、请求处理器、...

    solr分词器使用手册

    在查询时,除了相同的分词及过滤过程外,还会额外使用SynonymFilterFactory来处理同义词。 #### 五、Solr安装与配置 - **下载与安装**: - **下载地址**:官方下载地址为http://lucene.apache.org/solr/。 - **...

    solr-8.1.1.zip

    - **全文检索**: 支持对文档内容进行全文搜索,包括词语的同义词、近义词等模糊匹配。 - **字段搜索**: 可以根据文档中的特定字段进行精确查询,如标题、作者等。 - **排序和评分**: 结果可以按照相关度、时间或...

Global site tag (gtag.js) - Google Analytics