`
longxia1987
  • 浏览: 35530 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

solr 分词之 同义词(synonyms)

 
阅读更多

我们常常在自定义一些搜索的时候,需要将某些特定的词搜索到其他商品;例如:

我搜索 “踩得” 我就要搜索到 “鞋类”




那么我们就需要配置solr的同义词:


同义词的配置是在 solr的 config文件夹下面:和 schema.xml一个目录下,有一个synonyms.txt



重启solr。继续搜索:


这样搜索鞋类,就可以匹配到 踩的

转载请标明出处:龙企阁http://blog.csdn.net/longxia1987

题外话:

如果有些 人 踩的 被分词成了 踩和的 两个词,那么就需要在solr的扩展词里面配置 强制分词,具体做法 参见我的另一篇博客:

solr 强制分词


分享到:
评论
1 楼 dandongsoft 2016-02-29  
solr 同义词配置,中文不好用啊 啊 啊啊 啊 啊啊 啊啊 啊啊 啊啊啊 啊啊 啊

相关推荐

    支持Spring-data-solr1.5的ik分词器,同义词

    支持Spring-data-solr1.5的ik分词器,并且修改了代码,添加一个新的类,用于支持同义词,目前可以同时支持分词和同义词的功能。 修改 managed-schema,添加 <fieldType name="text_lk" class="solr.TextField"> ...

    solr分词器使用手册

    在查询时,除了相同的分词及过滤过程外,还会额外使用SynonymFilterFactory来处理同义词。 #### 五、Solr安装与配置 - **下载与安装**: - **下载地址**:官方下载地址为http://lucene.apache.org/solr/。 - **...

    solr分词器

    Solr分词器是Apache Solr搜索引擎中的一个重要组件,它负责对输入的文本进行分词处理,以便于索引和查询。...而理解分词器的工作原理和特性,以及如何定制和优化分词规则,是每个Solr开发者需要掌握的核心技能之一。

    JAVA+Solr分词项目工程实例Java源码

    **JAVA+Solr分词项目工程实例** 在Java开发中,搜索引擎和文本处理是一个重要的领域,而Apache Solr是其中一个非常流行的开源全文搜索平台。这个项目工程实例是关于如何使用Java与Solr进行集成,实现分词搜索功能的...

    自定义Solr分词器

    自定义的Solr 分词器,可以通过竖线"|"来分词,可以在博客http://blog.csdn.net/jiangchao858/article/details/68954044看到生成过程与使用步骤。

    solr中文分词器

    3. 结合其他组件:配合SynonymFilter处理同义词,提升搜索效果。 4. 多字段分词:针对不同字段使用不同的分词策略,满足多样化需求。 总结来说,Solr中文分词器是实现高效中文搜索的关键,选择合适的分词器并进行...

    Solr分词项目工程实例

    4. 高级分词处理:例如短语分析、同义词扩展等,这可以通过自定义分词组件实现。 二、Solr分词器与过滤器 Solr内置了多种分词器和过滤器,例如: 1. StandardTokenizer:标准分词器,遵循HTML和XML规范,处理常见...

    solr分词器资源 solr-ikanalyzer 资源包

    solr-ik分词器的资源包,包括:ext.dic;ikanalyzer.cfg.xml;ik-analyzer-solr5-5.x.jar;solr-analyzer-ik-5.1.0.jar;stopword.dic 五个文件

    JAVA+Solr分词项目工程实例Java实用源码整理learns

    标题中的"JAVA+Solr分词项目工程实例Java实用源码整理learns"指的是一个基于Java编程语言并结合Solr搜索引擎的项目实例。这个项目主要关注于文本处理和信息检索,利用Solr的分词功能来提升搜索效率和准确性。Solr是...

    k-analyzer-solr solr分词器

    在Solr中,分词器(Analyzer)和过滤器(Filter)共同作用于输入文本,完成诸如分词、去除停用词、词形还原等任务,以便提高搜索质量和效率。 **Solr分词器配置** 配置Solr分词器主要涉及以下几个步骤: 1. **...

    solr中文分词高版本

    ikanalyzer通常具有良好的分词效果,支持停用词过滤、词性标注等功能,可以满足大多数中文搜索的需求。 在使用这个高版本的ikanalyzer分词器时,我们需要遵循以下步骤: 1. **下载与解压**:首先,从提供的压缩包...

    solr分词 IKAnalyzer2012FF_hf1.rar

    "solr分词 IKAnalyzer2012FF_hf1.rar" 包含的是一个针对Solr优化的IK分词器版本,即IKAnalyzer2012FF_hf1。这个版本在原版IKAnalyzer的基础上进行了改进,提高了对中文词汇的处理能力,特别是对于复杂语境和新词识别...

    solr ik分词器

    Solr是中国最流行的开源搜索引擎平台之一,而IK Analyzer是一款针对中文的高性能分词器,尤其在处理现代汉语的复杂情况时表现出色。本教程将详细解释如何在Solr中安装和使用IK分词器。 首先,让我们理解一下什么是...

    solr中文分词jar包ik-analyzer 含class配置 ik-analyzer-7.5.0

    在处理中文内容时,分词是其核心步骤之一,因为搜索引擎需要将输入的中文文本拆分成有意义的词语单元,才能进行有效的索引和查询。Ik Analyzer是一款针对Java平台设计的、专门用于中文分词的开源工具,它在Solr中...

    solr 中文分词

    "solr 中文分词" 主要涉及的是 Solr 如何对中文文档进行有效的分词处理,以便于搜索和匹配。 1. **中文分词的重要性** 中文与英文不同,单词之间没有明显的分隔符,如空格。因此,为了准确地理解和检索中文内容,...

    Solr-ik分词

    Ik分词器是Solr中一个非常重要的组件,尤其对于中文处理,它是不可或缺的一部分。Ik分词器全称为Intelligent Chinese Analyzer,是由国内开发者基于Lucene开发的一款高性能的中文分词工具,专门针对中文的特性进行了...

    solr分词器-ik-analyzer.7.4.0.jar

    solr分词器,solr分词器-ik-analyzer.7.4.0.jar7.4.0版本

Global site tag (gtag.js) - Google Analytics