我们常常在自定义一些搜索的时候,需要将某些特定的词搜索到其他商品;例如:
我搜索 “踩得” 我就要搜索到 “鞋类”
那么我们就需要配置solr的同义词:
同义词的配置是在 solr的 config文件夹下面:和 schema.xml一个目录下,有一个synonyms.txt
重启solr。继续搜索:
这样搜索鞋类,就可以匹配到 踩的
转载请标明出处:龙企阁http://blog.csdn.net/longxia1987
题外话:
如果有些 人 踩的 被分词成了 踩和的 两个词,那么就需要在solr的扩展词里面配置 强制分词,具体做法 参见我的另一篇博客:
solr 强制分词
您还没有登录,请您登录后再发表评论
支持Spring-data-solr1.5的ik分词器,并且修改了代码,添加一个新的类,用于支持同义词,目前可以同时支持分词和同义词的功能。 修改 managed-schema,添加 <fieldType name="text_lk" class="solr.TextField"> ...
在查询时,除了相同的分词及过滤过程外,还会额外使用SynonymFilterFactory来处理同义词。 #### 五、Solr安装与配置 - **下载与安装**: - **下载地址**:官方下载地址为http://lucene.apache.org/solr/。 - **...
Solr分词器是Apache Solr搜索引擎中的一个重要组件,它负责对输入的文本进行分词处理,以便于索引和查询。...而理解分词器的工作原理和特性,以及如何定制和优化分词规则,是每个Solr开发者需要掌握的核心技能之一。
**JAVA+Solr分词项目工程实例** 在Java开发中,搜索引擎和文本处理是一个重要的领域,而Apache Solr是其中一个非常流行的开源全文搜索平台。这个项目工程实例是关于如何使用Java与Solr进行集成,实现分词搜索功能的...
自定义的Solr 分词器,可以通过竖线"|"来分词,可以在博客http://blog.csdn.net/jiangchao858/article/details/68954044看到生成过程与使用步骤。
3. 结合其他组件:配合SynonymFilter处理同义词,提升搜索效果。 4. 多字段分词:针对不同字段使用不同的分词策略,满足多样化需求。 总结来说,Solr中文分词器是实现高效中文搜索的关键,选择合适的分词器并进行...
4. 高级分词处理:例如短语分析、同义词扩展等,这可以通过自定义分词组件实现。 二、Solr分词器与过滤器 Solr内置了多种分词器和过滤器,例如: 1. StandardTokenizer:标准分词器,遵循HTML和XML规范,处理常见...
solr-ik分词器的资源包,包括:ext.dic;ikanalyzer.cfg.xml;ik-analyzer-solr5-5.x.jar;solr-analyzer-ik-5.1.0.jar;stopword.dic 五个文件
标题中的"JAVA+Solr分词项目工程实例Java实用源码整理learns"指的是一个基于Java编程语言并结合Solr搜索引擎的项目实例。这个项目主要关注于文本处理和信息检索,利用Solr的分词功能来提升搜索效率和准确性。Solr是...
在Solr中,分词器(Analyzer)和过滤器(Filter)共同作用于输入文本,完成诸如分词、去除停用词、词形还原等任务,以便提高搜索质量和效率。 **Solr分词器配置** 配置Solr分词器主要涉及以下几个步骤: 1. **...
ikanalyzer通常具有良好的分词效果,支持停用词过滤、词性标注等功能,可以满足大多数中文搜索的需求。 在使用这个高版本的ikanalyzer分词器时,我们需要遵循以下步骤: 1. **下载与解压**:首先,从提供的压缩包...
"solr分词 IKAnalyzer2012FF_hf1.rar" 包含的是一个针对Solr优化的IK分词器版本,即IKAnalyzer2012FF_hf1。这个版本在原版IKAnalyzer的基础上进行了改进,提高了对中文词汇的处理能力,特别是对于复杂语境和新词识别...
Solr是中国最流行的开源搜索引擎平台之一,而IK Analyzer是一款针对中文的高性能分词器,尤其在处理现代汉语的复杂情况时表现出色。本教程将详细解释如何在Solr中安装和使用IK分词器。 首先,让我们理解一下什么是...
在处理中文内容时,分词是其核心步骤之一,因为搜索引擎需要将输入的中文文本拆分成有意义的词语单元,才能进行有效的索引和查询。Ik Analyzer是一款针对Java平台设计的、专门用于中文分词的开源工具,它在Solr中...
"solr 中文分词" 主要涉及的是 Solr 如何对中文文档进行有效的分词处理,以便于搜索和匹配。 1. **中文分词的重要性** 中文与英文不同,单词之间没有明显的分隔符,如空格。因此,为了准确地理解和检索中文内容,...
Ik分词器是Solr中一个非常重要的组件,尤其对于中文处理,它是不可或缺的一部分。Ik分词器全称为Intelligent Chinese Analyzer,是由国内开发者基于Lucene开发的一款高性能的中文分词工具,专门针对中文的特性进行了...
solr分词器,solr分词器-ik-analyzer.7.4.0.jar7.4.0版本
相关推荐
支持Spring-data-solr1.5的ik分词器,并且修改了代码,添加一个新的类,用于支持同义词,目前可以同时支持分词和同义词的功能。 修改 managed-schema,添加 <fieldType name="text_lk" class="solr.TextField"> ...
在查询时,除了相同的分词及过滤过程外,还会额外使用SynonymFilterFactory来处理同义词。 #### 五、Solr安装与配置 - **下载与安装**: - **下载地址**:官方下载地址为http://lucene.apache.org/solr/。 - **...
Solr分词器是Apache Solr搜索引擎中的一个重要组件,它负责对输入的文本进行分词处理,以便于索引和查询。...而理解分词器的工作原理和特性,以及如何定制和优化分词规则,是每个Solr开发者需要掌握的核心技能之一。
**JAVA+Solr分词项目工程实例** 在Java开发中,搜索引擎和文本处理是一个重要的领域,而Apache Solr是其中一个非常流行的开源全文搜索平台。这个项目工程实例是关于如何使用Java与Solr进行集成,实现分词搜索功能的...
自定义的Solr 分词器,可以通过竖线"|"来分词,可以在博客http://blog.csdn.net/jiangchao858/article/details/68954044看到生成过程与使用步骤。
3. 结合其他组件:配合SynonymFilter处理同义词,提升搜索效果。 4. 多字段分词:针对不同字段使用不同的分词策略,满足多样化需求。 总结来说,Solr中文分词器是实现高效中文搜索的关键,选择合适的分词器并进行...
4. 高级分词处理:例如短语分析、同义词扩展等,这可以通过自定义分词组件实现。 二、Solr分词器与过滤器 Solr内置了多种分词器和过滤器,例如: 1. StandardTokenizer:标准分词器,遵循HTML和XML规范,处理常见...
solr-ik分词器的资源包,包括:ext.dic;ikanalyzer.cfg.xml;ik-analyzer-solr5-5.x.jar;solr-analyzer-ik-5.1.0.jar;stopword.dic 五个文件
标题中的"JAVA+Solr分词项目工程实例Java实用源码整理learns"指的是一个基于Java编程语言并结合Solr搜索引擎的项目实例。这个项目主要关注于文本处理和信息检索,利用Solr的分词功能来提升搜索效率和准确性。Solr是...
在Solr中,分词器(Analyzer)和过滤器(Filter)共同作用于输入文本,完成诸如分词、去除停用词、词形还原等任务,以便提高搜索质量和效率。 **Solr分词器配置** 配置Solr分词器主要涉及以下几个步骤: 1. **...
ikanalyzer通常具有良好的分词效果,支持停用词过滤、词性标注等功能,可以满足大多数中文搜索的需求。 在使用这个高版本的ikanalyzer分词器时,我们需要遵循以下步骤: 1. **下载与解压**:首先,从提供的压缩包...
"solr分词 IKAnalyzer2012FF_hf1.rar" 包含的是一个针对Solr优化的IK分词器版本,即IKAnalyzer2012FF_hf1。这个版本在原版IKAnalyzer的基础上进行了改进,提高了对中文词汇的处理能力,特别是对于复杂语境和新词识别...
Solr是中国最流行的开源搜索引擎平台之一,而IK Analyzer是一款针对中文的高性能分词器,尤其在处理现代汉语的复杂情况时表现出色。本教程将详细解释如何在Solr中安装和使用IK分词器。 首先,让我们理解一下什么是...
在处理中文内容时,分词是其核心步骤之一,因为搜索引擎需要将输入的中文文本拆分成有意义的词语单元,才能进行有效的索引和查询。Ik Analyzer是一款针对Java平台设计的、专门用于中文分词的开源工具,它在Solr中...
"solr 中文分词" 主要涉及的是 Solr 如何对中文文档进行有效的分词处理,以便于搜索和匹配。 1. **中文分词的重要性** 中文与英文不同,单词之间没有明显的分隔符,如空格。因此,为了准确地理解和检索中文内容,...
Ik分词器是Solr中一个非常重要的组件,尤其对于中文处理,它是不可或缺的一部分。Ik分词器全称为Intelligent Chinese Analyzer,是由国内开发者基于Lucene开发的一款高性能的中文分词工具,专门针对中文的特性进行了...
solr分词器,solr分词器-ik-analyzer.7.4.0.jar7.4.0版本