Solr自带的分词器对英文支持较好,但不适合针对中文的分词,我们这里使用IKAnalyzer为例讲解Solr的分词器配置
一、下载
见附件
二、拷贝IKAnalyzer2012FF_u1_custom.jar文件至'运用路径'/WEB-INF/lib下
注:“运用路径”一般有两种,第2种solr-webapp在服务每次重启后,会从example/webapps/solr.war重新解压一份
1、tomcat部署solr:apache-tomcat/webapp/solr/WEB-INF/lib
2、Solr自带jetty:solr/example/solr-webapp/webapp/WEB-INF/lib
三、打开core(如:example/solr/collection1)-->conf-->schema.xml
在最后</scheml>内加入
<fieldType name="text_ik" class="solr.TextField"> <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/> <analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/> </fieldType>
四、自定义分词器使用
在需要使用中文分词器的field标签配置fieldType的引用,type="text_ik"要和fieldType的name一致
<field name="shortName" type="text_ik" indexed="true" required="false" stored="true"/>
附言:
1、schema.xml中的copyField作用:创建文档索引时将指定字段
2、如果Solr启动提示java.lang.UnsupportedClassVersionError:org/wltea/analyzer/lucene/IKAnalyzer
则请下载IKAnalyzer另一个版本,再进行测试。如果问题仍旧,请升级JDK版本
配置完毕,重启Solr即可
相关推荐
IKAnalyzer是Java开发的一款广泛应用的中文分词器,它的全称是"Intelligent Chinese Analyzer"。这个开源项目致力于提供一个高效、易用且扩展性良好的中文处理工具,它在分词领域表现出色,广泛应用于搜索引擎、信息...
Solr是一款强大的全文搜索引擎,广泛应用于各种大数据检索场景。在处理中文内容时,分词是...总之,Ik Analyzer 7.5.0是Solr处理中文文本的得力工具,通过合理的配置和使用,可以提升Solr在中文搜索中的性能和准确性。
ikanalyzer-solr5 是一个专门为 Solr 5 及以上版本设计的中文分词器插件。在信息检索和自然语言处理领域,分词器是至关重要的工具,它负责将连续的文本切割成有意义的词语,以进行索引和查询操作。ikanalyzer 是一个...
在实际应用中,用户可能需要配置Solr的schema.xml文件,指定使用IKAnalyzer作为默认的字段分析器,同时根据需求选择合适的分词策略。同时,通过solr-analyzer-extra-5.3.jar,用户还可以集成更多的文本处理功能,如...
2. 创建Analyzer对象,通常使用`org.wltea.analyzer.lucene.IKAnalyzer`作为入口。 3. 使用Analyzer对象的`tokenStream`方法获取TokenStream,这是Lucene的抽象概念,代表分词流。 4. 遍历TokenStream,获取分词结果...
ikanalyzer-solr5.zip是一个专门针对中文分词的工具包,主要服务于Solr5版本。这个压缩包包含了两个核心的Java档案文件(jar包):ik-analyzer-solr5-5.x.jar和solr-analyzer-ik-5.1.0.jar,它们在信息技术领域,...
ikanalyzer 是一个专门为Java开发的中文分词器,它基于 Lucene 库,适用于各种文本处理和搜索引擎场景。在 Solr 环境中,ikanalyzer 的作用是为中文文档提供精确的分词服务,从而提升搜索质量和效率。Solr8.4.0 是 ...
标题“ik-analyzer-solr7-7.x.zip”表明这是一个与Solr7相关的压缩包,其中包含了IK Analyzer,一个广泛使用的中文分词工具。这个压缩包特别为Solr7版本进行了优化,提供了完整的配置文件,使得用户可以方便地集成到...
IKAnalyzer是一个专门为Java设计的中文分词器,它广泛应用于Solr、Elasticsearch等全文检索框架中,为用户提供高效的中文处理能力。本篇将详细介绍IKAnalyzer-5.0.jar和solr-analyzer-extra-5.3.jar这两个Solr的IK...
2. **配置Solr**:在Solr的`schema.xml`或`managed-schema`文件中,配置IK Analyzer作为字段类型分析器。 3. **自定义词典**:可以创建自定义词典,添加行业术语、品牌名称等,提高分词准确度。 4. **启动Solr**:...
ikanalyzer-solr6.5 是一个专门为Solr 6.5版本设计的中文分词器,它基于ikanalyzer,并且进行了优化以更好地适应Solr的索引和搜索需求。ikanalyzer是一个开源的、基于Java实现的中文分词库,主要用于解决中文文本...
在Solr的`lib`目录下添加ikanalyzer的jar文件,确保Solr启动时能加载到该分词器。同时,还需要在Solr的`schema.xml`文件中配置分词器,指定字段类型为`text_ik`或`text_ik_max_word`,前者主要用于单个词语的查询,...
标题 "ik分词器ik-analyzer-5.3.0和ikanalyzer-solr6.5-2018" 涉及的是两个不同版本的IK分词器,一个是ik-analyzer-5.3.0,适用于Solr 5.5.0,另一个是ikanalyzer-solr6.5-2018,适用于Solr 7.0.0。IK分词器是Java...
"ik-analyzer-solr7"是一个专门为Solr7版本设计的中文分词器插件,它在处理中文文本时能展现出强大的分析性能。这个压缩包包含了ik-analyzer与Solr7集成所需的jar包以及详细的使用教程,确保用户能够快速上手并实现...
在Solr中使用ikanalyzer,我们可以将ikanalyzer的配置文件和jar包添加到Solr的lib目录下,然后在Solr的schema.xml中配置分词器。ikanalyzer-solr5这个文件可能包含了ikanalyzer针对Solr5版本的特定优化或适配。对于...
安装和配置过程通常包括解压压缩包、配置Solr的schema.xml文件以包含Ik Analyzer、启动Solr服务,并将Ik Analyzer相关的jar文件添加到Solr的类路径中。 总之,"solr-7.7.2+ik-analyzer-solr7x.zip"提供了Solr 7.7.2...
ik-analyzer-solr 用于solr 7.x-8.x的ik-analyzer 简介 适应最新版本的solr 7&8; 扩展IK首词库: 分词工具 词库中词的数量 ...关闭默认主词典请在IKAnalyzer.cfg.xml配置文件中设置use_main_dict为fals
IK Analyzer是一款优秀的开源中文分词器,尤其在处理现代汉语的分词效果上表现突出。在Solr中集成IK Analyzer,能够更好地对中文内容进行索引和搜索,提高查询效率和准确性。 **Solr6.0集成IK Analyzer的过程主要...