`
fuhuijun
  • 浏览: 32076 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

Solr配置安装(二)--之中文分语器IKAnalyzer

 
阅读更多

Solr自带的分词器对英文支持较好,但不适合针对中文的分词,我们这里使用IKAnalyzer为例讲解Solr的分词器配置

一、下载

        见附件

二、拷贝IKAnalyzer2012FF_u1_custom.jar文件至'运用路径'/WEB-INF/lib下

       注:“运用路径”一般有两种,第2种solr-webapp在服务每次重启后,会从example/webapps/solr.war重新解压一份

       1、tomcat部署solr:apache-tomcat/webapp/solr/WEB-INF/lib

       2、Solr自带jetty:solr/example/solr-webapp/webapp/WEB-INF/lib

三、打开core(如:example/solr/collection1)-->conf-->schema.xml

       在最后</scheml>内加入

<fieldType name="text_ik" class="solr.TextField">
   <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
   <analyzer type="query" isMaxWordLength="true"  class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>

 
 四、自定义分词器使用

        在需要使用中文分词器的field标签配置fieldType的引用,type="text_ik"要和fieldType的name一致

<field name="shortName" type="text_ik" indexed="true" required="false" stored="true"/>

 

附言:

1、schema.xml中的copyField作用:创建文档索引时将指定字段

2、如果Solr启动提示java.lang.UnsupportedClassVersionError:org/wltea/analyzer/lucene/IKAnalyzer

     则请下载IKAnalyzer另一个版本,再进行测试。如果问题仍旧,请升级JDK版本

配置完毕,重启Solr即可

  • 大小: 5.9 KB
  • 大小: 1.3 KB
分享到:
评论

相关推荐

    ik-analyzer-solr7.zip

    IKAnalyzer是Java开发的一款广泛应用的中文分词器,它的全称是"Intelligent Chinese Analyzer"。这个开源项目致力于提供一个高效、易用且扩展性良好的中文处理工具,它在分词领域表现出色,广泛应用于搜索引擎、信息...

    solr中文分词jar包ik-analyzer 含class配置 ik-analyzer-7.5.0

    Solr是一款强大的全文搜索引擎,广泛应用于各种大数据检索场景。在处理中文内容时,分词是...总之,Ik Analyzer 7.5.0是Solr处理中文文本的得力工具,通过合理的配置和使用,可以提升Solr在中文搜索中的性能和准确性。

    ikanalyzer-solr5

    ikanalyzer-solr5 是一个专门为 Solr 5 及以上版本设计的中文分词器插件。在信息检索和自然语言处理领域,分词器是至关重要的工具,它负责将连续的文本切割成有意义的词语,以进行索引和查询操作。ikanalyzer 是一个...

    IKAnalyzer-5.0.jar及solr-analyzer-extra-5.3.jar

    在实际应用中,用户可能需要配置Solr的schema.xml文件,指定使用IKAnalyzer作为默认的字段分析器,同时根据需求选择合适的分词策略。同时,通过solr-analyzer-extra-5.3.jar,用户还可以集成更多的文本处理功能,如...

    ik-analyzer-8.5.0-jar

    2. 创建Analyzer对象,通常使用`org.wltea.analyzer.lucene.IKAnalyzer`作为入口。 3. 使用Analyzer对象的`tokenStream`方法获取TokenStream,这是Lucene的抽象概念,代表分词流。 4. 遍历TokenStream,获取分词结果...

    ikanalyzer-solr5.zip

    ikanalyzer-solr5.zip是一个专门针对中文分词的工具包,主要服务于Solr5版本。这个压缩包包含了两个核心的Java档案文件(jar包):ik-analyzer-solr5-5.x.jar和solr-analyzer-ik-5.1.0.jar,它们在信息技术领域,...

    ikanalyzer-solr8.4.0_solr8_solr_ikanalyzer_中文分词_

    ikanalyzer 是一个专门为Java开发的中文分词器,它基于 Lucene 库,适用于各种文本处理和搜索引擎场景。在 Solr 环境中,ikanalyzer 的作用是为中文文档提供精确的分词服务,从而提升搜索质量和效率。Solr8.4.0 是 ...

    ik-analyzer-solr7-7.x.zip

    标题“ik-analyzer-solr7-7.x.zip”表明这是一个与Solr7相关的压缩包,其中包含了IK Analyzer,一个广泛使用的中文分词工具。这个压缩包特别为Solr7版本进行了优化,提供了完整的配置文件,使得用户可以方便地集成到...

    IKAnalyzer-5.0.jar+solr-analyzer-extra-5.3.jar

    IKAnalyzer是一个专门为Java设计的中文分词器,它广泛应用于Solr、Elasticsearch等全文检索框架中,为用户提供高效的中文处理能力。本篇将详细介绍IKAnalyzer-5.0.jar和solr-analyzer-extra-5.3.jar这两个Solr的IK...

    solr5的中文分词器ik-analyzer-solr5-master.zip

    2. **配置Solr**:在Solr的`schema.xml`或`managed-schema`文件中,配置IK Analyzer作为字段类型分析器。 3. **自定义词典**:可以创建自定义词典,添加行业术语、品牌名称等,提高分词准确度。 4. **启动Solr**:...

    分词器 ikanalyzer-solr6.5

    ikanalyzer-solr6.5 是一个专门为Solr 6.5版本设计的中文分词器,它基于ikanalyzer,并且进行了优化以更好地适应Solr的索引和搜索需求。ikanalyzer是一个开源的、基于Java实现的中文分词库,主要用于解决中文文本...

    ikanalyzer-solr

    在Solr的`lib`目录下添加ikanalyzer的jar文件,确保Solr启动时能加载到该分词器。同时,还需要在Solr的`schema.xml`文件中配置分词器,指定字段类型为`text_ik`或`text_ik_max_word`,前者主要用于单个词语的查询,...

    ik分词器ik-analyzer-5.3.0和ikanalyzer-solr6.5-2018

    标题 "ik分词器ik-analyzer-5.3.0和ikanalyzer-solr6.5-2018" 涉及的是两个不同版本的IK分词器,一个是ik-analyzer-5.3.0,适用于Solr 5.5.0,另一个是ikanalyzer-solr6.5-2018,适用于Solr 7.0.0。IK分词器是Java...

    ik-analyzer-solr7

    "ik-analyzer-solr7"是一个专门为Solr7版本设计的中文分词器插件,它在处理中文文本时能展现出强大的分析性能。这个压缩包包含了ik-analyzer与Solr7集成所需的jar包以及详细的使用教程,确保用户能够快速上手并实现...

    ikanalyzer-solr.zip

    在Solr中使用ikanalyzer,我们可以将ikanalyzer的配置文件和jar包添加到Solr的lib目录下,然后在Solr的schema.xml中配置分词器。ikanalyzer-solr5这个文件可能包含了ikanalyzer针对Solr5版本的特定优化或适配。对于...

    solr-7.7.2+ik-analyzer-solr7x.zip

    安装和配置过程通常包括解压压缩包、配置Solr的schema.xml文件以包含Ik Analyzer、启动Solr服务,并将Ik Analyzer相关的jar文件添加到Solr的类路径中。 总之,"solr-7.7.2+ik-analyzer-solr7x.zip"提供了Solr 7.7.2...

    ik-analyzer-solr:用于solr 7.x-8.x的ik-analyzer

    ik-analyzer-solr 用于solr 7.x-8.x的ik-analyzer 简介 适应最新版本的solr 7&8; 扩展IK首词库: 分词工具 词库中词的数量 ...关闭默认主词典请在IKAnalyzer.cfg.xml配置文件中设置use_main_dict为fals

    Solr6.0集成IK-Analyzer分词器

    IK Analyzer是一款优秀的开源中文分词器,尤其在处理现代汉语的分词效果上表现突出。在Solr中集成IK Analyzer,能够更好地对中文内容进行索引和搜索,提高查询效率和准确性。 **Solr6.0集成IK Analyzer的过程主要...

Global site tag (gtag.js) - Google Analytics