参考:
http://wiki.apache.org/solr/AnalyzersTokenizersTokenFilters
1:
从 http://ik-analyzer.googlecode.com/下载 IK Analyzer
解压IK Analyzer 2012FF_hf1.zip,将解压目录下的IKAnalyzer2012FF_u1.jar,
放到solr的solr/WEB-INF/lib/目录下,将 IKAnalyzer.cfg.xml,stopword.dic 放到solr/WEB-INF/lib/classes目录下
2:
实现中文分词,配置方法如下:
<fieldType name="text_ik" class="solr.TextField"> <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/> <analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/> </fieldType>
引用中文分词fieldType:
<field name="text" type="text_ik" indexed="true" stored="false" multiValued="true"/>
完毕!
----------------------------
其他配置方法:
使用IKAnalyzer 的配置:
<schema name="example" version="1.1"> …… <fieldType name="text" class="solr.TextField"> <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/> </fieldType> …… </schema>
使用IKTokenizerFactory 的配置:
<fieldType name="text" class="solr.TextField" > <analyzer type="index"> <tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory" isMaxWordLength="false"/> …… </analyzer> <analyzer type="query"> <tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory" isMaxWordLength="true"/> …… </analyzer> </fieldType>
相关推荐
标题中的"IKAnalyzer-5.0.jar"和"solr-analyzer-extra-5.3.jar"是两个在中文搜索引擎系统Solr中常见的组件,主要用于处理中文分词问题。这两个组件在构建高性能的中文搜索解决方案中扮演着至关重要的角色。 首先,...
ikanalyzer-solr5 是一个专门为 Solr 5 及以上版本设计的中文分词器插件。在信息检索和自然语言处理领域,分词器是至关重要的工具,它负责将连续的文本切割成有意义的词语,以进行索引和查询操作。ikanalyzer 是一个...
这个资源是ik-analyzer的8.5.0版本,包含了一个名为"ik-analyzer-8.5.0-jar"的JAR文件,它是ik-analyzer的核心库,用于集成到Java项目中进行分词处理。 一、ik-analyzer简介 ik-analyzer的全称是"IK Analyzer智能...
《ik-analyzer-7.6.0-jar:中文分词利器详解》 在Java开发领域,处理中文文本是一项挑战,因为中文句子没有明显的分隔符,如何进行有效的分词成为了一个关键问题。ik-analyzer是一款针对Java平台设计的高性能中文...
ikanalyzer-solr6.5 是一个专门为Solr 6.5版本设计的中文分词器,它基于ikanalyzer,并且进行了优化以更好地适应Solr的索引和搜索需求。ikanalyzer是一个开源的、基于Java实现的中文分词库,主要用于解决中文文本...
本篇将详细介绍IKAnalyzer-5.0.jar和solr-analyzer-extra-5.3.jar这两个Solr的IK分词器组件及其功能。 首先,IKAnalyzer-5.0.jar是IK分词器的主要核心库,由开源社区维护和更新。这个版本的IKAnalyzer支持词典动态...
解压"ik-analyzer-solr7.zip"后,你会得到ik-analyzer-solr7.x目录,这个目录包含了IKAnalyzer在Solr中的所有相关组件。通常,这些组件包括配置文件、分词器的JAR库以及可能的字典文件。配置文件(如`schema.xml`或`...
《ik-analyzer-7.4.0.jar:Java语言中的智能中文分词工具》 在IT领域,尤其是在中文文本处理中,中文分词是至关重要的一步。它涉及到搜索引擎、信息检索、自然语言处理等多个应用场景。ik-analyzer是一个专门针对...
各位Java码农们苦苦找寻的IKAnalyzer-3.2.8.jar,直接使用maven命令行安装到本地仓库即可。也可以上传到nexus;...-DgroupId=org.wltea.ik-analyzer -DartifactId=ik-analyzer -Dversion=3.2.8 -Dpackaging=jar
ikanalyzer 是一个专门为Java开发的中文分词器,它基于 Lucene 库,适用于各种文本处理和搜索引擎场景。在 Solr 环境中,ikanalyzer 的作用是为中文文档提供精确的分词服务,从而提升搜索质量和效率。Solr8.4.0 是 ...
ikanalyzer 是一个专门为中文分词设计的开源分析器,它在Java环境中运行,主要用于提高搜索引擎的性能和准确性。这个压缩包“ikanalyzer-solr5.zip”显然与ikanalyzer的Solr5集成有关,Solr是Apache软件基金会的一个...
solr更新到6.x的版本了,ik-analyzer-5.x.jar又不好使了。 无意间从"随-忆"的博客中看到了如何去修改源代码,从而让分词器能够适应6.x的版本,亲自尝试了一下,果然可以,于是奉上了自己重新编译的jar包。 6.x的版本...
ikanalyzer-2012_u6 和 IKAnalyzer2012FF_u1 是两种不同的版本的IK Analyzer分词器,这是中国开源社区广泛使用的Java语言实现的中文分词工具。IK Analyzer,全称“Intelligent Chinese Analyzer”,意为智能中文分析...
ikanalyzer-solr5.zip 是一个与IK Analyzer和Solr相关的压缩包文件,它主要用于在Apache Solr中配置和使用IK Analyzer。IK Analyzer是一个开源的、高性能的中文分词器,设计目标是为Java开发人员提供一个简单易用、...
solr5+和ikanalyzer集成包主要内容包括:ext.dic、IKAnalyzer.cfg.xml和stopword.dic;ik-analyzer-solr5-5.x.jar 和 solr-analyzer-ik-5.1.0.jar
标题 "ik分词器ik-analyzer-5.3.0和ikanalyzer-solr6.5-2018" 涉及的是两个不同版本的IK分词器,一个是ik-analyzer-5.3.0,适用于Solr 5.5.0,另一个是ikanalyzer-solr6.5-2018,适用于Solr 7.0.0。IK分词器是Java...
IKAnalyzer是一款广泛应用于Java环境中的开源中文分词器,它以其高效、灵活的特点在信息检索、文本分析等领域受到青睐。标题中的"IKAnalyzer-3.2.8.jar"表明这是IKAnalyzer的一个特定版本,即3.2.8,通常以JAR(Java...
《ik-analyzer-5.3.1.RELEASE:中文分词器详解》 ik-analyzer是Java语言开发的一款高效、灵活的中文分词工具,专为处理中文文本而设计。这款开源项目在IT行业中广受好评,特别是在搜索引擎、信息检索、自然语言处理...
标题提到的"ik-analyzer 7.5.0"是Ik Analyzer的一个特定版本,这个版本包含了对Solr的支持,并且提供了类(class)配置,使得用户可以方便地集成到Solr环境中。Ik Analyzer的发展历程中,不断优化了分词效果,提高了...