`

配置solr+ikanalyzer+自定义词库

阅读更多
这里的版本为solr 3.5 + ikanalyzer 3.2.8

ik下载版本https://code.google.com/p/ik-analyzer/downloads/detail?name=IKAnalyzer3.2.8%20bin.zip&can=2&q=


1. 配置solr/home/conf/schema.xml
加入<fieldType name="ik" class="solr.TextField">
<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>

2. 修改ik的jar包。 首先修改IKAnalyzer.cfg.xml, 添加我们的自定义词库文件。

<entry key="ext_dict">
		/mywords.dic;
	</entry>

把mywords.dic和该cfg.xml文件一起放到jar的classpath中。如下图所示:






3. 将jar包放入到solr/server/solr/WEB-INF/lib
就可以了



  • 大小: 28 KB
分享到:
评论

相关推荐

    Solr java IKAnalyzer词库

    标题中的“Solr java IKAnalyzer词库”指的是在Java环境下使用Apache Solr搜索引擎时,配合IKAnalyzer进行中文分词的实践。IKAnalyzer是一个开源的、基于Java实现的中文分词器,它针对Solr这样的全文检索框架优化,...

    ikanalyzer-solr.zip

    在Solr中使用ikanalyzer,我们可以将ikanalyzer的配置文件和jar包添加到Solr的lib目录下,然后在Solr的schema.xml中配置分词器。ikanalyzer-solr5这个文件可能包含了ikanalyzer针对Solr5版本的特定优化或适配。对于...

    solr配置ikanalyzer分词文件以使用说明

    在这个说明中,我们将详细讲解如何在Solr 6.0中配置ikanalyzer分词文件,以实现对中文文本的有效处理。 1. **ikanalyzer简介** ikanalyzer是一款专门为Java语言设计的开源中文分词库,它基于Apache Lucene项目,...

    solr分词 IKAnalyzer2012FF_hf1.rar

    - 在Solr的schema.xml中配置分析器,指定使用IKAnalyzer,并可自定义参数,如是否开启动态扩展等。 3. **使用与优化**: - 对于特定领域或行业,可以通过扩展词典来提升分词效果,增加专业术语。 - 考虑使用...

    ikanalyzer-solr5

    ikanalyzer-solr5 包含了 ikanalyzer 的特定版本,以及适应 Solr 5.x 版本的配置文件。这些配置文件通常包括字典文件(用于定义分词器认识的词汇)、停用词表(排除一些常见无意义词汇,如“的”、“和”等)和...

    ikanalyzer-solr

    在Solr中集成IK Analyzer,首先需要下载ikanalyzer-solr的压缩包,其中包含了IK Analyzer的jar包以及相应的配置文件。在Solr的`lib`目录下添加ikanalyzer的jar文件,确保Solr启动时能加载到该分词器。同时,还需要在...

    分词器 ikanalyzer-solr6.5

    3. 如果需要自定义词典,ikanalyzer支持加载外部词典,可以在配置文件中指定路径: ```xml ``` 4. 对于高级用法,ikanalyzer还提供了禁用某些词语、动态扩展词典等功能,可以通过调整配置来满足不同场景的需求。...

    IKAnalyzer 适用 lucene和solr 5.4.0版本(新)

    2. **修改 Schema.xml**:在 Solr 的配置文件 Schema.xml 中,定义字段类型(fieldType),指定使用 IKAnalyzer 分词器。 3. **定制词典**:根据业务需求,可以自定义词典,将新词或特定词汇加入到 IKAnalyzer 的...

    ikanalyzer-solr5.zip

    另一方面,solr-analyzer-ik-5.1.0.jar则是ikanalyzer的一个扩展,它提供了更多的自定义功能和优化。Analyzer是Solr中处理文本输入的关键组件,负责对输入的文档进行预处理,如分词、去除停用词等。这个jar包可能...

    IKAnalyzer 支持高版本最新Lucene 5.x、6.x、7.x

    - 对于Solr,需要在schema.xml中定义字段类型并配置IKAnalyzer。 总之,IKAnalyzer作为一款强大的中文分词器,能够很好地适应Lucene的各个高版本,提供稳定、高效的分词服务。无论是用于Lucene的原生应用,还是在...

    solr 中文分词其IKAnalyzer 支持solr版本5.X-7.X

    IKAnalyzer的特性包括支持自定义词典、动态加载、支持多种分词模式等,这些都使其在Solr中具有较高的灵活性和实用性。同时,由于其开源和社区的活跃,IKAnalyzer的更新和改进也较为及时,能够适应不断变化的分词需求...

    ikanalyzer5.5-solr6.5.zip

    2. **配置Solr schema.xml**:在Solr的schema.xml配置文件中,为需要分词的字段指定`&lt;analyzer&gt;`标签,使用IKAnalyzer的类名,如`org.wltea.analyzer.lucene.IKAnalyzer`。 3. **启动Solr**:更新完配置后,重启Solr...

    solr-4.10.3+ik分词器

    在实际应用中,你可能还需要自定义索引字段,设置分词策略,甚至为IK分词器配置扩展词库,以满足特定的业务需求。IK分词器提供了丰富的参数调整选项,如是否开启全模式、是否开启英文识别等,可以根据实际情况灵活...

    ikanalyzer-solr7.2.1.zip

    本资源"ikanalyzer-solr7.2.1.zip"正是针对Solr 7.2.1版本的IK Analyzer配置包,旨在帮助用户实现IK Analyzer与Solr的无缝对接,以便更好地处理中文语句的分词工作。 首先,我们需要理解Solr的核心功能。Solr是...

    IKAnalyzer分词及solr4103配置说明

    2. **配置IKAnalyzer**:将IKAnalyzer的jar包和词典文件放入Solr的lib目录下。同时,在solrconfig.xml文件中配置Analyzer为IKAnalyzer,指定词典路径。 3. **创建字段类型**:在schema.xml文件中,定义一个使用IK...

    IK Analyzer 2012FF_hf1.7z

    例如,对于新兴网络热词,IK Analyzer可能需要定期更新词库以包含这些词汇。 总的来说,IK Analyzer 2012FF_hf1是专门为中文文本处理设计的分词工具,它的存在使得Solr等搜索引擎在处理中文数据时更加精准和高效。...

    IKAnalyzer2012FF_u1.jar下载

    IKAnalyzer2012FF_u1.jar 包含的使用手册会详细讲解如何配置和使用这个分词库,包括安装步骤、配置参数、示例代码等,这对于初学者来说是一份非常宝贵的资源。通过阅读这份手册,开发者可以迅速上手,将IK Analyzer...

    IK+Analyzer+2012FF_hf1 分词器全套使用下载

    在Solr配置中,可以指定使用IK Analyzer作为默认的分析器,以实现对中文文档的高效检索。 ### 3. 搜索引擎的应用 在搜索引擎的构建中,分词器扮演着至关重要的角色。IK Analyzer 2012FF_hf1 可以帮助搜索引擎快速...

    IKanalyzer2012.rar

    - **配置文件**:IK Analyzer的配置文件(如`IKAnalyzer.cfg.xml`)中包含了字典路径、停用词表等信息,需要根据实际部署环境进行正确设置。 - **字典更新**:当遇到新的词汇或需要调整分词效果时,可以通过修改字典...

Global site tag (gtag.js) - Google Analytics