`

ElasticSearch 中文分词插件安装

阅读更多

1. ik 
现在不支持bin/plugin -install medcl/elasticsearch-analysis-ik/1.1.3 
在elasticsearch/plugins目录下建analysis-ik目录 
然后直接下载安装包 
https://github.com/medcl/elasticsearch-rtf/tree/master/elasticsearch/plugins/analysis-ik 

Script代码  收藏代码
  1. cd plugins  
  2. mkdir analysis-ik  
  3. cd analysis-ik  
  4. wget https://github.com/medcl/elasticsearch-rtf/blob/master/elasticsearch/plugins/analysis-ik/elasticsearch-analysis-ik-1.1.4.jar?raw=true --no-check-certificate  



词库还是一样 

Script代码  收藏代码
  1. cd config  
  2. wget http://github.com/downloads/medcl/elasticsearch-analysis-ik/ik.zip --no-check-certificate  
  3. unzip ik.zip  
  4. rm ik.zip  



2. mmseg 
直接下载安装包安装 

Script代码  收藏代码
  1. cd plugins  
  2. mkdir analysis-mmseg  
  3. cd analysis-mmseg  
  4. wget https://github.com/medcl/elasticsearch-rtf/blob/master/elasticsearch/plugins/analysis-mmseg/elasticsearch-analysis-mmseg-1.1.2.jar?raw=true --no-check-certificate  



词库 

Script代码  收藏代码
  1. cd config  
  2. mkdir mmseg  
  3. wget https://github.com/medcl/elasticsearch-rtf/raw/master/elasticsearch/config/mmseg/chars.dic --no-check-certificate  
  4. wget https://github.com/medcl/elasticsearch-rtf/raw/master/elasticsearch/config/mmseg/units.dic --no-check-certificate  
  5. wget https://github.com/medcl/elasticsearch-rtf/raw/master/elasticsearch/config/mmseg/words-my.dic --no-check-certificate  
  6. wget https://github.com/medcl/elasticsearch-rtf/raw/master/elasticsearch/config/mmseg/words.dic --no-check-certificate  



3. paoding 
直接下载安装包安装 

Script代码  收藏代码
  1. cd plugins  
  2. mkdir analysis-paoding  
  3. cd analysis-paoding  
  4. wget https://github.com/medcl/elasticsearch-rtf/blob/master/elasticsearch/plugins/analysis-paoding/elasticsearch-analysis-paoding-1.0.1.jar?raw=true --no-check-certificate  



词库 

Script代码  收藏代码
  1. cd config  
  2. mkdir paoding  
  3. wget https://github.com/downloads/medcl/elasticsearch-analysis-paoding/config.zip --no-check-certificate  
  4. unzip config.zip  
  5. cp -rp config/paoding/* .  
  6. rm -rf config  
  7. rm config.zip  



完整elasticsearch配置 
编辑elasticsearch.yml 

Script代码  收藏代码
  1. index:  
  2.   analysis:  
  3.     tokenizer:  
  4.       mmseg_maxword:  
  5.           type: mmseg  
  6.           seg_type: "max_word"  
  7.       mmseg_complex:  
  8.           type: mmseg  
  9.           seg_type: "complex"  
  10.       mmseg_simple:  
  11.           type: mmseg  
  12.           seg_type: "simple"  
  13.     analyzer:  
  14.       mmseg:  
  15.           alias: [news_analyzer, mmseg_analyzer]  
  16.           type: org.elasticsearch.index.analysis.MMsegAnalyzerProvider  
  17.       ik:  
  18.           alias: [ik_analyzer]  
  19.           type: org.elasticsearch.index.analysis.IkAnalyzerProvider  
  20.       ik_max_word:  
  21.           type: ik  
  22.           use_smart: false  
  23.       ik_smart:  
  24.           type: ik  
  25.           use_smart: true  
  26.       paoding:  
  27.           alias: [paoding_analyzer]  
  28.           type: org.elasticsearch.index.analysis.PaodingAnalyzerProvider  

 

分享到:
评论

相关推荐

    elasticsearch中文分词插件

    elasticsearch中文分词插件,解压至ES安装目录,如D:\works\elasticsearch-6.4.0\plugins\ik,注意,不用修改elasticsearch.yml,就可以直接使用了。

    ElasticSearch安装ik分词插件.txt

    通过以上步骤,我们成功地在 ElasticSearch 中安装并启用了 ik 分词插件,大大提升了中文文本的搜索性能。ik 分词器能够根据不同的场景需求灵活选择分词模式,使得搜索结果更加准确、高效。对于处理大量中文文本数据...

    Elasticsearch hanlp 分词插件

    elasticsearch-6.4.2 hanlp分词插件 windows下安装命令 首先进入es bin目录 elasticsearch-6.4.2\bin> 然后执行 elasticsearch-plugin.bat install file:///E:/elasticsearch-analysis-ik-6.4.2.zip Linux下安装...

    ansj elasticsearch 独立分词插件

    "ansj elasticsearch 独立分词插件"是一个专门针对Elasticsearch(ES)设计的中文分词组件,它结合了ANSJ分词库的强大功能,为ES提供了高效、精准的中文分词服务。 **ANSJ分词库** ANSJ(全称:Advanced NLP ...

    elasticsearch7.17.10版本分词器插件安装包

    **Elasticsearch 7.17.10 分词器插件安装详解** 在日志收集和数据分析领域,Elasticsearch(简称ES)扮演着重要的角色。作为一个强大的全文搜索引擎,Elasticsearch允许用户通过简单的API进行数据索引、搜索、分析...

    elasticSearch(ES)最新版 ik分词插件7.10 elasticsearch-analysis-ik-7.10.0

    在中文环境下,为了实现精确的分词和搜索,我们需要安装适合版本的分词插件,如“elasticsearch-analysis-ik”。这个插件是为Elasticsearch设计的中文分词器,能够对中文文本进行有效的分词处理,提高搜索的准确性和...

    elasticsearch7.17.11版本分词器插件安装包

    IK分词器(Intelligent Chinese Analyzer for Elasticsearch)是为Elasticsearch设计的一款强大、灵活且高效的中文分词插件。它支持自定义扩展词典、同义词扩展、动态词典加载等功能,能更好地适应中文的复杂语境。 ...

    elasticsearch自定义分词插件

    本教程将围绕“elasticsearch自定义分词插件”这一主题展开,通过分析一个简单的空格分词插件实例,帮助你理解如何编写自己的分词插件。 首先,我们需要了解Elasticsearch插件的基本结构。Elasticsearch插件分为两...

    es2.4.4添加ik分词插件

    标题“es2.4.4添加ik分词插件”涉及到的是在Elasticsearch(ES)2.4.4版本中安装IK分词插件的过程。这个过程是为了解决中文文本的索引和搜索问题,因为Elasticsearch默认的分词器主要针对英文,对中文的支持不够理想...

    基于Elasticsearch的中文分词插件.zip

    基于Elasticsearch的中文分词插件 项目简介 本项目是一个基于Elasticsearch的中文分词插件,使用Ansj作为分词引擎。该插件旨在提供高效、准确的中文文本分析功能,适用于各种需要中文分词的搜索和索引场景。 ...

    elasticsearch6的分词插件ik.zip

    IK(Intelligent Word)分词插件是为Elasticsearch量身定制的一款强大中文分词工具,它能够对中文进行精准和高效的分词。 **1. IK分词插件介绍** IK分词插件是Elasticsearch中的一个重要组件,主要用于中文分词。...

    elasticsearch7.17.13版本分词器插件安装包

    IK分词器是针对Elasticsearch的中文分词插件,能较好地处理中文分词问题,支持多种自定义策略,以满足不同的应用场景需求。 接下来,我们来看看如何安装elasticsearch-analysis-ik插件。这个过程涉及到了一些关键的...

    基于hanlp的elasticsearch分词插件

    标题 "基于hanlp的elasticsearch分词插件" 指的是将自然语言处理库HanLP与搜索引擎Elasticsearch相结合,开发出一个用于Elasticsearch的分词插件。这样的插件可以提升Elasticsearch在中文文本处理上的性能,使其能够...

    elasticsearch6.8.3拼音分词插件

    "elasticsearch-analysis-pinyin-6.8.3.jar" 是这个拼音分词插件的核心文件,它提供了将中文字符转换为拼音的能力,使得用户可以通过输入汉字的拼音进行搜索,极大地扩展了Elasticsearch的搜索范围。此外,"nlp-lang...

    elasticsearch-ik分词插件.rar

    Elasticsearch的IK分词插件是处理中文文本的强大工具,它提升了ES对中文文本的索引和搜索性能。正确地安装和配置IK插件,可以帮助你更好地利用ES进行中文数据的管理和分析。同时,IK的灵活性和智能化特性使得它能够...

    elasticsearch-ik中文分词器7.6.2.zip

    "elasticsearch-ik中文分词器7.6.2" 正是为了解决这个问题而设计的,它是专门为Elasticsearch 7.6.2版本定制的中文分词插件。 **IK分词器介绍** IK(Intelligent Chinese)分词器是为Java开发的一个成熟的中文分...

    elasticsearch7.17.8版本分词器插件安装包

    通过以上步骤,你就成功地在Elasticsearch 7.17.8上安装并配置了IK分词器插件,可以有效地处理中文数据了。记得定期更新分词器和Elasticsearch,以保持最佳性能和安全性。在实际应用中,你还可以根据需要调整分词器...

    es安装ik分词器

    ### Elasticsearch 安装 IK 分词器详解 #### 一、背景及需求分析 Elasticsearch 是一款基于 Lucene 的搜索引擎,广泛...通过以上步骤,可以有效地在 Elasticsearch 中安装并配置 IK 分词器,提高中文文本处理的能力。

    elasticsearch7.17.14版本分词器插件安装包

    对于中文来说,由于其独特的语法结构,需要特定的分词算法来处理,而`elasticsearch-analysis-ik`就是一款优秀的中文分词插件,能够有效地进行中文分词。 安装步骤如下: 1. **下载插件**: 根据提供的文件列表,...

Global site tag (gtag.js) - Google Analytics