1. ik
现在不支持bin/plugin -install medcl/elasticsearch-analysis-ik/1.1.3
在elasticsearch/plugins目录下建analysis-ik目录
然后直接下载安装包
https://github.com/medcl/elasticsearch-rtf/tree/master/elasticsearch/plugins/analysis-ik
- cd plugins
- mkdir analysis-ik
- cd analysis-ik
- wget https://github.com/medcl/elasticsearch-rtf/blob/master/elasticsearch/plugins/analysis-ik/elasticsearch-analysis-ik-1.1.4.jar?raw=true --no-check-certificate
词库还是一样
- cd config
- wget http://github.com/downloads/medcl/elasticsearch-analysis-ik/ik.zip --no-check-certificate
- unzip ik.zip
- rm ik.zip
2. mmseg
直接下载安装包安装
- cd plugins
- mkdir analysis-mmseg
- cd analysis-mmseg
- wget https://github.com/medcl/elasticsearch-rtf/blob/master/elasticsearch/plugins/analysis-mmseg/elasticsearch-analysis-mmseg-1.1.2.jar?raw=true --no-check-certificate
词库
- cd config
- mkdir mmseg
- wget https://github.com/medcl/elasticsearch-rtf/raw/master/elasticsearch/config/mmseg/chars.dic --no-check-certificate
- wget https://github.com/medcl/elasticsearch-rtf/raw/master/elasticsearch/config/mmseg/units.dic --no-check-certificate
- wget https://github.com/medcl/elasticsearch-rtf/raw/master/elasticsearch/config/mmseg/words-my.dic --no-check-certificate
- wget https://github.com/medcl/elasticsearch-rtf/raw/master/elasticsearch/config/mmseg/words.dic --no-check-certificate
3. paoding
直接下载安装包安装
- cd plugins
- mkdir analysis-paoding
- cd analysis-paoding
- wget https://github.com/medcl/elasticsearch-rtf/blob/master/elasticsearch/plugins/analysis-paoding/elasticsearch-analysis-paoding-1.0.1.jar?raw=true --no-check-certificate
词库
- cd config
- mkdir paoding
- wget https://github.com/downloads/medcl/elasticsearch-analysis-paoding/config.zip --no-check-certificate
- unzip config.zip
- cp -rp config/paoding/* .
- rm -rf config
- rm config.zip
完整elasticsearch配置
编辑elasticsearch.yml
- index:
- analysis:
- tokenizer:
- mmseg_maxword:
- type: mmseg
- seg_type: "max_word"
- mmseg_complex:
- type: mmseg
- seg_type: "complex"
- mmseg_simple:
- type: mmseg
- seg_type: "simple"
- analyzer:
- mmseg:
- alias: [news_analyzer, mmseg_analyzer]
- type: org.elasticsearch.index.analysis.MMsegAnalyzerProvider
- ik:
- alias: [ik_analyzer]
- type: org.elasticsearch.index.analysis.IkAnalyzerProvider
- ik_max_word:
- type: ik
- use_smart: false
- ik_smart:
- type: ik
- use_smart: true
- paoding:
- alias: [paoding_analyzer]
- type: org.elasticsearch.index.analysis.PaodingAnalyzerProvider
相关推荐
elasticsearch中文分词插件,解压至ES安装目录,如D:\works\elasticsearch-6.4.0\plugins\ik,注意,不用修改elasticsearch.yml,就可以直接使用了。
通过以上步骤,我们成功地在 ElasticSearch 中安装并启用了 ik 分词插件,大大提升了中文文本的搜索性能。ik 分词器能够根据不同的场景需求灵活选择分词模式,使得搜索结果更加准确、高效。对于处理大量中文文本数据...
elasticsearch-6.4.2 hanlp分词插件 windows下安装命令 首先进入es bin目录 elasticsearch-6.4.2\bin> 然后执行 elasticsearch-plugin.bat install file:///E:/elasticsearch-analysis-ik-6.4.2.zip Linux下安装...
"ansj elasticsearch 独立分词插件"是一个专门针对Elasticsearch(ES)设计的中文分词组件,它结合了ANSJ分词库的强大功能,为ES提供了高效、精准的中文分词服务。 **ANSJ分词库** ANSJ(全称:Advanced NLP ...
**Elasticsearch 7.17.10 分词器插件安装详解** 在日志收集和数据分析领域,Elasticsearch(简称ES)扮演着重要的角色。作为一个强大的全文搜索引擎,Elasticsearch允许用户通过简单的API进行数据索引、搜索、分析...
在中文环境下,为了实现精确的分词和搜索,我们需要安装适合版本的分词插件,如“elasticsearch-analysis-ik”。这个插件是为Elasticsearch设计的中文分词器,能够对中文文本进行有效的分词处理,提高搜索的准确性和...
IK分词器(Intelligent Chinese Analyzer for Elasticsearch)是为Elasticsearch设计的一款强大、灵活且高效的中文分词插件。它支持自定义扩展词典、同义词扩展、动态词典加载等功能,能更好地适应中文的复杂语境。 ...
本教程将围绕“elasticsearch自定义分词插件”这一主题展开,通过分析一个简单的空格分词插件实例,帮助你理解如何编写自己的分词插件。 首先,我们需要了解Elasticsearch插件的基本结构。Elasticsearch插件分为两...
标题“es2.4.4添加ik分词插件”涉及到的是在Elasticsearch(ES)2.4.4版本中安装IK分词插件的过程。这个过程是为了解决中文文本的索引和搜索问题,因为Elasticsearch默认的分词器主要针对英文,对中文的支持不够理想...
基于Elasticsearch的中文分词插件 项目简介 本项目是一个基于Elasticsearch的中文分词插件,使用Ansj作为分词引擎。该插件旨在提供高效、准确的中文文本分析功能,适用于各种需要中文分词的搜索和索引场景。 ...
IK(Intelligent Word)分词插件是为Elasticsearch量身定制的一款强大中文分词工具,它能够对中文进行精准和高效的分词。 **1. IK分词插件介绍** IK分词插件是Elasticsearch中的一个重要组件,主要用于中文分词。...
IK分词器是针对Elasticsearch的中文分词插件,能较好地处理中文分词问题,支持多种自定义策略,以满足不同的应用场景需求。 接下来,我们来看看如何安装elasticsearch-analysis-ik插件。这个过程涉及到了一些关键的...
标题 "基于hanlp的elasticsearch分词插件" 指的是将自然语言处理库HanLP与搜索引擎Elasticsearch相结合,开发出一个用于Elasticsearch的分词插件。这样的插件可以提升Elasticsearch在中文文本处理上的性能,使其能够...
"elasticsearch-analysis-pinyin-6.8.3.jar" 是这个拼音分词插件的核心文件,它提供了将中文字符转换为拼音的能力,使得用户可以通过输入汉字的拼音进行搜索,极大地扩展了Elasticsearch的搜索范围。此外,"nlp-lang...
Elasticsearch的IK分词插件是处理中文文本的强大工具,它提升了ES对中文文本的索引和搜索性能。正确地安装和配置IK插件,可以帮助你更好地利用ES进行中文数据的管理和分析。同时,IK的灵活性和智能化特性使得它能够...
"elasticsearch-ik中文分词器7.6.2" 正是为了解决这个问题而设计的,它是专门为Elasticsearch 7.6.2版本定制的中文分词插件。 **IK分词器介绍** IK(Intelligent Chinese)分词器是为Java开发的一个成熟的中文分...
通过以上步骤,你就成功地在Elasticsearch 7.17.8上安装并配置了IK分词器插件,可以有效地处理中文数据了。记得定期更新分词器和Elasticsearch,以保持最佳性能和安全性。在实际应用中,你还可以根据需要调整分词器...
### Elasticsearch 安装 IK 分词器详解 #### 一、背景及需求分析 Elasticsearch 是一款基于 Lucene 的搜索引擎,广泛...通过以上步骤,可以有效地在 Elasticsearch 中安装并配置 IK 分词器,提高中文文本处理的能力。
对于中文来说,由于其独特的语法结构,需要特定的分词算法来处理,而`elasticsearch-analysis-ik`就是一款优秀的中文分词插件,能够有效地进行中文分词。 安装步骤如下: 1. **下载插件**: 根据提供的文件列表,...