`
zhousheng29
  • 浏览: 150666 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

ElasticSearch 中文分词插件安装

阅读更多
1. ik
现在不支持bin/plugin -install medcl/elasticsearch-analysis-ik/1.1.3
在elasticsearch/plugins目录下建analysis-ik目录
然后直接下载安装包
https://github.com/medcl/elasticsearch-rtf/tree/master/elasticsearch/plugins/analysis-ik
cd plugins
mkdir analysis-ik
cd analysis-ik
wget https://github.com/medcl/elasticsearch-rtf/blob/master/elasticsearch/plugins/analysis-ik/elasticsearch-analysis-ik-1.1.4.jar?raw=true --no-check-certificate


词库还是一样
cd config
wget http://github.com/downloads/medcl/elasticsearch-analysis-ik/ik.zip --no-check-certificate
unzip ik.zip
rm ik.zip


2. mmseg
直接下载安装包安装
cd plugins
mkdir analysis-mmseg
cd analysis-mmseg
wget https://github.com/medcl/elasticsearch-rtf/blob/master/elasticsearch/plugins/analysis-mmseg/elasticsearch-analysis-mmseg-1.1.2.jar?raw=true --no-check-certificate


词库
cd config
mkdir mmseg
wget https://github.com/medcl/elasticsearch-rtf/raw/master/elasticsearch/config/mmseg/chars.dic --no-check-certificate
wget https://github.com/medcl/elasticsearch-rtf/raw/master/elasticsearch/config/mmseg/units.dic --no-check-certificate
wget https://github.com/medcl/elasticsearch-rtf/raw/master/elasticsearch/config/mmseg/words-my.dic --no-check-certificate
wget https://github.com/medcl/elasticsearch-rtf/raw/master/elasticsearch/config/mmseg/words.dic --no-check-certificate


3. paoding
直接下载安装包安装
cd plugins
mkdir analysis-paoding
cd analysis-paoding
wget https://github.com/medcl/elasticsearch-rtf/blob/master/elasticsearch/plugins/analysis-paoding/elasticsearch-analysis-paoding-1.0.1.jar?raw=true --no-check-certificate


词库
cd config
mkdir paoding
wget https://github.com/downloads/medcl/elasticsearch-analysis-paoding/config.zip --no-check-certificate
unzip config.zip
cp -rp config/paoding/* .
rm -rf config
rm config.zip


完整elasticsearch配置
编辑elasticsearch.yml

index:
  analysis:
    tokenizer:
      mmseg_maxword:
          type: mmseg
          seg_type: "max_word"
      mmseg_complex:
          type: mmseg
          seg_type: "complex"
      mmseg_simple:
          type: mmseg
          seg_type: "simple"
    analyzer:
      mmseg:
          alias: [news_analyzer, mmseg_analyzer]
          type: org.elasticsearch.index.analysis.MMsegAnalyzerProvider
      ik:
          alias: [ik_analyzer]
          type: org.elasticsearch.index.analysis.IkAnalyzerProvider
      ik_max_word:
          type: ik
          use_smart: false
      ik_smart:
          type: ik
          use_smart: true
      paoding:
          alias: [paoding_analyzer]
          type: org.elasticsearch.index.analysis.PaodingAnalyzerProvider





分享到:
评论
2 楼 zhousheng29 2014-01-07  
下载相应的包,其他的解压安装类似,或者不会就用图形工具操作。
1 楼 zzzhenyu 2013-12-25  
您好,请问脚本的命令怎么执行?windows环境

相关推荐

    elasticsearch中文分词插件

    elasticsearch中文分词插件,解压至ES安装目录,如D:\works\elasticsearch-6.4.0\plugins\ik,注意,不用修改elasticsearch.yml,就可以直接使用了。

    ElasticSearch安装ik分词插件.txt

    通过以上步骤,我们成功地在 ElasticSearch 中安装并启用了 ik 分词插件,大大提升了中文文本的搜索性能。ik 分词器能够根据不同的场景需求灵活选择分词模式,使得搜索结果更加准确、高效。对于处理大量中文文本数据...

    Elasticsearch hanlp 分词插件

    elasticsearch-6.4.2 hanlp分词插件 windows下安装命令 首先进入es bin目录 elasticsearch-6.4.2\bin> 然后执行 elasticsearch-plugin.bat install file:///E:/elasticsearch-analysis-ik-6.4.2.zip Linux下安装...

    ansj elasticsearch 独立分词插件

    "ansj elasticsearch 独立分词插件"是一个专门针对Elasticsearch(ES)设计的中文分词组件,它结合了ANSJ分词库的强大功能,为ES提供了高效、精准的中文分词服务。 **ANSJ分词库** ANSJ(全称:Advanced NLP ...

    elasticSearch(ES)最新版 ik分词插件7.10 elasticsearch-analysis-ik-7.10.0

    在中文环境下,为了实现精确的分词和搜索,我们需要安装适合版本的分词插件,如“elasticsearch-analysis-ik”。这个插件是为Elasticsearch设计的中文分词器,能够对中文文本进行有效的分词处理,提高搜索的准确性和...

    elasticsearch7.17.10版本分词器插件安装包

    **Elasticsearch 7.17.10 分词器插件安装详解** 在日志收集和数据分析领域,Elasticsearch(简称ES)扮演着重要的角色。作为一个强大的全文搜索引擎,Elasticsearch允许用户通过简单的API进行数据索引、搜索、分析...

    elasticsearch自定义分词插件

    本教程将围绕“elasticsearch自定义分词插件”这一主题展开,通过分析一个简单的空格分词插件实例,帮助你理解如何编写自己的分词插件。 首先,我们需要了解Elasticsearch插件的基本结构。Elasticsearch插件分为两...

    elasticsearch7.17.11版本分词器插件安装包

    IK分词器(Intelligent Chinese Analyzer for Elasticsearch)是为Elasticsearch设计的一款强大、灵活且高效的中文分词插件。它支持自定义扩展词典、同义词扩展、动态词典加载等功能,能更好地适应中文的复杂语境。 ...

    es2.4.4添加ik分词插件

    标题“es2.4.4添加ik分词插件”涉及到的是在Elasticsearch(ES)2.4.4版本中安装IK分词插件的过程。这个过程是为了解决中文文本的索引和搜索问题,因为Elasticsearch默认的分词器主要针对英文,对中文的支持不够理想...

    基于Elasticsearch的中文分词插件.zip

    基于Elasticsearch的中文分词插件 项目简介 本项目是一个基于Elasticsearch的中文分词插件,使用Ansj作为分词引擎。该插件旨在提供高效、准确的中文文本分析功能,适用于各种需要中文分词的搜索和索引场景。 ...

    elasticsearch6的分词插件ik.zip

    IK(Intelligent Word)分词插件是为Elasticsearch量身定制的一款强大中文分词工具,它能够对中文进行精准和高效的分词。 **1. IK分词插件介绍** IK分词插件是Elasticsearch中的一个重要组件,主要用于中文分词。...

    elasticsearch7.17.13版本分词器插件安装包

    IK分词器是针对Elasticsearch的中文分词插件,能较好地处理中文分词问题,支持多种自定义策略,以满足不同的应用场景需求。 接下来,我们来看看如何安装elasticsearch-analysis-ik插件。这个过程涉及到了一些关键的...

    基于hanlp的elasticsearch分词插件

    标题 "基于hanlp的elasticsearch分词插件" 指的是将自然语言处理库HanLP与搜索引擎Elasticsearch相结合,开发出一个用于Elasticsearch的分词插件。这样的插件可以提升Elasticsearch在中文文本处理上的性能,使其能够...

    elasticsearch6.8.3拼音分词插件

    "elasticsearch-analysis-pinyin-6.8.3.jar" 是这个拼音分词插件的核心文件,它提供了将中文字符转换为拼音的能力,使得用户可以通过输入汉字的拼音进行搜索,极大地扩展了Elasticsearch的搜索范围。此外,"nlp-lang...

    elasticsearch-ik分词插件.rar

    Elasticsearch的IK分词插件是处理中文文本的强大工具,它提升了ES对中文文本的索引和搜索性能。正确地安装和配置IK插件,可以帮助你更好地利用ES进行中文数据的管理和分析。同时,IK的灵活性和智能化特性使得它能够...

    elasticsearch-ik中文分词器7.6.2.zip

    "elasticsearch-ik中文分词器7.6.2" 正是为了解决这个问题而设计的,它是专门为Elasticsearch 7.6.2版本定制的中文分词插件。 **IK分词器介绍** IK(Intelligent Chinese)分词器是为Java开发的一个成熟的中文分...

    elasticsearch7.17.8版本分词器插件安装包

    通过以上步骤,你就成功地在Elasticsearch 7.17.8上安装并配置了IK分词器插件,可以有效地处理中文数据了。记得定期更新分词器和Elasticsearch,以保持最佳性能和安全性。在实际应用中,你还可以根据需要调整分词器...

    es安装ik分词器

    ### Elasticsearch 安装 IK 分词器详解 #### 一、背景及需求分析 Elasticsearch 是一款基于 Lucene 的搜索引擎,广泛...通过以上步骤,可以有效地在 Elasticsearch 中安装并配置 IK 分词器,提高中文文本处理的能力。

    Jieba中文分词插件elasticsearch-jieba-plugin.zip

    elasticsearch-jieba-plugin 是 Jieba 中文分词插件。试用 Elasticsearch 5.1.2 版本,基于 huaban 开源的的 jieba java 实现。使用checkout tag: v5.1.2git checkout v5.1.2运行gradle buildPluginZip创建 ...

Global site tag (gtag.js) - Google Analytics