- 浏览: 151892 次
-
文章分类
最新评论
-
x_looking:
Client client = new TransportCl ...
ELASTICSEARCH常见问题 -
辣de冷wmyes:
ElasticSearch视频教程百度网盘地址:http:// ...
一、Elasticsearch安装使用教程
elasticsearch官方只提供smartcn这个中文分词插件,效果不是很好,好在国内有medcl大神(国内最早研究es的人之一)写的两个中文分词插件,一个是ik的,一个是mmseg的,下面分别介绍下两者的用法,其实都差不多的,先安装插件,命令行:
安装ik插件:
plugin -install medcl/elasticsearch-analysis-ik/1.1.0
下载ik相关配置词典文件到config目录
cd config
wget http://github.com/downloads/medcl/elasticsearch-analysis-ik/ik.zip --no-check-certificate
unzip ik.zip
rm ik.zip
安装mmseg插件:
bin/plugin -install medcl/elasticsearch-analysis-mmseg/1.1.0
下载相关配置词典文件到config目录
cd config
wget http://github.com/downloads/medcl/elasticsearch-analysis-mmseg/mmseg.zip --no-check-certificate
unzip mmseg.zip
rm mmseg.zip
分词配置
ik分词配置,在elasticsearch.yml文件中加上
或
这两句的意义相同
mmseg分词配置,也是在在elasticsearch.yml文件中
或
mmseg分词还有些更加个性化的参数设置如下
这样配置完后插件安装完成,启动es就会加载插件。
定义mapping
在添加索引的mapping时就可以这样定义分词器
indexAnalyzer为索引时使用的分词器,searchAnalyzer为搜索时使用的分词器。
java mapping代码如下:
定义完后操作索引就会以指定的分词器来进行分词。
附:
ik分词插件项目地址:https://github.com/medcl/elasticsearch-analysis-ik
mmseg分词插件项目地址:https://github.com/medcl/elasticsearch-analysis-mmseg
如果觉得配置麻烦,也可以下载个配置好的es版本,地址如下:https://github.com/medcl/elasticsearch-rtf
另:
http://www.searchtech.pro/articles/2013/02/18/1361190717673.html
安装ik插件:
plugin -install medcl/elasticsearch-analysis-ik/1.1.0
下载ik相关配置词典文件到config目录
cd config
wget http://github.com/downloads/medcl/elasticsearch-analysis-ik/ik.zip --no-check-certificate
unzip ik.zip
rm ik.zip
安装mmseg插件:
bin/plugin -install medcl/elasticsearch-analysis-mmseg/1.1.0
下载相关配置词典文件到config目录
cd config
wget http://github.com/downloads/medcl/elasticsearch-analysis-mmseg/mmseg.zip --no-check-certificate
unzip mmseg.zip
rm mmseg.zip
分词配置
ik分词配置,在elasticsearch.yml文件中加上
index: analysis: analyzer: ik: alias: [ik_analyzer] type: org.elasticsearch.index.analysis.IkAnalyzerProvider
或
index.analysis.analyzer.ik.type:"ik"
这两句的意义相同
mmseg分词配置,也是在在elasticsearch.yml文件中
index: analysis: analyzer: mmseg: alias: [news_analyzer, mmseg_analyzer] type: org.elasticsearch.index.analysis.MMsegAnalyzerProvider
或
index.analysis.analyzer.default.type : "mmseg"
mmseg分词还有些更加个性化的参数设置如下
index: analysis: tokenizer: mmseg_maxword: type: mmseg seg_type: "max_word" mmseg_complex: type: mmseg seg_type: "complex" mmseg_simple: type: mmseg seg_type: "simple"
这样配置完后插件安装完成,启动es就会加载插件。
定义mapping
在添加索引的mapping时就可以这样定义分词器
{ "page":{ "properties":{ "title":{ "type":"string", "indexAnalyzer":"ik", "searchAnalyzer":"ik" }, "content":{ "type":"string", "indexAnalyzer":"ik", "searchAnalyzer":"ik" } } } }
indexAnalyzer为索引时使用的分词器,searchAnalyzer为搜索时使用的分词器。
java mapping代码如下:
XContentBuilder content = XContentFactory.jsonBuilder().startObject() .startObject("page") .startObject("properties") .startObject("title") .field("type", "string") .field("indexAnalyzer", "ik") .field("searchAnalyzer", "ik") .endObject() .startObject("code") .field("type", "string") .field("indexAnalyzer", "ik") .field("searchAnalyzer", "ik") .endObject() .endObject() .endObject() .endObject()
定义完后操作索引就会以指定的分词器来进行分词。
附:
ik分词插件项目地址:https://github.com/medcl/elasticsearch-analysis-ik
mmseg分词插件项目地址:https://github.com/medcl/elasticsearch-analysis-mmseg
如果觉得配置麻烦,也可以下载个配置好的es版本,地址如下:https://github.com/medcl/elasticsearch-rtf
另:
http://www.searchtech.pro/articles/2013/02/18/1361190717673.html
发表评论
-
使用 Scripted Metric Aggregation 遇到的问题
2016-02-19 14:12 2502使用Scripted Metric Aggregation进行 ... -
ElasticSearch性能优化策略
2016-02-17 19:42 3588ElasticSearch性能优化主要分为4个方面的优化。 一 ... -
Elasticsearch 数据建模 - 处理关联关系
2016-02-17 14:40 1092数据建模(Modeling Your Data ... -
数据类型转换错误
2016-02-15 18:28 1671异常: Invalid shift value (64) in ... -
elasticsearch 排序异常,关键字冲突
2016-02-03 12:35 5960org.elasticsearch.action.search ... -
ElasticSearch不同类型下同名字段排序错误
2016-02-03 11:18 1968虽然之前知道elasticsearch不同类型下同名字段要慎用 ... -
ElasticSearch immense term错误
2016-02-02 19:07 2757在使用ElasticSearch的过程中遇到了一个immens ... -
ELASTICSEARCH常见问题
2015-09-22 15:39 32561. ELASTICSEARCH建索引过程中崩溃问题追查 by ... -
routing实例1
2015-09-21 18:51 0package com.eg.part1; import j ... -
routing实例
2015-09-21 18:49 0创建索引: PUT /useraudit_v1 创建索引别名: ... -
elasticsearch 精确,模糊查询实例
2015-09-19 23:55 62680实例 http://www.bubuko.com/infode ... -
elasticsearch java调用实例
2015-09-19 23:55 3604http://outofmemory.cn/code-snip ... -
[维护]Elasticsearch零停机时间更新索引配置或迁移索引
2015-09-18 10:16 813另外一篇文章:http://blog.csdn.net/dm_ ... -
elasticsearch 的mapping定义
2015-09-18 10:16 1234elasticsearch 的mapping 例子一: 订单 ... -
ElasticSearch基础杂烩-配置-索引-优化
2015-09-19 23:56 700http://blog.csdn.net/huwei2003/ ... -
Elasticsearch安装中文分词插件ik
2015-09-18 10:15 2072安装步骤: 1、到github ... -
ElasticSearch的各种服务的URL
2015-09-18 10:15 558前言 elasticsearch 将各种功能、配置、服务都以A ... -
ElasticSearch集群搭建
2015-09-19 23:56 646http://www.linuxidc.com/Linux/2 ... -
elasticsearch 配置
2015-09-18 10:16 739elasticsearch.conf 主要是设置一些java运 ... -
elasticsearch的Mapping定义
2015-09-17 09:35 1438Mapping,就是对索引库中 ...
相关推荐
Elasticsearch-analysis-ik 是一个专为 Elasticsearch 设计的中文分词插件,它基于 Lucene 的 IK 分词器,旨在提供高效、准确的中文分词能力。 **IK 分词器介绍** IK (Intelligent Chinese Analyzer) 是一个针对...
Elasticsearch 7.6.2 已集成ik分词器 解压后运行bin目录下,elasticsearch.bat文件
在Elasticsearch中集成IK分词插件,可以显著提升对中文文本的索引和搜索性能。具体而言,IK分词插件包含两个主要模式:`smart`模式和`analyzed`模式。`smart`模式下,插件会尽可能地切分出标准词汇;`analyzed`模式...
在Elasticsearch中集成jieba分词器,用户可以享受到jieba分词器带来的准确中文分词效果,极大地提升Elasticsearch处理中文数据的能力。 “elasticsearch-analysis-jieba-8.15.0”插件的主要优点在于其兼容性好,...
Elasticsearch 内置了多种分词器,如标准分词器(Standard Analyzer)、关键词分词器(Keyword Analyzer)和中文分词器(Smart Chinese Analyzer)等。这些分词器可以根据不同的语言和应用场景进行定制,以确保搜索...
IK分词器8.15.0版本是专门为Elasticsearch 8.15.0版本设计的中文分词插件,它集成了丰富的中文分词算法和用户自定义功能,提供了多种分词模式以适应不同的搜索需求。通过提供安全策略文件和日志记录支持,它在保证...
总结来说,通过改造IK分词器源码并集成MySQL数据库,我们可以实现动态更新热词库,从而提高Elasticsearch的分词效果,满足实时性需求。这种方式不仅解决了内置词库和静态词库的不足,还提供了更大的灵活性,能够适应...
总的来说,"elasticsearch-analysis-ik-7.10.0"分词插件是Elasticsearch处理中文文本的关键组件,通过与Elasticsearch的集成,可以实现高效、精准的中文全文检索,提升用户体验。同时,了解和掌握相关依赖库的作用也...
IK分词器是针对Elasticsearch(ES)的一款热门中文分词插件,其全称为“Intelligent Chinese Analyzer for Elasticsearch”。它由Java编写,旨在为中文文档提供高效、准确的分词处理。版本7.10.2是IK分词器的一个...
总的来说,这个"elasticsearch7.17.9版本分词器插件安装包"是针对中文环境的Elasticsearch实例增强搜索功能的重要工具,通过IK分词器提供高效的文本分析能力,适用于日志收集、分析等场景。正确安装和配置此插件,...
此插件对于开发者而言,可以大大简化中文拼音分词的集成工作,使得在Elasticsearch基础上进行中文搜索变得更加直接和高效。通过这种拼音分词插件,可以支持如拼音搜索、拼音纠错、拼音高亮显示等高级搜索功能。特别...
在 Elasticsearch 7.12.1 版本中,Ik 分词器可能已经集成在默认的分词器列表中,用户可以直接使用。同时,由于 Ik 分词器持续更新以兼容 Elasticsearch 的新版本,因此在 7.12.1 版本下使用 Ik,可以确保最佳的性能...
该插件将Lucene IK分词器集成到Elasticsearch中,支持自定义词典和多种分词模式。主要功能包括 支持两种分词模式iksmart(智能分词)和ikmaxword(最细粒度分词)。 支持自定义词典,包括本地词典和远程词典。 ...
Elasticsearch Analysis IK是针对Elasticsearch的中文分词插件,它的最新版本为7.14.0,这个压缩包“elasticsearch-analysis-ik-7.14.0.zip”包含了该版本的所有核心组件和依赖库。这个插件旨在提供更强大的中文分词...
lasticsearch整合分词、创建索引、搜索例子,elasticsearch版本为1.0,索引数据从数据表中动态读取生成,有关键字高亮效果,查询分页 1 在dababase目录中导致相关的数据库文件,修改DBCOperation java文件数据库连接...
`elasticsearch-analysis-ik`是一个专为Elasticsearch设计的插件,它集成了Apache Lucene的IK分词器,以实现更智能、更灵活的中文分词功能。 **一、IK分词器概述** IK全称为“Intelligent Chinese Analyzer”,它...
IK中文分词器是一个集成到Elasticsearch中的中文分词插件,支持自定义词典和多种分词模式。该插件基于Lucene IK分词器,提供了细粒度和智能分词两种模式,适用于中文文本的搜索和分析。 项目的主要特性和功能 1. ...
在 Elasticsearch 的众多插件中,IK 分词器是一个广泛使用的中文分词插件,它能够对中文文本进行分词处理,提高中文搜索的准确度和效率。IK 分词器提供了两种分词模式,一种是智能分词,另一种是最大词频分词。智能...
总的来说,"elasticsearch-analysis-pinyin-7.5.1"插件是Elasticsearch处理中文内容的有力工具,它的拼音分词功能极大地拓展了Elasticsearch在中文环境下的应用范围,提升了用户体验和数据挖掘的价值。在理解和掌握...