废话不多说,直接上遇见的坑。
尽管可以增加新的类型到索引中,或者增加新的字段到类型中,但是不能添加新的分析器或者对现有的字段做改动。 如果你那么做的话,结果就是那些已经被索引的数据就不正确, 搜索也不能正常工作。对现有数据的这类改变最简单的办法就是重新索引:用新的设置创建新的索引并把文档从旧的索引复制到新的索引。字段 _source 的一个优点是在Elasticsearch中已经有整个文档。你不必从源数据中重建索引,而且那样通常比较慢。为了有效的重新索引所有在旧的索引中的文档,用 scroll 从旧的索引检索批量文档 , 然后用 bulk API 把文档推送到新的索引中。
链接:https://www.elastic.co/guide/cn/elasticsearch/guide/current/reindex.html#reindex
ICU 插件是处理英语之外语言的必需工具,非常推荐你安装并使用它,不幸的是,因为是基于额外的 ICU 函数库, 不同版本的ICU插件可能并不兼容之前的版本,当更新插件的时候,你需要重新索引你的数据。
链接:https://www.elastic.co/guide/cn/elasticsearch/guide/current/icu-plugin.html
上面这两段段话的意思很明确,如果你在设计的时候不确定分析器,你后期想变更,你必须重新导一遍数据。
如果你有很多节点并以集群方式运行的,你需要在集群的每个节点都安装这个插件。
链接:https://www.elastic.co/guide/cn/elasticsearch/guide/current/icu-plugin.html
如果您在设计elasticsearch时候如果要使用特定的分析器则需要在每个节点都需要设置。
相关推荐
Elasticsearch(简称ES)是一款基于Lucene的分布式、RESTful搜索引擎,广泛应用于日志收集、数据分析等领域,是ELK(Elasticsearch、Logstash、Kibana)堆栈的重要组成部分。在处理中文数据时,合理的分词对于提升...
Elasticsearch(ES)是一种流行的开源全文搜索引擎,它基于Lucene构建,提供了分布式、RESTful风格的搜索和分析引擎服务。在中文环境下,为了实现精确的分词和搜索,我们需要安装适合版本的分词插件,如“elastic...
除了基本功能,IK分词插件还提供了丰富的扩展性,用户可以通过编写自定义插件或修改分析器配置来实现特定的分词需求。`plugin-security.policy`和`plugin-descriptor.properties`文件是Elasticsearch插件的安全策略...
Elasticsearch 是一个开源的分布式搜索引擎,以其高可伸缩性、实时性、灵活性以及强大的数据分析能力而闻名。在Windows平台上部署Elasticsearch,用户可以利用其强大的搜索和分析功能来处理大量数据。8.11版本带来了...
在日志收集和数据分析领域,Elasticsearch(简称ES)扮演着重要的角色。作为一个强大的全文搜索引擎,Elasticsearch允许用户通过简单的API进行数据索引、搜索、分析和可视化。然而,为了更好地处理中文等复杂语言,...
3. **分析器(Analyzer)**:用于文本分词,Elasticsearch内置了多种分析器,如标准分析器、关键词分析器等,也可自定义分析器。 4. **脚本(Script)**:在查询和更新过程中执行动态逻辑,如计算字段、修改值等。 ...
在日志收集和分析领域,Elasticsearch(简称ES)是广泛应用的搜索引擎和数据分析工具,它与Logstash(数据采集)、Kibana(数据可视化)共同构成了ELK(Elasticsearch、Logstash、Kibana)栈。对于中文处理,分词器...
Elasticsearch使用分析器进行文本分析,将输入的文本拆分为可搜索的词项。默认的分析器是`standard`,但你也可以根据需求配置自定义分析器。 **10. 性能调优** 为了提高性能,你可能需要调整内存分配、JVM堆大小、...
此外,它还提供了多个插件的源码,如IK分词器、Pinyin插件和HanLP自然语言处理库,这些插件为Elasticsearch增加了中文处理和分析的能力。 1. **Elasticsearch核心概念**:Elasticsearch是一个基于Lucene构建的...
4. **配置**:在 Elasticsearch 的配置文件 `elasticsearch.yml` 中添加或修改分析器配置。 例如: ```yaml analysis: analyzer: my_analyzer: # 自定义分析器名称 type: "ik_max_word" # 使用 IK 分词器的最细...
Elasticsearch(ES)是一款功能强大的全文搜索引擎,而分析器在ES中扮演着至关重要的角色,它负责将用户输入的文本进行预处理,包括分词、词形还原等步骤。`elasticsearch-analysis-ik`是一个专为Elasticsearch设计...
Elasticsearch是一款强大的开源搜索引擎,广泛应用于大数据分析和实时搜索领域。它基于Lucene库,提供了分布式、全文检索、近实时处理以及丰富的数据分析能力。在本文中,我们将深入探讨Elasticsearch的不同版本及其...
Elasticsearch是一个开源的全文搜索引擎,它以其高效、可扩展的特性被广泛应用于数据分析、日志分析、网站搜索等领域。本文将详细介绍Elasticsearch的安装、配置以及与Spring的整合,还会涉及Elasticsearch的curl...
Elasticsearch是一个强大的开源搜索引擎和分析引擎,广泛应用于大数据处理和实时分析领域。"elasticsearch-analysis-ik"是针对Elasticsearch的一个中文分词插件,它的主要功能是提供高效、精准的中文分词能力,使得...
2. **配置Elasticsearch**:根据需求修改配置文件`elasticsearch.yml`,例如设置网络监听地址、端口等。 3. **启动Cerebro**:解压cerebro-0.9.4压缩包,运行启动脚本,配置Elasticsearch集群连接信息。 4. **连接...
1. **安装与配置**:了解如何在不同的操作系统上安装 Elasticsearch,包括配置文件的修改,以及集群设置和节点配置。 2. **索引与文档**:学习 Elasticsearch 中的索引概念,理解如何创建、删除和操作索引,以及...
Elasticsearch(ES)是一款流行的开源全文搜索引擎,常用于日志收集、数据分析和实时搜索等场景。在处理中文文本时,分词器插件是必不可少的组件,它能够将中文字符串分解为有意义的词汇单元,以提升搜索的准确性和...
此外,Elasticsearch还提供了丰富的分析器,如标准分析器、英文分析器,以及自定义分析器,用于处理不同语言和数据类型的文本。 在安装“elasticsearch-8.5.3-windows-x86-64.zip”后,你需要配置Elasticsearch的...
Elasticsearch 是一个流行的、高度可扩展的全文搜索引擎,广泛应用于数据检索、分析和实时数据存储。在中文环境中,为了实现精确的中文分词,我们需要使用适合中文的分词器。IK 分词器(Intelligent Chinese ...
在Elasticsearch中,分词器的作用至关重要,它负责将用户输入的文本进行词汇切分,以便进行后续的搜索和分析操作。IK分词器以其高效、灵活和全面的特性,被广泛应用于Elasticsearch的中文处理场景。 **版本信息** ...