配置文件位于%ES_HOME%/config/elasticsearch.yml文件中,用Editplus打开它,你便可以进行配置。
所有的配置都可以使用环境变量,例如:
node.rack: ${RACK_ENV_VAR}
表示环境变量中有一个RACK_ENV_VAR变量。
下面列举一下elasticsearch的可配置项:
1. 集群名称,默认为elasticsearch:
cluster.name: elasticsearch
2. 节点名称,es启动时会自动创建节点名称,但你也可进行配置:
node.name: "Franz Kafka"
3. 是否作为主节点,每个节点都可以被配置成为主节点,默认值为true:
node.master: true
4. 是否存储数据,即存储索引片段,默认值为true:
node.data: true
master和data同时配置会产生一些奇异的效果:
1) 当master为false,而data为true时,会对该节点产生严重负荷;
2) 当master为true,而data为false时,该节点作为一个协调者;
3) 当master为false,data也为false时,该节点就变成了一个负载均衡器。
你可以通过连接http://localhost:9200/_cluster/health或者http://localhost:9200/_cluster/nodes,或者使用插件http://github.com/lukas-vlcek/bigdesk或http://mobz.github.com/elasticsearch-head来查看集群状态。
5. 每个节点都可以定义一些与之关联的通用属性,用于后期集群进行碎片分配时的过滤:
node.rack: rack314
6. 默认情况下,多个节点可以在同一个安装路径启动,如果你想让你的es只启动一个节点,可以进行如下设置:
node.max_local_storage_nodes: 1
7. 设置一个索引的碎片数量,默认值为5:
index.number_of_shards: 5
8. 设置一个索引可被复制的数量,默认值为1:
index.number_of_replicas: 1
当你想要禁用公布式时,你可以进行如下设置:
index.number_of_shards: 1
index.number_of_replicas: 0
这两个属性的设置直接影响集群中索引和搜索操作的执行。假设你有足够的机器来持有碎片和复制品,那么可以按如下规则设置这两个值:
1) 拥有更多的碎片可以提升索引执行能力,并允许通过机器分发一个大型的索引;
2) 拥有更多的复制器能够提升搜索执行能力以及集群能力。
对于一个索引来说,number_of_shards只能设置一次,而number_of_replicas可以使用索引更新设置API在任何时候被增加或者减少。
ElasticSearch关注加载均衡、迁移、从节点聚集结果等等。可以尝试多种设计来完成这些功能。
可以连接http://localhost:9200/A/_status来检测索引的状态。
9. 配置文件所在的位置,即elasticsearch.yml和logging.yml所在的位置:
path.conf: /path/to/conf
10. 分配给当前节点的索引数据所在的位置:
path.data: /path/to/data
可以可选择的包含一个以上的位置,使得数据在文件级别跨越位置,这样在创建时就有更多的自由路径,如:
path.data: /path/to/data1,/path/to/data2
11. 临时文件位置:
path.work: /path/to/work
12. 日志文件所在位置:
path.logs: /path/to/logs
13. 插件安装位置:
path.plugins: /path/to/plugins
14. 插件托管位置,若列表中的某一个插件未安装,则节点无法启动:
plugin.mandatory: mapper-attachments,lang-groovy
15. JVM开始交换时,ElasticSearch表现并不好:你需要保障JVM不进行交换,可以将bootstrap.mlockall设置为true禁止交换:
bootstrap.mlockall: true
请确保ES_MIN_MEM和ES_MAX_MEM的值是一样的,并且能够为ElasticSearch分配足够的内在,并为系统操作保留足够的内存。
16. 默认情况下,ElasticSearch使用0.0.0.0地址,并为http传输开启9200-9300端口,为节点到节点的通信开启9300-9400端口,也可以自行设置IP地址:
network.bind_host: 192.168.0.1
17. publish_host设置其他节点连接此节点的地址,如果不设置的话,则自动获取,publish_host的地址必须为真实地址:
network.publish_host: 192.168.0.1
18. bind_host和publish_host可以一起设置:
network.host: 192.168.0.1
19. 可以定制该节点与其他节点交互的端口:
transport.tcp.port: 9300
20. 节点间交互时,可以设置是否压缩,转为为不压缩:
transport.tcp.compress: true
21. 可以为Http传输监听定制端口:
http.port: 9200
22. 设置内容的最大长度:
http.max_content_length: 100mb
23. 禁止HTTP
http.enabled: false
24. 网关允许在所有集群重启后持有集群状态,集群状态的变更都会被保存下来,当第一次启用集群时,可以从网关中读取到状态,默认网关类型(也是推荐的)是local:
gateway.type: local
25. 允许在N个节点启动后恢复过程:
gateway.recover_after_nodes: 1
26. 设置初始化恢复过程的超时时间:
gateway.recover_after_time: 5m
27. 设置该集群中可存在的节点上限:
gateway.expected_nodes: 2
28. 设置一个节点的并发数量,有两种情况,一种是在初始复苏过程中:
cluster.routing.allocation.node_initial_primaries_recoveries: 4
另一种是在添加、删除节点及调整时:
cluster.routing.allocation.node_concurrent_recoveries: 2
29. 设置复苏时的吞吐量,默认情况下是无限的:
indices.recovery.max_size_per_sec: 0
30. 设置从对等节点恢复片段时打开的流的数量上限:
indices.recovery.concurrent_streams: 5
31. 设置一个集群中主节点的数量,当多于三个节点时,该值可在2-4之间:
discovery.zen.minimum_master_nodes: 1
32. 设置ping其他节点时的超时时间,网络比较慢时可将该值设大:
discovery.zen.ping.timeout: 3s
http://elasticsearch.org/guide/reference/modules/discovery/zen.html上有更多关于discovery的设置。
33. 禁止当前节点发现多个集群节点,默认值为true:
discovery.zen.ping.multicast.enabled: false
34. 设置新节点被启动时能够发现的主节点列表(主要用于不同网段机器连接):
discovery.zen.ping.unicast.hosts: ["host1", "host2:port", "host3[portX-portY]"]
35.设置是否可以通过正则或者_all删除或者关闭索引
action.destructive_requires_name 默认false 允许 可设置true不允许
相关推荐
**四、配置文件详解** Elasticsearch的配置文件`elasticsearch.yml`用于设置集群、节点、网络、存储等多个方面的参数。正确配置这些参数对于优化性能和确保稳定性至关重要。 **五、安装步骤详解** 包括下载、解压...
Elasticsearch 7.12.1 是一个强大的开源全文搜索引擎,它基于 Lucene 库进行构建,提供了分布式、实时的搜索和分析引擎服务。这个版本的 Elasticsearch 针对性能和稳定性进行了优化,适用于大规模数据检索和分析场景...
Elasticsearch(简称ES)是一款基于Lucene的开源、实时、分布式全文搜索引擎,它不仅提供了搜索功能,还能进行数据分析和可视化。本篇文章将深入探讨ES分布式搜索引擎的安装过程、工作原理以及其在实际应用中的优势...
**Elasticsearch搜索引擎配置文件详解** Elasticsearch(ES)是一种流行的开源全文搜索引擎,基于Lucene构建,提供了分布式、 RESTful 风格的搜索和分析功能。在ES的运行过程中,配置文件起着至关重要的作用,它们...
### Elasticsearch:开源分布式搜索与分析引擎 #### 一、简介 Elasticsearch 是一款由 Elasticsearch N.V.(现 Elastic N.V.)开发并维护的开源分布式搜索和分析引擎。其核心特性包括分布式搜索引擎、实时数据分析...
**Elasticsearch分布式搜索引擎v8.12.2详解** Elasticsearch是一个开源的全文搜索引擎,基于Lucene库,设计为分布式、可扩展且实时的搜索和分析引擎。它的核心特性包括强大的全文搜索、实时分析、高可用性和容错...
### Elasticsearch 深度...综上所述,Elasticsearch 不仅是一款优秀的分布式搜索和分析引擎,还具有广泛的应用场景和丰富的学习资源。通过深入了解其特点和功能,开发者可以更好地利用它来解决实际问题,提升业务价值。
Elasticsearch是一个基于Lucene的搜索服务器,它提供了一个分布式、全文检索、实时的搜索和分析引擎。在处理中文文档时,由于中文的复杂性,需要借助分词器来将文本拆分成可索引的词汇单元。IK分词器是针对Elastic...
Elasticsearch(简称ES)是一款强大的开源搜索引擎,它提供了全文检索、分析和分布式存储等能力。在处理中文文本时,为了更好地进行分词和理解语义,通常需要安装适合中文的分析器。这时,Elasticsearch IK插件就...
Elasticsearch(简称ES)是一款基于Lucene的分布式、RESTful搜索引擎,广泛应用于日志收集、数据分析等领域,是ELK(Elasticsearch、Logstash、Kibana)堆栈的重要组成部分。在处理中文数据时,合理的分词对于提升...
Elasticsearch 是一款基于 Lucene 的分布式搜索引擎,它提供了全文检索、结构化检索以及分析等功能。在实际应用中,为了提高 Elasticsearch 的稳定性和性能,通常需要搭建 Elasticsearch 集群。本文将详细介绍如何在...
Elasticsearch是一个开源的分布式全文搜索引擎,以其强大的搜索能力和实时分析数据的能力被广泛应用于日志分析、信息检索、网站搜索等多个领域。这份名为"1-Elasticsearch开发技术详解及技术指导.rar"的压缩包文件,...
4. **配置文件修改**:主要修改`elasticsearch.yml`配置文件,包括设置节点名称、集群名称、数据路径等。 5. **JVM参数调整**:根据硬件资源情况,合理设置JVM内存大小(如`Xms`和`Xmx`)和其他相关参数。 **三、...
在现代大数据分析和搜索引擎领域,Elasticsearch(ES)因其高效、灵活的全文检索能力而备受青睐。然而,对于中文这样的多字节语言,如何准确地进行分词是关键。这时,我们就需要引入专门的中文分词器。本文将详细...
**Elasticsearch 5.6.1 搜索引擎详解** Elasticsearch 是一款基于 Lucene 的开源全文搜索引擎,被广泛应用于大数据分析、日志聚合、实时搜索等领域。它以其分布式、可扩展、易于使用和高性能的特点深受开发者喜爱。...
《Elasticsearch Analysis IK插件7.11.1版详解》 Elasticsearch Analysis IK插件是针对Elasticsearch的中文分词器,它的最新版本7.11.1为用户提供了强大的中文处理能力。这个插件的核心目标是帮助Elasticsearch更好...
分布式搜索引擎Nutch开发详解 Nutch是一款开源的、基于Java实现的全文搜索引擎,它主要用于构建大规模的网络爬虫系统,并提供了对抓取的网页进行索引和搜索的功能。Nutch与Hadoop紧密集成,能够充分利用分布式计算...
Elasticsearch 是一款高度可扩展的开源全文搜索引擎,由Java编写,设计目标是提供实时、分布式、容错能力强的搜索和数据分析能力。在Windows系统上安装Elasticsearch 6.3.2版本,将为用户提供在本地环境进行数据检索...
**Elasticsearch 全套资源详解** Elasticsearch 是一个高度可扩展的开源全文搜索和分析引擎,设计用于处理大量数据并提供实时响应。它基于 Lucene 库,但提供了更高级别的分布式、容错和索引管理功能,使得它在...