elasticsearch的config文件夹里面有两个配置文件:elasticsearch.yml和logging.yml,第一个是es的基本配置文件,第二个是日志配置文件,es也是使用log4j来记录日志的,所以logging.yml里的设置按普通log4j配置文件来设置就行了。下面主要讲解下elasticsearch.yml这个文件中可配置的东西。
cluster.name: elasticsearch
配置es的集群名称,默认是elasticsearch,es会自动发现在同一网段下的es,如果在同一网段下有多个集群,就可以用这个属性来区分不同的集群。
node.name: "Franz Kafka"
节点名,默认随机指定一个name列表中名字,该列表在es的jar包中config文件夹里name.txt文件中,其中有很多作者添加的有趣名字。
node.master: true
指定该节点是否有资格被选举成为node,默认是true,es是默认集群中的第一台机器为master,如果这台机挂了就会重新选举master。
node.data: true
指定该节点是否存储索引数据,默认为true。
index.number_of_shards: 5
设置默认索引分片个数,默认为5片。
index.number_of_replicas: 1
设置默认索引副本个数,默认为1个副本。
path.conf: /path/to/conf
设置配置文件的存储路径,默认是es根目录下的config文件夹。
path.data: /path/to/data
设置索引数据的存储路径,默认是es根目录下的data文件夹,可以设置多个存储路径,用逗号隔开,例:
path.data: /path/to/data1,/path/to/data2
path.work: /path/to/work
设置临时文件的存储路径,默认是es根目录下的work文件夹。
path.logs: /path/to/logs
设置日志文件的存储路径,默认是es根目录下的logs文件夹
path.plugins: /path/to/plugins
设置插件的存放路径,默认是es根目录下的plugins文件夹
bootstrap.mlockall: true
设置为true来锁住内存。因为当jvm开始swapping时es的效率会降低,所以要保证它不swap,可以把ES_MIN_MEM和ES_MAX_MEM两个环境变量设置成同一个值,并且保证机器有足够的内存分配给es。同时也要允许elasticsearch的进程可以锁住内存,linux下可以通过`ulimit -l unlimited`命令。
network.bind_host: 192.168.0.1
设置绑定的ip地址,可以是ipv4或ipv6的,默认为0.0.0.0。
network.publish_host: 192.168.0.1
设置其它节点和该节点交互的ip地址,如果不设置它会自动判断,值必须是个真实的ip地址。
network.host: 192.168.0.1
这个参数是用来同时设置bind_host和publish_host上面两个参数。
transport.tcp.port: 9300
设置节点间交互的tcp端口,默认是9300。
transport.tcp.compress: true
设置是否压缩tcp传输时的数据,默认为false,不压缩。
http.port: 9200
设置对外服务的http端口,默认为9200。
http.max_content_length: 100mb
设置内容的最大容量,默认100mb
http.enabled: false
是否使用http协议对外提供服务,默认为true,开启。
gateway.type: local
gateway的类型,默认为local即为本地文件系统,可以设置为本地文件系统,分布式文件系统,hadoop的HDFS,和amazon的s3服务器,其它文件系统的设置方法下次再详细说。
gateway.recover_after_nodes: 1
设置集群中N个节点启动时进行数据恢复,默认为1。
gateway.recover_after_time: 5m
设置初始化数据恢复进程的超时时间,默认是5分钟。
gateway.expected_nodes: 2
设置这个集群中节点的数量,默认为2,一旦这N个节点启动,就会立即进行数据恢复。
cluster.routing.allocation.node_initial_primaries_recoveries: 4
初始化数据恢复时,并发恢复线程的个数,默认为4。
cluster.routing.allocation.node_concurrent_recoveries: 2
添加删除节点或负载均衡时并发恢复线程的个数,默认为4。
indices.recovery.max_size_per_sec: 0
设置数据恢复时限制的带宽,如入100mb,默认为0,即无限制。
indices.recovery.concurrent_streams: 5
设置这个参数来限制从其它分片恢复数据时最大同时打开并发流的个数,默认为5。
discovery.zen.minimum_master_nodes: 1
设置这个参数来保证集群中的节点可以知道其它N个有master资格的节点。默认为1,对于大的集群来说,可以设置大一点的值(2-4)
discovery.zen.ping.timeout: 3s
设置集群中自动发现其它节点时ping连接超时时间,默认为3秒,对于比较差的网络环境可以高点的值来防止自动发现时出错。
discovery.zen.ping.multicast.enabled: false
设置是否打开多播发现节点,默认是true。
discovery.zen.ping.unicast.hosts: ["host1", "host2:port", "host3[portX-portY]"]
设置集群中master节点的初始列表,可以通过这些节点来自动发现新加入集群的节点。
下面是一些查询时的慢日志参数设置
index.search.slowlog.level: TRACE
index.search.slowlog.threshold.query.warn: 10s
index.search.slowlog.threshold.query.info: 5s
index.search.slowlog.threshold.query.debug: 2s
index.search.slowlog.threshold.query.trace: 500ms
index.search.slowlog.threshold.fetch.warn: 1s
index.search.slowlog.threshold.fetch.info: 800ms
index.search.slowlog.threshold.fetch.debug:500ms
index.search.slowlog.threshold.fetch.trace: 200ms
from internet
相关推荐
**四、配置文件详解** Elasticsearch的配置文件`elasticsearch.yml`用于设置集群、节点、网络、存储等多个方面的参数。正确配置这些参数对于优化性能和确保稳定性至关重要。 **五、安装步骤详解** 包括下载、解压...
文中还探讨了如何解决常见的Java运行环境问题、端口冲突问题、内存不足问题和配置文件错误等。 适合人群:对于初学者来说,是一份全面的学习指南;对于有一定经验的技术人员,则是一份实用的操作手册。 使用场景及...
Elasticsearch 7.12.1 是一个强大的开源全文搜索引擎,它基于 Lucene 库进行构建,提供了分布式、实时的搜索和分析引擎服务。这个版本的 Elasticsearch 针对性能和稳定性进行了优化,适用于大规模数据检索和分析场景...
Elasticsearch(简称ES)是一款基于Lucene的开源、实时、分布式全文搜索引擎,它不仅提供了搜索功能,还能进行数据分析和可视化。本篇文章将深入探讨ES分布式搜索引擎的安装过程、工作原理以及其在实际应用中的优势...
**Elasticsearch搜索引擎配置文件详解** Elasticsearch(ES)是一种流行的开源全文搜索引擎,基于Lucene构建,提供了分布式、 RESTful 风格的搜索和分析功能。在ES的运行过程中,配置文件起着至关重要的作用,它们...
### Elasticsearch:开源分布式搜索与分析引擎 #### 一、简介 Elasticsearch 是一款由 Elasticsearch N.V.(现 Elastic N.V.)开发并维护的开源分布式搜索和分析引擎。其核心特性包括分布式搜索引擎、实时数据分析...
**Elasticsearch分布式搜索引擎v8.12.2详解** Elasticsearch是一个开源的全文搜索引擎,基于Lucene库,设计为分布式、可扩展且实时的搜索和分析引擎。它的核心特性包括强大的全文搜索、实时分析、高可用性和容错...
### Elasticsearch 深度...综上所述,Elasticsearch 不仅是一款优秀的分布式搜索和分析引擎,还具有广泛的应用场景和丰富的学习资源。通过深入了解其特点和功能,开发者可以更好地利用它来解决实际问题,提升业务价值。
Elasticsearch是一个基于Lucene的搜索服务器,它提供了一个分布式、全文检索、实时的搜索和分析引擎。在处理中文文档时,由于中文的复杂性,需要借助分词器来将文本拆分成可索引的词汇单元。IK分词器是针对Elastic...
Elasticsearch(简称ES)是一款强大的开源搜索引擎,它提供了全文检索、分析和分布式存储等能力。在处理中文文本时,为了更好地进行分词和理解语义,通常需要安装适合中文的分析器。这时,Elasticsearch IK插件就...
Elasticsearch(简称ES)是一款基于Lucene的分布式、RESTful搜索引擎,广泛应用于日志收集、数据分析等领域,是ELK(Elasticsearch、Logstash、Kibana)堆栈的重要组成部分。在处理中文数据时,合理的分词对于提升...
Elasticsearch 是一款基于 Lucene 的分布式搜索引擎,它提供了全文检索、结构化检索以及分析等功能。在实际应用中,为了提高 Elasticsearch 的稳定性和性能,通常需要搭建 Elasticsearch 集群。本文将详细介绍如何在...
Elasticsearch是一个开源的分布式全文搜索引擎,以其强大的搜索能力和实时分析数据的能力被广泛应用于日志分析、信息检索、网站搜索等多个领域。这份名为"1-Elasticsearch开发技术详解及技术指导.rar"的压缩包文件,...
4. **配置文件修改**:主要修改`elasticsearch.yml`配置文件,包括设置节点名称、集群名称、数据路径等。 5. **JVM参数调整**:根据硬件资源情况,合理设置JVM内存大小(如`Xms`和`Xmx`)和其他相关参数。 **三、...
在现代大数据分析和搜索引擎领域,Elasticsearch(ES)因其高效、灵活的全文检索能力而备受青睐。然而,对于中文这样的多字节语言,如何准确地进行分词是关键。这时,我们就需要引入专门的中文分词器。本文将详细...
《Elasticsearch Analysis IK插件7.11.1版详解》 Elasticsearch Analysis IK插件是针对Elasticsearch的中文分词器,它的最新版本7.11.1为用户提供了强大的中文处理能力。这个插件的核心目标是帮助Elasticsearch更好...
**Elasticsearch 5.6.1 搜索引擎详解** Elasticsearch 是一款基于 Lucene 的开源全文搜索引擎,被广泛应用于大数据分析、日志聚合、实时搜索等领域。它以其分布式、可扩展、易于使用和高性能的特点深受开发者喜爱。...
分布式搜索引擎Nutch开发详解 Nutch是一款开源的、基于Java实现的全文搜索引擎,它主要用于构建大规模的网络爬虫系统,并提供了对抓取的网页进行索引和搜索的功能。Nutch与Hadoop紧密集成,能够充分利用分布式计算...
Elasticsearch 是一款高度可扩展的开源全文搜索引擎,由Java编写,设计目标是提供实时、分布式、容错能力强的搜索和数据分析能力。在Windows系统上安装Elasticsearch 6.3.2版本,将为用户提供在本地环境进行数据检索...