es可以监控很多东西,最重要的是集群的健康状况,三个级别:红,黄,绿。
GET /_cluster/health
一个单个节点的集群,没有所以,返回的信息
{
"cluster_name"
:
"elasticsearch"
,
"status"
:
"green"
,
"timed_out"
:
false
,
"number_of_nodes"
:
1
,
"number_of_data_nodes"
:
1
,
"active_primary_shards"
:
0
,
"active_shards"
:
0
,
"relocating_shards"
:
0
,
"initializing_shards"
:
0
,
"unassigned_shards"
:
0
}
status字段提供了一个总体的集群状况,三个颜色的意思:
green:所有的主从分片都是良好的。
yellow:所有的主分片良好,不是所有的从分片正常。
red:不是所有的主分片正常ot all primary shards are active.
下面详细解释。http://my.oschina.net/qiangzigege/blog/264146
要想增加数据到es,需要一个索引,索引用来存储数据,索引是一个逻辑空间指向一个/多个物理分片。
一个分片是一个底层的工作单元,每一个分片是一个lucene单例,是一个完整的搜索引擎,我们的文档被存储存储并且被索引在分片里,客户端不是与分片直接交互而是与索引直接交互。
分片就是es在集群里分发数据的意思,分片包含了数据,文档存储在分片里,分片在各个节点,一旦集群扩容/减容,es自动在节点间迁移分片,这样集群仍然保持平衡。
一个分片是主分片/从分片。你的任何一个文档都属于一个主分片。所以主分片的数量决定了你索引可以容纳的最大的数据量。
PS:我自己加的:主分片就是平时所说的分片,从分片是对某个主分片的冗余复制备份。
这里是分片+主从的机制。分片在前,主从在后。
主分片的容量没有限制,但是有一个限制:硬件,文档,如何索引和查询,希望的响应时间。
一个从分片仅仅是主分片的复制,主从机制用来提供冗余备份来抵御灾难。并且服务于都请求比如查询和检索文档。
主分片在索引创建时就已经固定了,以后不可以更改了,但是从分片的数量可以修改。
创建一个叫blogs的索引,默认情况下,索引分配了5个主分片,但是为了演示,我们分配3个主分片和1个从分片。
PUT /blogs
{
"settings"
:
{
"number_of_shards"
: 3,
"number_of_replicas"
: 1
}
}
如上所示,3个主分片都分配给了唯一的一个节点,这个时候查询集群的健康,我们看到:
{
"cluster_name"
:
"elasticsearch"
,
"status"
:
"yellow"
,
"timed_out"
: false,
"number_of_nodes"
: 1,
"number_of_data_nodes"
: 1,
"active_primary_shards"
: 3,
"active_shards"
: 3,
"relocating_shards"
: 0,
"initializing_shards"
: 0,
"unassigned_shards"
: 3
}
集群的健康是黄色。
"unassigned_shards"
: 3表示3个从分片还没有分配给节点。
集群健康状况为黄色表明:所有的主分片正常运行,集群可以正常服务,但是不是所有的从分片正常,
事实上,3个从分片都没有分配,因为没有多余的节点,你分配在本机上也失去了主从的用意啊,
原文说了:在同一个节点上存储同样的数据备份无任何意义。如果这个节点挂了,我们就失去了所有的备份。
目前我们的集群可以正常运行,但是存在硬件挂掉而数据失去的风险(因为只有一个节点)
只有一个节点运行,意味着你有单一故障点:没有冗余备份。 只需要启动另外一个节点。一个新的节点将自动加入集群只要有同样的集群名字,可以互相交互。 此时,我们启动第二个节点,所有的主从分片都正确分配了。 第2个节点已经加入集群,并且三个从分片已经分配给第2个节点,意味着我们可以失去任何一个节点并且数据都是完好无缺的。 那么一个文档要增加,怎样的过程呢? 先根据分片策略,存储在一个主分片里,然后并行复制到对应的从分片,保证我们的文档可以从主分片或者任何一个从分片里查询到。 当前查询集群健康:绿色。 意味着6个分片(3主3从)都是OK的。 { "cluster_name" : "elasticsearch" ,
"status" : "green" ,
"timed_out" : false,
"number_of_nodes" : 2,
"number_of_data_nodes" : 2,
"active_primary_shards" : 3,
"active_shards" : 6,
"relocating_shards" : 0,
"initializing_shards" : 0,
"unassigned_shards" : 0
} 集群良好! |
为了大家理解更深刻:
这里把前后放在一起:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
|
XXX@UBUNTU ~$ curl http: //localhost:9200/_cluster/health?pretty
{ "cluster_name" : "elasticsearch" ,
"status" : "yellow" ,
"timed_out" : false ,
"number_of_nodes" : 1,
"number_of_data_nodes" : 1,
"active_primary_shards" : 10,
"active_shards" : 10,
"relocating_shards" : 0,
"initializing_shards" : 0,
"unassigned_shards" : 10
} XXX@UBUNTU ~$ curl http: //localhost:9200/_cluster/health?pretty
{ "cluster_name" : "elasticsearch" ,
"status" : "green" ,
"timed_out" : false ,
"number_of_nodes" : 2,
"number_of_data_nodes" : 2,
"active_primary_shards" : 10,
"active_shards" : 20,
"relocating_shards" : 0,
"initializing_shards" : 0,
"unassigned_shards" : 0
}
|
当项目需要时如何扩容?
如果我们启动第3个节点,我们的集群识别它。见图4.“3个节点的集群-主从分片已经重新部署来分摊负载”
节点1和节点2分别有一个分片移动到了节点3.每个节点有2个分片,有助于减少负载。
注意,此时并不是每个节点都有所有的数据,我的意思是任何一个节点,就算有主和从分片加起来。,也没有保证任何一个文档在当前机器上。
一个分片是一个搜索引擎,可以使用当前节点的所有资源,当前有6个分片(3主3从),我们的索引可以扩容到最大6个节点,每个节点1个分片,并且,每个分片可以使用节点的所有资源。
如果我们想扩容到多于6个节点呢?
前面说过:主分片的个数在创建时已经指定了,数量决定了数据的最大容量,尽管如此,读请求,比如搜索或者文档检索,可以被主分片或者从分片处理,所以如果你有更多的从分片冗余备份,我们可以处理更多的读请求来获得更多的吞吐量。
虽然主分片的个数在创建时已经指定不可更改,但是从分片可以更改,只要你有这个需求就可以,让我们把从分片的数量从1变到2.
PUT /blogs/_settings
{
"number_of_replicas"
: 2
}
如图5所示, the blogs 索引现在有了9个分片,3主6从. 如果我们想要增加另外3个节点到我们的6个节点集群里,会是什么情况?
自然是9个节点每个节点1个分片。并且我们的集群可以获得50%的增长来处理查询请求。
注意:有更多的主从分片在同样数量的节点情况下,不会提高性能,因为每个分片可获取的资源更小,你需要增加硬件。
但是更多的分片意味着我们有更多的冗余,这样节点挂了也不会失去数据。
相关推荐
### Elasticsearch监控方法详解 #### 一、Elasticsearch监控概览 Elasticsearch作为一个高性能的分布式搜索和分析引擎,在实际应用中需要对其进行有效的监控来确保其稳定性和性能。本文将详细介绍几种常用的...
在IT领域,ELK(Elasticsearch、Logstash、Kibana)栈是广泛用于日志管理和分析的工具,而Prometheus则是一款流行的监控和警报系统。将ELK中的ES(Elasticsearch)监控信息送入Prometheus,能够实现更全面的系统监控...
在ES监控中,Prometheus 可以作为数据采集器,定期抓取ES节点上的各种监控指标,如CPU使用率、内存消耗、网络吞吐量等。Prometheus 提供了丰富的 exporters,可以将其他服务的监控数据转换为 Prometheus 可理解的...
prometheus监控规则大全 node规则,redis监控,es监控,vmware监控,ipmi监控,ceph监控,etcd监控,k8s监控,mysql监控,openstack监控,os监控,交换机监控,windows监控,cdh监控,calico监控规则监控
最新版windows elasticsearch监控工具
标签"es 集群节点监控"表明脚本专注于Elasticsearch集群的节点监控,这通常包括检查节点是否在线、是否有未分配的分片、是否达到设定的负载阈值等。例如,脚本可能会检查 `_cluster/health` API以获取整体集群的健康...
在IT监控领域,Elasticsearch作为一款流行的搜索引擎和数据分析平台,其监控对于保证系统的稳定性和性能至关重要。本文将介绍如何利用Grafana和Prometheus监控Elasticsearch 8.9集群以及服务器,确保在无xpack....
使用 OpenWRT、Syslog-ng 和 Elasticsearch 监控家庭网络流量 此 repo 包含用于使用 OpenWRT 和 syslog-ng 以及 Elasticsearch Security 监控家庭网络的完整配置。 实现了以下组件: ulogd2 的连接跟踪事件 通过 ...
Elasticsearch Head 是一个非常实用的开源工具,用于可视化管理和监控 Elasticsearch 集群。在这个“elasticsearch-head-chrome-master.zip”压缩包中,我们得到了 Chrome 浏览器插件版的 Elasticsearch Head,这...
Elasticsearch(简称ES)是一款强大的开源搜索引擎,广泛应用于数据检索、分析和管理。作为分布式、RESTful风格的搜索和数据分析引擎,Elasticsearch能够提供实时、高可用性以及可扩展的搜索功能。在进行日常的数据...
使用Multi-Elasticsearch-Head,管理员或开发者可以轻松地查看和对比不同集群的状态、性能指标以及数据分布,这对于分布式系统监控和故障排查特别有用。它通常提供了一种直观的方式来查看索引结构、执行查询语句、...
Elasticsearch 是位于 Elastic Stack 核心的分布式搜索和分析引擎。Logstash 和 Beats 有助于收集、聚合和丰富您的数据并将其存储在 Elasticsearch 中。Kibana 使您能够以交互方式探索、可视化和分享对数据的见解,...
Elasticsearch数据库:Elasticsearch监控与运维.pdf Elasticsearch数据库:Elasticsearch集群管理.pdf Elasticsearch数据库:Elasticsearch高可用性与容灾策略.pdf Elasticsearch数据库:Kibana数据可视化教程.pdf ...
根据提供的文件信息,我们可以推断出本篇文章将围绕Elasticsearch 6.2.2版本进行详细介绍,包括其下载方式、主要功能特性以及在实际应用中的常见用途。 ### Elasticsearch简介 Elasticsearch是一款基于Lucene的...
`start` 用于启动Elasticsearch,这里使用 `su` 命令切换到指定的Elasticsearch用户(例如 `es-admin`),然后进入Elasticsearch的安装目录并执行 `bin/elasticsearch` 文件以后台模式启动服务。`stop` 通过查找并杀...
用Grafana进行Elasticsearch监控该存储库包含端到端全面监视Elasticsearch集群所需的一切。 基于在全球范围内调试和稳定许多Elasticsearch集群的经验,Elasticsearch Monitoring的制定和不断更新和改进。收集指标...
2. **下载安装包**:这里的"es安装包"即为Elasticsearch的安装文件,通常是一个zip或tar.gz格式的压缩包。你需要从官方网站或者镜像站点下载对应版本的安装包,确保与你的系统兼容。 3. **解压安装**:下载完成后,...
在数据抽取 ELT 领域,ES 全家桶 ELK(Elasticsearch+Logstash+Kibana)赫赫有名。 Elasticsearch 基本概念: * 倒排索引:Elasticsearch 为什么快,核心设计理念就是采用了倒排索引机制。倒排索引的方式是,根据 ...
Elasticsearch告警组件Elastalert是用于实时监控和警报的一个强大工具,它能够从Elasticsearch数据中检测到异常模式并及时发出通知。Elastalert与Elasticsearch的结合使用,使得用户可以轻松地从海量日志数据中发现...
4. 数据分析:除了搜索,Elasticsearch还具备强大的数据分析能力,可以进行聚合统计、实时分析,广泛应用于日志分析、监控系统和商业智能等领域。 5. 集群管理:在6.8.18版本中,集群管理和节点间的通信得到了...