ES集群中节点角色划分研究

gaozzsoft

浏览: 427015 次
性别:
来自: 北京

最近访客更多访客>>

cdliudb

u012682683

webeasymail

makeshow

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

solr&&ES

简单说就是可以给ES集群中的节点分配不同角色，每种角色干的活都不一样。

Master

主要负责集群中索引的创建、删除以及数据的Rebalance等操作。Master不负责数据的索引和检索，所以负载较轻。当Master节点失联或者挂掉的时候，ES集群会自动从其他Master节点选举出一个Leader。为了防止脑裂，常常设置参数为discovery.zen.minimum_master_nodes=N/2+1，其中N为集群中Master节点的个数。建议集群中Master节点的个数为奇数个，如3个或者5个。

设置一个几点为Master节点的方式如下：

node.master: true

node.data: false

node.ingest: false

search.remote.connect: false

Data Node

主要负责集群中数据的索引和检索，一般压力比较大。建议和Master节点分开，避免因为Data Node节点出问题影响到Master节点。

设置一个几点为Data Node节点的方式如下：

node.master: false

node.data: true

node.ingest: false

search.remote.connect: false

Coordinating Node

对于协调节点，个人觉得官网说的很清楚，很简练。

Ingest Node

Ingest node专门对索引的文档做预处理，实际中不常用，除非文档在索引之前有大量的预处理工作需要做。Ingest node设置如下：

node.master: false node.master: false node.master: false

node.data: false

node.ingest: true

search.remote.connect: false

Tribe Node

Tribe Node主要用于跨级群透明访问。但是官方已经不建议使用了，在5.4.0版本以后已经废弃掉了，在7.0的版本中将移除该功能。在5.5版本以后建议使用Cross-cluster search替代Tribe Node。

总结：

小集群可以不考虑结群节点的角色划分，大规模ES集群建议将Master Node、Data Node和Coordinating Node独立出来，每个节点各司其职。

链接：https://www.jianshu.com/p/7c4818dda91a

在生产环境下，如果不修改elasticsearch节点的角色信息，在高数据量，高并发的场景下集群容易出现脑裂等问题。

默认情况下，elasticsearch集群中每个节点都有成为主节点的资格，也都存储数据，即双重角色。

由两个属性控制：node.master和node.data，默认情况下这两个属性的值都是true：

* node.master：表示节点是否具有成为主节点的资格，值为true并不意味着这个节点就是主节点，真正的主节点是由多个具有主节点资格的节点进行选举产生的。

* node.data：表示节点是否存储数据。

这两个属性可以有四种组合：

* 第一种，这种组合表示这个节点即有成为主节点的资格，又存储数据，

这个时候如果某个节点被选举成为了真正的主节点，那么他还要存储数据，这样对于这个节点的压力就比较大了。elasticsearch默认每个节点都是这样的配置，在测试环境下这样做没问题。实际工作中建议不要这样设置，这样相当于主节点和数据节点的角色混合到一块了。

node.master: true

node.data: true

* 第二种：这种组合表示这个节点没有成为主节点的资格，也就不参与选举，只会存储数据。这个节点我们称为data(数据)节点。在集群中需要单独设置几个这样的节点负责存储数据。后期提供存储和查询服务。

node.master: false

node.data: true

第三种：这种组合表示这个节点不会存储数据，有成为主节点的资格，可以参与选举，有可能成为真正的主节点。这个节点我们称为master节点

node.master: true

node.data: false

第四种：这种组合表示这个节点即不会成为主节点，也不会存储数据，

这个节点的意义是作为一个client(客户端)节点，主要是针对海量请求的时候可以进行负载均衡。

node.master: false

node.data: false

默认情况下，每个节点都有成为主节点的资格，也会存储数据，还会处理客户端的请求。

在一个生产集群中我们可以对这些节点的职责进行划分。

建议集群中设置3台以上的节点作为master节点，这些节点只负责成为主节点，维护整个集群的状态。

再根据数据量设置一批data节点，这些节点只负责存储数据，后期提供建立索引和查询索引的服务，这样的话如果用户请求比较频繁，这些节点的压力也会比较大。

所以在集群中建议再设置一批client节点

这些节点只负责处理用户请求，实现请求转发，负载均衡等功能。

master节点：普通服务器即可(CPU 内存消耗一般)

data节点：主要消耗磁盘，内存

client节点：普通服务器即可(如果要进行分组聚合操作的话，建议这个节点内存也分配多一点)

原文链接：https://blog.csdn.net/psc0606/article/details/80247662

1、问题引出

ES5.X节点类型多了ingest节点类型。

针对3个节点、5个节点或更多节点的集群，如何配置节点角色才能使得系统性能最优呢？

è¿éåå¾çæè¿°

2、ES2.X及之前版本节点角色概述

è¿éåå¾çæè¿°

3、ES5.X节点角色清单

è¿éåå¾çæè¿°

由于其他几种类型节点和用途都很好理解，无非主节点、数据节点、路由节点。

Ingest的用途：

1）Ingest节点和集群中的其他节点一样，但是它能够创建多个处理器管道，用以修改传入文档。类似最常用的Logstash过滤器已被实现为处理器。

2）Ingest节点可用于执行常见的数据转换和丰富。处理器配置为形成管道。在写入时，Ingest Node有20个内置处理器，例如grok，date，gsub，小写/大写，删除和重命名。

3）在批量请求或索引操作之前，Ingest节点拦截请求，并对文档进行处理。

这样的处理器的一个例子可以是日期处理器，其用于解析字段中的日期。

另一个例子是转换处理器，它将字段值转换为目标类型，例如将字符串转换为整数。

4、ES5.X节点组合类型有多种类型，如何抉择？

Elasticsearch的员工 Christian_Dahlqvist解读如下：

一个节点的缺省配置是：主节点+数据节点两属性为一身。对于3-5个节点的小集群来讲，通常让所有节点存储数据和具有获得主节点的资格。你可以将任何请求发送给任何节点，并且由于所有节点都具有集群状态的副本，它们知道如何路由请求。

通常只有较大的集群才能开始分离专用主节点、数据节点。对于许多用户场景，路由节点根本不一定是必需的。

专用协调节点（也称为client节点或路由节点）从数据节点中消除了聚合/查询的请求解析和最终阶段，并允许他们专注于处理数据。

在多大程度上这对集群有好处将因情况而异。通常我会说，在查询大量使用情况下路由节点更常见。

5、ES5.X集群中如何设置节点角色

对于3个节点、5个节点甚至更多节点角色的配置，Elasticsearch官网、国内外论坛、博客都没有明确的定义。

è¿éåå¾çæè¿°

我的思考如下：

1）对于Ingest节点，如果我们没有格式转换、类型转换等需求，直接设置为false。

2）3-5个节点属于轻量级集群，要保证主节点个数满足((节点数/2)+1)。

3）轻量级集群，节点的多重属性如：Master&Data设置为同一个节点可以理解的。

4）如果进一步优化，5节点可以将Master和Data再分离。

6、小结

1）Elasticsearch博大精深，尤其新的5.X特性比较多，需要进一步深入研究；

2）集群的配置还有赖于进一步事件总结，再好的理论部署实践都是“花瓶”；

3）貌似图示划分了这么细、写了那么多，以官网为基准，也顺带调研了N多文档，但对Ingest节点的作用依然理解的不够深。希望大家评论探讨下。

原文链接：https://blog.csdn.net/laoyang360/article/details/78290484

分享到：

Eureka与Zookeeper对比区别 | codis架构原理研究

2019-08-09 11:05
浏览 1402
评论(0)
分类:企业架构
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论