`

红帽集群套件RHCS的工作原理

阅读更多

  红帽集群套件RHCS的工作原理

本节将对红帽集群套件RHCS(Red Hat Cluster Suite)进行详细讲解,为下一节的配置实战进行铺垫。读者也可以选择直接跳过本节,阅读并动手完成"12.6.3 RHCS+Oracle配置实战图解"一节的实例后,再重新对本节内容进行详细阅读,以加强对红帽RHCS集群套件的理解。

12-2RHEL 5系列版本中RHCS的架构示意图:

此图与红帽官方的架构图有所不同,图12-2主要展示了RHCS中常用的组件,通过简单的图例来描述RHCS架构中各个组件之件的关系。下面对这些组件进行详细解释:

 

(点击查看大图)图12-2  RHCS架构示意图

cman集群管理器

cman是一个基于内核的对称通用集群管理器。它由两部分组成:连接管理器(cnxman),用于处理成员、消息、投票数、事件通知和过渡;服务管理器(SM),用于处理那些需要通过各种方式进行集群管理的应用及外部系统。cmanRHCS中最核心的服务,可通过系统中的serivce命令进行启/停操作;DLMGFSCLVMFence都依赖于cman群集管理器。

rgmanager资料组管理器

rgmanager(Resource Group Manager)基于cman并使用DLM动态锁管理机制。与cman一样,rgmanager也是RHCS中的一个核心服务,可通过系统中的serivce命令进行启/停操作;rgmanager管理并为集群中的Service(服务)Resources(资源)提供Failover错误切换功能。

Service(服务)

每个服务都被指定存在于一个Failover Domain中,并与多个Resources(资源)关联。每个服务可以理解为实际操作中的一个应用,如Web服务器、Java中间件、数据库、文件共享系统、邮件系统等。这些应用在运行时不但对应用程序本身有要求(如某个运行指令或多个运行脚本的组合),还要提供对诸如虚拟IP、文件系统等资源的支持。

Failover Domain(错误切换域)

每个Failover Domain都与两个或两个以上的Node(服务器节点)进行绑定,Failover Domain指定了集群中某个Service运行时的范围,也就是指定此Service将会由哪些服务器提供Failover错误切换功能。每个Node都允许与多个Failover Domain进行绑定,也就是说每个Node都可以为多个Service服务,因此可以实现"主动/主动(双活动)"方式的集群配置。

Resources(资源)

Resources指的是组成一个应用所需的各种组件,通常包括:应用程序、虚拟IP、文件系统。资源与Service组合时,往往还会体现出一定的层次关系,例如:通常系统都要求确认虚拟IP及文件系统都已经正常连接及挂载后,才可以运行某个应用程序,这个顺序一旦调转,就会使应用程序运行出错。

Fence机制

RHCS集群运行时,为了避免因出现不可预知的情况而造成的"脑裂"现象(如:心跳线断连,此时两台服务器都无法找到对方,无法向对方发出操作指令,都各自认为自己是主节点;又或者主服务器系统崩溃,系统能接收到备用服务器的操作指令,但无法返回运行情况的确认信号,导致备用服务器无法获知系统资源的使用情况),系统要求通过Fence机制来保障系统切换时的I/O使用安全。

如上所述,Fence主要就是通过服务器或存储本身的硬件管理接口,又或者是外部电源管理设备,来对服务器或存储发起直接的硬件管理指令,控制服务器或存储链路的开关。因此,Fence机制也被称为"I/O屏障"技术。当"脑裂"发生时彻底断开问题服务器的所有I/O连接,保证问题服务器不能对集群中的I/O资源(共享的文件系统资源)进行任何操作,严格保证集群环境中企业核心数据的完整性。

 

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics