最近,HA方案中使用到drbd,一直没有出现过的脑裂还是出现了。
出现原因:drbd未停止或做相应处理时,内网IP重新划分
说明:
我这里testx1为备,testx2为主
现象描述:
[root@testx1 ~]# /etc/init.d/drbd status
这里只写关键信息了
Secondary/Unknown
[root@testx2 ~]# /etc/init.d/drbd status
这里只写关键信息了
Primary/Unknown
解决方案:
先选择好一个备机
在备机上执行
drbdadm secondary res0
drbdadm -- --discard-my-data connect res0
######res0说明################
#res0是drbd.conf中定义的资源
res0 data {
...
...
}
然后在主上执行
drbdadm connect res0
检查
[root@testx1 ~]# /etc/init.d/drbd status
这里只写关键信息了
Secondary/Primary
[root@testx2 ~]# /etc/init.d/drbd status
这里只写关键信息了
Primary/Secondary
相关推荐
DRBD 配置中的处理器(handlers)定义了在特定事件发生时执行的脚本,例如,当主节点降级时 (`pri-on-incon-degr`),或者出现脑裂(split-brain)时 (`split-brain`)。网络设置包括验证方式(如 `cram-hmac-alg ...
同时,DRBD还具备脑裂(Split Brain)通知功能,当网络故障导致两台服务器认为自己是主服务器时,系统会发出警告并采取措施避免数据丢失。 ### 结论 《DRBD用户指南》不仅是一本技术手册,更是理解DRBD工作原理、...
正确的开机步骤确保资源可以正确同步,并防止脑裂(Split-Brain)现象发生。正确关机步骤则确保在关闭服务之前,所有待处理的数据同步完成,并且系统状态记录为一致。 在搭建过程中,需要特别注意网络配置。DRBD...
《Pacemaker、Corosync、DRBD及Fencing(STONITH)详解》 在高可用性(High Availability, HA)系统设计中,确保服务的连续性和数据的一致性至关重要。Pacemaker、Corosync、DRBD以及Fencing(STONITH)是Linux环境下...
同时,文档还涉及到了如何设置文件系统、预设条件、启动和测试系统、处理网络隔离情况、系统启动时启动正确的守护进程、测试系统、从脑裂(split-brain)状态恢复、以及DRBD的维护和支持信息。 具体步骤包括: 1. ...
heartbeat、drbd配置较为复杂,需要自己写脚本才能实现MySQL自动切换,对于不会脚本语言的人来说,这无疑是一种脑裂问题;对于mmm,生产环境中很少有人用,且mmm 管理端需要单独运行一台服务器上,要是想实现高可用...
- **缺点**:主机宕机后,可能出现“脑裂”问题,需要手动执行命令恢复主机接管。 4. **MySQL Cluster** - **概述**:MySQL Cluster采用分布式无单点故障设计,所有组件都有独立内存和磁盘,数据冗余确保高可用性...
- **Heartbeat + DRBD + MySQL**:用于数据库的高可用性配置。 - **Heartbeat + Active + NFS/MFS**:用于存储的高可用性配置。 这些组合不仅能够提高单一组件的可靠性,还能通过整合不同层面的技术优势,构建更加...
手册专门阐述了硬盘故障、NameNode故障以及脑裂(split-brain,指分布式系统的两个或多个节点之间失去通信,但它们各自继续独立运行,导致数据不一致的问题)的恢复方法。这些恢复步骤对于快速将服务恢复到正常状态...
- 配置 fencing,防止脑裂问题,确保在故障切换时只有一个节点处于活动状态。 - 配置监控和告警机制,以便在出现故障时及时通知运维人员。 4. **数据库初始化流程** 在HA环境中,数据库的初始化至关重要,因为它...
- 主机故障恢复后,可能需要手动执行命令进行主机接管,存在一定的脑裂风险。 ##### 3.4 MySQL Cluster **概述:** MySQL Cluster是一种分布式设计,其目标是实现零单点故障,任何组成部分都有自己的内存和磁盘。...
- **Stonith**:单个或多个节点的电源管理,用于在节点故障时关闭节点,避免脑裂现象。 ### 3. 搭建集群步骤 #### 3.1 安装操作系统 本文档以Fedora 13为示例,首先需要在两台或多台服务器上安装此操作系统。...
- **支持STONITH技术**:Stop The Other Node In The Heap,用于解决集群中的“脑裂”问题,确保只有一个活动节点控制资源。 - **支持Watchdog Timers**:通过硬件级别的监视器来检测并重启异常进程,增强系统稳定性...