互联网一致性架构设计 -- DB双主一致性
MySQL数据库集群常使用一主多从,主从同步,读写分离的方式来扩充数据库的读性能,保证读库的高可用,但此时写库仍然是单点。
解决方法
在一个MySQL数据库集群中可以设置两个主库,并设置双向同步,以冗余写库的方式来保证写库的高可用。
需求分析
数据冗余会引发数据的一致性问题,因为数据的同步有一个时间差,并发的写入可能导致数据同步失败,引起数据丢失,假设主库使用了auto increment来作为自增主键:
- 两个MySQL-master设置双向同步可以用来保证主库的高可用
- 数据库中现存的记录主键是1,2,3
- 主库1插入了一条记录,主键为4,并向主库2同步数据
- 数据同步成功之前,主库2也插入了一条记录,由于数据还没有同步成功,插入记录生成的主键也为4,并向主库1也同步数据
- 主库1和主库2都插入了主键为4的记录,双主同步失败,数据不一致
解决方法
- 相同步长免冲突:设置不同初始值,增长步长一样。
- 上游生成ID避冲突:通过ID生成器生成数据库ID。
- 消除双写不治本:一个主库支持服务,另一个做备份,shadow-master
- 内网DNS探测
相同步长免冲突
- 设置不同的初始值
- 设置相同的增长步长
如上图所示:
- 两个MySQL-master设置双向同步可以用来保证主库的高可用
- 库1的自增初始值是1,库2的自增初始值是2,增长步长都为2
- 库1中插入数据主键为1/3/5/7,库2中插入数据主键为2/4/6/8,不冲突
- 数据双向同步后,两个主库会包含全部数据
如上图所示
两个主库最终都将包含1/2/3/4/5/6/7/8所有数据,即使有一个主库挂了,另一个主库也能够保证写库的高可用。
上游生成ID避冲突
完全可以由业务上游,使用统一的ID生成器,来保证ID的生成不冲突:
如上图所示
调用方插入数据时,带入全局唯一ID,而不依赖于数据库的auto increment,也能解决这个问题。至于如何生成全局唯一,趋势递增的ID,参见文章《分布式ID生成算法》。
消除双写不治本
使用auto increment两个主库并发写可能导致数据不一致,只使用一个主库提供服务,另一个主库作为shadow-master,只用来保证高可用。
如上图所示:
- 两个MySQL-master设置双向同步可以用来保证主库的高可用
- 只有主库1对外提供写入服务
- 两个主库设置相同的虚IP,在主库1挂掉或者网络异常的时候,虚IP自动漂移,shadow master顶上,保证主库的高可用
缺陷
这个切换由于虚IP没有变化,所以切换过程对调用方是透明的,但在极限的情况下,也可能引发数据的不一致。
如上图所示:
- 两个MySQL-master设置双向同步可以用来保证主库的高可用,并设置了相同的虚IP
- 网络抖动前,主库1对上游提供写入服务,插入了一条记录,主键为4,并向shadow master主库2同步数据
- 突然主库1网络异常,keepalived检测出异常后,实施虚IP漂移,主库2开始提供服务
- 在主键4的数据同步成功之前,主库2插入了一条记录,也生成了主键为4的记录,结果导致数据不一致
内网DNS探测
虚IP漂移,双主同步延时导致的数据不一致,本质上,需要在双主同步完数据之后,再实施虚IP偏移,使用内网DNS探测,可以实现shadow master延时高可用:
- 使用内网域名连接数据库,例如:db.58daojia.org
- 主库1和主库2设置双主同步,不使用相同虚IP,而是分别使用ip1和ip2
- 一开始db.58daojia.org指向ip1
- 用一个小脚本轮询探测ip1主库的连通性
- 当ip1主库发生异常时,小脚本delay一个x秒的延时,等待主库2同步完数据之后,再将db.58daojia.org解析到ip2
- 程序以内网域名进行重连,即可自动连接到ip2主库,并保证了数据的一致性
总结
主库高可用,主库一致性,一些小技巧:
- 双主同步是一种常见的保证写库高可用的方式
- 设置相同步长,不同初始值,可以避免auto increment生成冲突主键
- 不依赖数据库,业务调用方自己生成全局唯一ID是一个好方法
- shadow master保证写库高可用,只有一个写库提供服务,并不能完全保证一致性
- 内网DNS探测,可以实现在主库1出现问题后,延时一个时间,再进行主库切换,以保证数据一致性
相关推荐
总的来说,云原生数据库通过创新的架构设计,如日志优化、链式复制、Quorum机制、计算与存储分离等,解决了传统数据库在云环境中的性能问题,提高了数据一致性和可用性,降低了运维成本。这些技术的出现,不仅推动了...
2. **范式原则深层次应用**:深入理解并应用范式理论,优化数据库设计,减少冗余和提高数据一致性。 3. **数据架构与标准设计**:建立统一的数据架构标准,确保跨系统数据的兼容性和互操作性。 4. **设计与构建...
- 多地多中心:具有多点写入能力和水平扩展能力,以及通过DB层一致性算法保证数据稳定性。 - 容灾设计:通过DB-conector和DB-server的协作完成容灾,确保系统在同城、异地容灾的情况下无损切换。 实际业务支撑方面...
### DB主从一致性架构优化4种方法 #### 需求背景 在大多数互联网应用场景下,数据处理呈现出明显的“读多写少”特征。为了提高读取性能并满足大规模用户需求,很多系统采取了“一主多从”的数据库架构设计。这种...
互联网异地双活数据库架构解决方案 互联网异地双活数据库架构是指在异地双活系统中实现数据库的高可用性和高扩展性的架构解决方案。该架构解决方案主要针对异地双活系统中的数据库难点进行设计和优化,旨在提高...
- **性能与一致性**:虽然 BDB-HA 提供了高可用性和可扩展性,但在某些情况下,可能需要在性能和数据一致性之间做出权衡。 - **网络延迟**:在地理分布的环境中,网络延迟可能会影响数据复制的速度和效率。 - **数据...
学习者需要了解如何构建、维护和监控分布式集群,确保高可用性和数据一致性。 6. **数据库迁移管理**: 数据库迁移涉及到数据的导入导出、数据同步、在线迁移等,确保业务连续性。学习者将学习到各种迁移工具和...
通过将数据库操作与Zookeeper结合,开发者可以实现更高效的数据管理和分布式一致性,这对于云原生环境下的应用尤其重要。 “分布式”和“云原生”这两个标签揭示了tendril-utils-db的设计理念。在分布式环境中,多...
### 主从DB与Cache一致性详解 #### 一、引言 在现代软件系统中,为了提高性能和可扩展性,通常采用主从数据库复制技术以及缓存机制。然而,在这种架构下,由于主从数据库之间的数据同步延迟以及并发读写操作的存在...
它支持ACID(原子性、一致性、隔离性和持久性)特性,确保数据的一致性和完整性。本章节可能介绍GaussDB OLTP的架构、设计原则、主要功能以及与传统数据库的比较。 2. **SQL语法进阶**: SQL(Structured Query ...
- 只读节点的规格与集群一致,它们通过主实例同步数据。 - 只读节点不需要单独维护账号和数据库,简化了管理。 - 提供性能监控,有助于观察集群运行状态。 - 在某些情况下,只读节点可以手动提升为主节点。 9. ...
- **第二十九章**:“Data Consistency Utilities”(数据一致性实用工具):确保数据一致性的工具集。 - **第三十章**:“Backup and Recovery Utilities”(备份与恢复实用工具):用于数据备份和恢复的工具。 ##...
BLL层确保了业务规则的一致性,并将复杂的操作封装起来,使得UI层可以更简单地调用。 5. **PublicClass**:这个文件夹可能包含一些公共类,它们可以被三层架构的任何一层使用,比如通用的函数、枚举、常量等。 6. ...
ZooKeeper是一个分布式的,开放源码的协调服务,用于分布式应用程序,可以提供命名服务、配置管理、集群同步等服务,确保在分布式环境中数据的一致性。 6. **云原生**: “云原生”是指在云环境中设计和构建的应用...
除此以外还介绍了一些分布式事务相关的技术,如幂等性、全局一致性ID、分布式对象等。... 6-1 分布式事务介绍 6-2 spring分布式事务实现_使用JTA 6-3 spring分布式事务实现_不使用JTA 6-4 实例1-DB-DB 6-5 实例1-DB-...
而Oracle实例则专注于单一数据库,强调了数据的一致性和安全性。 ### 三、内存管理与后台进程 #### DB2 - **内存管理**:DB2的内存管理更加灵活,可以根据需要动态调整,但不支持直接的手动修改。 - **后台进程**...
3. **事务处理**:理解ACID(原子性、一致性、隔离性和持久性)特性,并掌握GaussDB中的事务管理机制。 4. **高可用性**:研究GaussDB的主备切换、故障恢复和集群容灾策略,以确保服务的连续性。 5. **性能调优**...
基金公司的双活数据中心建设目标主要包括业务连续性、流量转发、业务安全和环境一致性。这要求数据中心能够抵御单点故障,提供快速响应的用户访问,保证机房安全,以及在数据中心之间保持数据和部署的一致性。实施...