数据一致性实现技术
分布式存储在不同的节点的数据采取什么技术保证一致性,取决于应用对于系统一致性的需求,在关系型数据管理系统中一般会采用悲观的方法(如加锁),这些方法代价比较高,对系统性能也有较大影响,而在一些强调性能的系统中则会采用乐观的方法。
对于数据不同副本中的一致性,采用类似于 Quorum 系统的一致性协议实现。这个协议有三个关键值N、R和W。
—N表示数据所具有的副本数。
—R表示完成读操作所需要读取的最小副本数,即一次读操作所需参与的最小节点数目。
—W表示完成写操作所需要写入的最小副本数,即一次写操作所需要参与的最小节点数目。
该策略中,只需要保证R+W>N,就可以保证强一致性。
例如:N=3,W=2,R=2,那么表示系统中数据有3个不同的副本,当进行写操作时,需要等待至少有2个副本完成了该写操作系统才会返回执行成功的状态,对于读操作,系统有同样的特性。由于R+W>N,因此该系统是可以保证强一致性的。
R+W>N会产生类似Quorum的效果。该模型中的读(写)延迟由最慢的R(W)副本决定,有时为了获得较高的性能和较小的延迟,R和W的和可能小于N,这时系统不能保证读操作能获取最新的数据。
如果R+W>N,那么分布式系统就会提供强一致性的保证,因为读取数据的节点和被同步写入的节点是有重叠的。在关系型数据管理系统中,如果N=2,可以设置为W=2,R=1,这是比较强的一致性约束,写操作的性能比较低,因为系统需要2个节点上的数据都完成更新后才将确认结果返回给用户。
如果R+W≤N,这时读取和写入操作是不重叠的,系统只能保证最终一致性,而副本达到一致的时间则依赖于系统异步更新的实现方式,不一致性的时间段也就等于从更新开始到所有的节点都异步完成更新之间的时间。
R和W的设置直接影响系统的性能、扩展性与一致性。如果W设置为1,则一个副本完成更改就可以返回给用户,然后通过异步的机制更新剩余的N-W的副本;如果R设置为1,只要有一个副本被读取就可以完成读操作,R和W的值如较小会影响一致性,较大则会影响性能,因此对这两个值的设置需要权衡。
下面为不同设置的几种特殊情况。
—当W= 1,R=N时,系统对写操作有较高的要求,但读操作会比较慢,若N个节点中有节点发生故障,那么读操作将不能完成。
—当R= 1,W=N时,系统要求读操作高性能、高可用,但写操作性能较低,用于需要大量读操作的系统,若N个节点中有节点发生故障,那么写操作将无法完成。
—当R=Q,R=Q(Q=N/ 2 + 1)时,系统在读写性能之间取得了平衡,兼顾了性能和可用性,Dynamo系统的默认设置就是这种,即N=3,W=2,R=2。
两阶段提交协议
两阶段提交协议[10](Two Phase Commit Protocol,2PC协议)可以保证数据的强一致性,许多分布式关系型数据管理系统采用此协议来完成分布式事务。它是协调所有分布式原子事务参与者,并决定提交或取消(回滚)的分布式算法,同时也是解决一致性问题的一致性算法。该算法能够解决很多的临时性系统故障(包括进程、网络节点、通信等故障),被广泛地使用。但是,它并不能通过配置来解决所有的故障。为了能够从故障中恢复,两阶段提交协议使用日志来记录参与者(节点)的状态,虽然使用日志降低了性能,但是参与者(节点)能够从故障中恢复。
在两阶段提交协议中,系统一般包含两类机器(或节点):一类为协调者(Coordinator),通常一个系统中只有一个;另一类为事务参与者(Participants,Cohorts或Workers),一般包含多个,在数据存储系统中可以理解为数据副本的个数。协议中假设每个节点都会记录写前日志(Write-ahead Log)并持久性存储,即使节点发生故障日志也不会丢失。协议中还假设节点不会发生永久性故障,而且任意两个节点都可以互相通信。
当事务的最后一步完成之后,协调者执行协议,参与者根据本地事务是否成功完成来回复同意提交事务或者回滚事务。
顾名思义,两阶段提交协议由两个阶段组成。在正常的执行下,这两个阶段的执行过程如下所述。
阶段1:请求阶段(commit-request phase,或称表决阶段,voting phase)
在请求阶段,协调者将通知事务参与者准备提交或取消事务,然后进入表决过程。在表决过程中,参与者将告知协调者自己的决策:同意(事务参与者本地作业执行成功)或取消(本地作业执行发生故障)。
阶段2:提交阶段(commit phase)
在该阶段,协调者将基于第一个阶段的投票结果进行决策:提交或取消。当且仅当所有的参与者同意提交,事务协调者才通知所有的参与者提交事务,否则协调者将通知所有的参与者取消事务。参与者在接收到协调者发来的消息后将执行相应的操作。
注意两阶段提交协议与两阶段锁协议不同,两阶段锁协议为一致性控制协议。
该协议的执行过程可以通过下图2-2来描述
图2-2两阶段提交协议
两阶段提交协议最大的缺点在于它是通过阻塞完成的协议,节点在等待消息的时候处于阻塞状态,节点中其他进程则需要等待阻塞进程释放资源。如果协调者发生了故障,那么参与者将无法完成事务而一直等待下去。以下情况可能会导致节点发生永久阻塞。
如果参与者发送同意提交消息给协调者,进程将阻塞直至收到协调者的提交或回滚的消息。如果协调者发生永久故障,参与者将一直等待,这里可以采用备份的协调者,所有参与者将回复发给备份协调者,由它承担原协调者的功能。
如果协调者发送“请求提交”消息给参与者,它将被阻塞直到所有参与者都回复完,如果某个参与者发生永久故障,那么协调者也不会一直阻塞,因为协调者在某一时间内还未收到某参与者的消息,那么它将通知其他参与者回滚事务。
同时两阶段提交协议没有容错机制,一个节点发生故障整个事务都要回滚,代价比较大。
下面我们通过一个例子来说明两阶段提交协议的工作过程。
A组织B、C和D三个人去爬长城:如果所有人都同意去爬长城,那么活动将举行;如果有一人不同意去爬长城,那么活动将取消。用两阶段提交协议解决该问题的过程如下。
首先A将成为该活动的协调者,B、C和D将成为该活动的参与者。
阶段1
A发邮件给B、C和D,提出下周三去爬山,问是否同意,那么此时A需要等待B、C和D的邮件。
B、C和D分别查看自己的日程安排表。B、C发现自己在当日没有活动安排,则发邮件告诉A他们同意下周三去爬长城。由于某种原因,D白天没有查看邮件。那么此时A、B和C均需要等待。到晚上的时候,D发现了A的邮件,然后查看日程安排,发现周三当天已经有别的安排,因此D回复A“活动取消”。
阶段2
此时A收到了所有活动参与者的邮件,并且A发现D下周三不能去爬山,于是A发邮件通知B、C和D,下周三爬长城活动取消。
此时B、C回复A“太可惜了”,D回复A“不好意思”。至此该事务终止。
通过该例子可以发现,两阶段提交协议存在明显的问题。假如D一直不能回复邮件,那么A、B和C将不得不处于一直等待的状态。并且B和C所持有的资源一直不能释放,即下周三不能安排其他活动。其他等待该资源释放的活动也将不得不处于等待状态。
基于此,后来有人提出了三阶段提交协议,在其中引入超时的机制,将阶段1分解为两个阶段:在超时发生以前,系统处于不确定阶段;在超时发生以后,系统则转入确定阶段。
两阶段提交协议包含协调者和参与者,并且二者都有出现问题的可能性。假如协调者出现问题,我们可以选出另一个协调者来提交事务。例如,班长组织活动,如果班长生病了,我们可以请副班长来组织。如果参与者出问题,那么事务将不会取消。例如,班级活动希望每个人都能参加,假如有一位同学不能参加了,那么直接取消活动即可。或者,如果大多数人参加,那么活动如期举行(两阶段提交协议变种)。为了能够更好地解决实际的问题,两阶段提交协议存在很多的变种,例如:树形两阶段提交协议(或称递归两阶段提交协议)、动态两阶段提交协议(D2PC)等。
作者简介
陆嘉恒,中国人民大学教授,博士生导师。2006年毕业于新加坡国立大学计算机科学系,获博士学位;2006-2008年在美国加利福尼亚大学尔湾分校(University of California, Irvine)进行博士后研究;2008年加入中国人民大学,2012年破格晋升为教授。主要研究领域包括数据库技术和云计算技术。先后在SIGMOD、VLDB、ICDE、WWW等国际重要会议和期刊上发表数据库方向的论文40多篇,主编多本云计算和大数据的教材和著作。
本文节选自《大数据挑战与NoSQL数据库技术》一书。陆嘉恒编著,由电子工业出版社出版。
相关推荐
文章提出了基于时间戳机制的数据一致性实现思路,即在每个节点对数据进行修改时,不是直接将更新消息传递给其他节点,而是在数据上标记当前的时间戳。当某个节点需要修改数据时,它会广播其改动请求和时间戳。其他...
据访问的性能,但是数据复制不可避免地引发数据一致性维护的问题。与传统的 分布式系统不同,P2P系统的规模巨大、分布性强和动态性强等特点给P2P分布 存储系统中的数据一致性维护带来挑战。本文针对海量数据和P2P...
《省级业务运营支撑系统业务技术规范-数据一致性管理机制分册》是针对移动BOSS(Business Operation Support System)系统的一项重要技术文档,旨在确保省级业务运营支撑系统的数据准确、完整和一致,从而优化业务...
分布式存储数据一致性的研究涉及多个方面,包括但不限于数据一致性要求、数据一致性模型、以及数据一致性的实现技术。本文通过分析分布式存储中数据一致性的要求、模型和实现机制,探讨了如何通过多副本机制来实现...
微服务架构下的数据一致性是构建大规模分布式系统的挑战之一。传统应用中,本地事务通过ACID(原子性、一致性、隔离性、持久性)原则保证数据的一致性,但在微服务架构中,由于服务间的解耦和数据库的分散,这种方法...
《省级业务运营支撑系统(BOSS)业务技术规范(3.0版)》是一份针对中国省级业务运营支撑系统的详尽技术指南,其中的“数据一致性管理机制总体规范分册”部分,着重阐述了如何在复杂的业务环境中确保数据的准确性和...
本文主要讨论了地面数据处理系统数据的一致性实现,介绍了地面数据处理软件的设计原理和要点,并以Windows操作系统平台为例,描述了数据处理软件的整体框架,着重介绍了数据处理软件数据库的一致性设计。 1. 地面...
接着,文件提到了几个重要的数据一致性模型和技术,包括两阶段提交(2PC)、三阶段提交(3PC)、Saga和分布式事务处理框架Seata。2PC和3PC是经典的分布式事务协议,但在高并发和容错性方面存在局限。Saga是一种长...
2.1.4 数据一致性实现技术 包括多版本并发控制(MVCC)、分布式事务、Paxos算法等,都是NoSQL数据库为了在分布式环境下保证数据一致性所采用的技术手段。 2.2 数据存储模型 NoSQL数据库支持多种数据模型,以适应...
在数据库课程设计中,实现数据的一致性是确保系统可靠性和数据准确性的关键。通过合理的事务管理、并发控制、数据完整性约束以及数据恢复机制,可以有效地维护数据的一致性。随着技术的发展,持续关注新的数据库管理...
【分布式基站通信系统前后台数据一致性方法设计与实现】 分布式基站通信系统是现代移动通信网络的重要组成部分,尤其在数据业务快速增长的背景下,这种系统能够提供更高效、灵活的网络覆盖和服务。分布式基站由BBU...
数据一致性是分布式数据库系统设计中的核心议题,尤其是在不依赖共享存储的情况下。传统的RDBMS,如Oracle、MySQL和PostgreSQL,依然能够在主库故障时实现数据零丢失,关键在于正确地应用Write-Ahead-Logging(预写...
总的来说,分布式存储数据一致性技术通过副本同步、故障恢复机制和智能的读写策略,确保在大规模分布式环境中数据的准确性和可靠性。无论是solidfire的NVRAM缓存策略,还是FusionStorage Block的同步写和读修复机制...
Link16是美军联合作战使用的主流战术数据链,其在分布式多平台态势一致性实现机制中的作用至关重要。文章针对Link16在多平台间实现态势一致性进行了深入研究,分析了其总体设计思路、处理流程、支持监控的消息种类...
### 实时数据的一致性保障技术 #### 一、一致性模型与事务隔离...综上所述,实时数据系统的一致性保障技术涵盖了多种模型和机制,通过合理选择和组合这些技术,可以在保证数据一致性的同时,提高系统的性能和可用性。
本文将深入探讨微服务架构中实现数据一致性的关键策略之一——**可靠事件模式**。 #### 可靠事件模式 可靠事件模式是一种广泛应用于分布式系统的机制,它通过确保事件能够被正确地发布与消费来维护系统的一致性。...
LVM 快照数据一致性迁移是指利用 LVM 快照技术来实现数据的一致性迁移。这种方法可以使数据迁移更加快速、安全和可靠。LVM 快照技术可以在不影响生产系统的情况下迁移数据,从而确保数据的一致性。 LVM 快照技术的...
总结而言,GoldenDB通过全局事务管理器、数据节点和计算节点的相互配合,实现了分布式事务的原子性、隔离性和备份恢复一致性。这不仅提升了金融业务的稳定性和可靠性,也为银行业务的分布式架构转型升级提供了坚实的...