云计算平台是非常巨大的分布式系统,需要处理庞大的处理请求,因此任何小概率事件在此平台中都必然发生。
DBMS强调ACID:原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)、持久性 (Durability)。其中的一致性强调当程序员定义的事务完成时,数据库处于一致的状态,如对于转帐来说,事务完成时必须是A少了多少钱B就多了多 少钱。而对于很多互联网应用来说,对于一致性和隔离性的要求可以降低,而可用性(Availability)的要求则更为明显。从而产生了两种弱一致性的 理论:BASE和CAP。
BASE:Basically Availble --基本可用;Soft-state --;Eventual Consistency --最终一致性
CAP: Consistency 一致性;Availability 可用性; Tolerance of network Partition 分区容忍性(可理解为部分节点故障或节点之间连接故障下系统仍可正常工作)。Brewer提出的该经验理论认为这三个目标最多只能达成两个,而另一个则需 要通过其他方式来弥补。
如果网络中不存在分区,客户端和存储系统在同一环境中,通过分布式事务机制可以保证一致性和可用性。但在大型网络 系统中,分区是必然存在的,因此一般的选择只能是在一致性和可用性之间权衡和折衷。如Ebay的经验尽可能保证可用性,但采用周密调整数据库操作的次序、 异步恢复事件,以及数据核对(reconciliation)或者集中决算(settlement batches)等方式来帮助系统达到最终一致性。
实际互联网系统往往都是ACID和BASE两种系统的结合,例如用户身份数据、交易数据通常采取ACID准则。
Guy Pardon认为,CAP理论认为三者不能同时达到是假定CAP被满足是在at the same moment in time,如果放弃这个假定就可以得到三者都满足的方案。但是在我看来,其方案也只是在可用性和一致性之间的折衷而已。放弃了读写一致性,读到的可能只是 cache中的快照而不是最新值;通过在系统无分区时才执行写入队列来保证数据更新一致性,而结果则是异步获得,相当于是对写入可用性要求的一种降低。
数据一致性通常指关联数据之间的逻辑关系是否正确和完整。而数据存储的一致性模型则可以认为是存储系统和数据使用者之间的一种约定。如果使用者遵循这种约定,则可以得到系统所承诺的访问结果。
常用的一致性模型有:
a、严格一致性(linearizability, strict/atomic Consistency):读出的数据始终为最近写入的数据。这种一致性只有全局时钟存在时才有可能,在分布式网络环境不可能实现。
b、顺序一致性(sequential consistency):所有使用者以同样的顺序看到对同一数据的操作,但是该顺序不一定是实时的。
c、因果一致性(causal consistency):只有存在因果关系的写操作才要求所有使用者以相同的次序看到,对于无因果关系的写入则并行进行,无次序保证。因果一致性可以看做对顺序一致性性能的一种优化,但在实现时必须建立与维护因果依赖图,是相当困难的。
d、管道一致性(PRAM/FIFO consistency):在因果一致性模型上的进一步弱化,要求由某一个使用者完成的写操作可以被其他所有的使用者按照顺序的感知到,而从不同使用者中来的写操作则无需保证顺序,就像一个一个的管道一样。 相对来说比较容易实现。
e、弱一致性(weak consistency):只要求对共享数据结构的访问保证顺序一致性。对于同步变量的操作具有顺序一致性,是全局可见的,且只有当没有写操作等待处理时才可进行,以保证对于临界区域的访问顺序进行。在同步时点,所有使用者可以看到相同的数据。
f、 释放一致性(release consistency):弱一致性无法区分使用者是要进入临界区还是要出临界区, 释放一致性使用两个不同的操作语句进行了区分。需要写入时使用者acquire该对象,写完后release,acquire-release之间形成了一个临界区,提供 释放一致性也就意味着当release操作发生后,所有使用者应该可以看到该操作。
g、最终一致性(eventual consistency):当没有新更新的情况下,更新最终会通过网络传播到所有副本点,所有副本点最终会一致,也就是说使用者在最终某个时间点前的中间过程中无法保证看到的是新写入的数据。可以采用最终一致性模型有一个关键要求:读出陈旧数据是可以接受的。
h、delta consistency:系统会在delta时间内达到一致。这段时间内会存在一个不一致的窗口,该窗口可能是因为log shipping的过程导致。
最终一致性的几种具体实现:
1、读不旧于写一致性(Read-your-writes consistency):使用者读到的数据,总是不旧于自身上一个写入的数据。
2、会话一致性(Session consistency):比读不旧于写一致性更弱化。使用者在一个会话中才保证读写一致性,启动新会话后则无需保证。
3、单读一致性(Monotonic read consistency):读到的数据总是不旧于上一次读到的数据。
4、单写一致性(Monotonic write consistency):写入的数据完成后才能开始下一次的写入。
5、写不旧于读一致性(Writes-follow-reads consistency):写入的副本不旧于上一次读到的数据,即不会写入更旧的数据。
Werner Vogels认为:在很多互联网应用中,单读一致性+读不旧于写一致性可以提供足够的一致性了。
Werner Vogels基于NWR模型来分析一致性,该模型决定了亚马逊云计算技术架构的方向。
N-副本个数,W-每次同步写入的副本个数,R-每次读出副本个数。认为只要W+R>N,就可以达到很强一致性。例如同步方式N=2,W=2,R=1,则始终是一致的;而如果是异步方式,则每次同步写入的W只有1,就不能保证一致性。如果W<N,则需要采取lazy的方式后续将更新同步给其他N-W个副本。
要保证强一致性,那么如果每次不能写够W份时,此次写操作必须失败,系统变得不可用。
分享到:
相关推荐
在本文中,我们将深入探讨几种重要的理论和实践方法,包括ACID特性、CAP定理、BASE原则,以及几种常见的分布式事务处理协议:二段提交、三段提交和TCC(Try-Confirm-Cancel)模式,同时也会提到幂等性这一关键概念。...
CAP、BASE、ACID区分 一、CAP CAP是分布式计算领域的公认定理。 1、一致性(Consistency) all nodes see the same data at the same time 在同一时间看见所有节点的数据是一致的 所有节点返回的数据都是一样的,...
CAP原理和BASE思想是分布式系统设计的重要理论基础,它们帮助开发者在一致性、可用性和分区容错性之间做出明智的决策。而NoSQL运动则提供了更多适应现代分布式环境的数据存储解决方案,这些解决方案通常基于BASE思想...
OceanBase 遵循 ACID 理论,即原子性、一致性、隔离性和持久性。这些理论是数据库系统的基础,确保了数据库的正确性和可靠性。 分布式事务: OceanBase 支持分布式事务,使用 Paxos + 2PC 协议来确保事务的一致性...
OceanBase使用Paxos协议来解决CAP问题,实现了高可用性和高一致性。 Raft协议 Raft协议是一种分布式一致性协议,用于解决分布式系统中的数据一致性问题。它可以确保分布式系统中的数据是一致的,避免了数据不...
CAP定理的历史沿革从1997年Fox和Brewer提出BASE概念开始,1999年他们又提出了CAP原理,直到2000年在PODC会议上正式提出CAP定理。2002年,Seth Gilbert和Nancy Lynch正式证明了CAP定理的可行性。CAP定理的流行得益...
Paxos通过多数派共识机制保证高可用性,而CAP定理指出在分区容忍性、一致性和可用性之间必须做出权衡。OceanBase在此基础上进行了优化,提供了主备同步模式,以适应不同的可用性和性能需求。 OceanBase的演进历程中...
NoSQL数据库通常采用BASE(基本可用、软状态、最终一致性)原则,与ACID的强一致性形成对比。 总的来说,CAP定理不再被视为一个硬性约束,而是成为设计分布式系统时的一个指导框架。设计师需要根据具体的应用场景和...
BASE**:ACID是指传统关系型数据库遵循的一组事务属性,确保了数据处理过程的可靠性和完整性。BASE则是基本可用(Basically Available)、软状态(Soft State)、最终一致(Eventual Consistency)的缩写,反映了...
In the years before his talk, the size of data grew immensely, making it necessary to find more scalable solutions than the so far existing ACID-databases. As a result new principles were developed, ...
CAP理论是分布式系统设计中的重要概念,由Eric Brewer教授提出,它揭示了在分布式环境中,一致性(Consistency)、可用性(Availability)和分区容错性(Partition Tolerance)这三个基本需求之间的权衡关系。...
**分布式系统中的BASE理论** ...与传统数据库的ACID属性相比,BASE理论更适合构建高扩展性和高可用性的分布式系统。在实际应用中,开发者需要根据业务需求和场景来权衡一致性与可用性,选择合适的解决方案。
分布式数据库的挑战来自于 CAP 理论的限制,但通过采用 BASE 模型和 NoSQL 数据库,可以实现高可用性和扩展性。VoltDB 和 MySQL Cluster 是分布式数据库的代表,NoSQL 数据库也提供了多种选择。
此外,BASE理论是相对于ACID(原子性、一致性、隔离性、持久性)事务模型提出的,它主张基本可用(Basically Available)、软状态(Soft State)和最终一致性(Eventually Consistent)。BASE理论更适用于大规模...
而传统数据库保证了强一致性(ACID模型)和高可用性,所以要想实现一个分布式数据库集群非常困难,这也解释了为什么数据库的扩展能力十分有限。而近年来不断发展壮大的NoSQL运动,就是通过牺牲强一致性,采用BASE模型...
CAP理论是分布式系统设计中的核心概念,全称为Consistency、Availability和Partition Tolerance。这个理论指出,在分布式系统中,无法同时保证数据一致性(C)、高可用性(A)和分区容错性(P)。在面临网络分区的...
根据提供的文件内容,我们将详细探讨MongoDB相关的知识点,并围绕NoSQL数据库的特点和优势,以及分布式系统理论中的CAP定理和ACID与BASE模型。 首先,MongoDB是一种流行的NoSQL数据库,它以文档的形式存储数据,与...