`

数据复制的并发控制

 
阅读更多

 

数据分布通常应用在高性能计算(HPC)中。数据分布拓扑主要有两种:复制和分区。

 

在数据复制环境中,一个数据项往往有好几个副本,但应该保证一定程度的数据一致性,好让最终用户看起来全局只有一份数据。使用数据复制最大的挑战就是根据业务需求在数据一致性和性能之间做出正确的权衡。

要实现数据一致性,通常会运用一些并发控制方案。本文将解释Oracle10g高级复制Oracle10g真正应用集群(RAC)、内存数据库(IMDB)Oracle10g TimesTenGigaspaces内存数据网格(IMDG)7.1里复制所涉及的并发控制。

讨论过程中我们使用一个分布式航空订票系统为例,后面简称为DATS。为了具备高可用性和负载均衡,DATS有两个数据库:一个在纽约、一个在洛杉矶。根据复制方案,数据只能在一个地方更新,然后复制到另一个地方;或者两个地方都更新,然后互相复制。

此外,假设以下动作会按时间顺序发生:

  1. 两个本地数据库副本此刻已经同步,只剩下一张机票。仅剩的这张票在纽约或洛杉矶都可以预定;
  2. 一位纽约客户购买了这张票。这个动作会更新纽约本地的数据库,并且会按照复制方案以某种方式复制到洛杉矶的数据库里去;
  3. 根据复制方案,洛杉矶数据库也许显示那张票仍然可以购买,也许显示已经被纽约用户预定了。要是洛杉矶数据库仍然显示这张票在售,那这张票就会被卖给一位洛杉矶顾客。这就会出现超卖的情况。

由于DATS在广域网环境只适合异步复制,在同步复制环境里,DATS应该作如下变化(下称“DATS改”):我们假设纽约有第二个数据库,和第一个数据库在同一个数据中心里,这个数据库将取代洛杉矶的数据库。

我们还假设DATS使用了乐观并发控制机制。下面是乐观并发控制在DATS里的工作原理:

为了具备良好的性能,大部分多层应用都使用乐观并发控制,这会带来更新丢失的问题。比如说,如果我们在DATS的两个数据库中使用乐观并发控制,步骤三的应用层有可能先于步骤二读取洛杉矶的数据库,却在步骤二之后才把那张票卖给一位洛杉矶顾客。

应用必须使用“带有版本检查的乐观并发控制”来解决这个问题。版本检查方案可以只是一个版本号,只要有相应的数据变化,版本号就加一。

假设步骤一的版本是0。步骤二将版本更新为1。步骤三的应用层读到的版本也是0。但在应用层试图出售同一张票的时候,步骤三会失败,因为它会发现版本已经从缓存里的0变成1了。

1.使用分布式锁和本地事务的同步复制

Oracle RAC在8i及以前的版本中被称为Oracle并行服务器(OPS),它允许多个实例站点访问同一个物理数据库。为了让用户在任何时候、任何实例站点都能读取、写入任何数据,Oracle RAC使用“缓存融合(Cache Fusion)”来保证数据的一致性。

“缓存融合”主要使用带有分布式锁管理器(DLM)的同步复制。DLM的功能之一是扮演分布式锁(DL)的协调员,使同一个资源(比如表的一行)一次只能被一个实例站点修改,其它站点必须等待。

DLM还是全局资源目录。举例来说,当实例站点1更新了一行内容,它并不需要主动把新版本的数据推送给其他实例站点。相反,它只需要把其他副本置为无效就可以了。当实例站点2稍后请求同一行内容时,DLM会让它从实例站点1获取最新的版本。

此外,由于有DLM,而且仍然只有一个物理数据库,实例站点1并不需要使用分布式事务。

这样做的优点是有了高度的数据一致性,读取和写入也都有高度的负载均衡(通常来说,同步复制不会对写入操作进行均衡,因为相同的写入会在所有站点之间进行复制。但有了RAC轻量级的失效机制,写入操作也会进行相对的均衡)。

缺点则是写入性能不能伸缩(即使失效机制很轻量,但太多的失效仍然会阻塞共享互连;所以RAC的写操作仍然无法伸缩),由于复制同步和分布式锁,这 种做法也满足不了高可用和快速互连的需求(分布式锁的实现通常在每个站点都有很多守护进程和数据结构,在低速的局域网和广域网上,分布式锁的协调能力会很 差甚至不可能完成协调。至于Oracle的缓存融合,分布式锁是在集群环境中用全局缓存服务(GCS)、全局队列服务(GES)和全局资源目录(GRD) 实现的)。

你应该会注意到,这种方案是RAC独有的。如果你有不止一个个带事务的数据源,使用本地事务有时候会导致数据的不一致。不管怎么说,同时使用分布式锁和分布式事务实现同步复制,即便分布式事务能保证数据的原子性,用起来也会非常昂贵。我至今都没见过使用这种方案的产品。

由于同步复制不太现实,在广域网甚至不太可能,这种方案只能应用于“DATS改”。步骤三必须等待步骤二释放分布式锁。当步骤三获得分布式锁之后,会看到那张票在步骤二已经售出。

2.使用本地锁和分布式事务的同步复制

Oracle的多主复制也称为peer-to-peer复制或n-way复制,它有两种数据一致性协议,一是同步复制,另一种在第四节进行阐述。

同步复制在一次分布式事务中,将待执行的DML修改或复制过程应用到参与复制环境的所有站点(每个站点都有自己的物理数据库,这是与Oracle RAC的不同之处,RAC只有一个物理数据库)。如果DML语句或过程在任意一个站点失败了,那整个事务都会回滚。

分布式事务能实时确保所有站点上的数据一致性。但它并不使用任何分布式锁。相反,它只在本地事务的参与者中使用本地锁。

应用对一个被复制的表执行同步更新,就是这种情况。Oracle首先会锁定本地的那一行,然后用After行触发器锁定对应的远程行。所有站点都提 交事务后,Oracle会释放锁。可以想象,如果多个站点要同时修改同一个资源,就会出现死锁。除此之外,同一个资源每次只能由一个实例站点进行修改,其 它站点则必须等待。

这种方案的优点是避开了分布式锁,具备高度的数据一致性,实现简单且易于管理。

这么做的缺点则是,本地和远程短暂的锁定可能会带来死锁问题,还有比较差的写入性能,而且需要高可用性和高速的网络,因为分布式事务需要复制同步性和两阶段提交(2PC)。

高并发情况下死锁会是很严重的问题。发生死锁的时候,Oracle会回滚非法的那个事务,保持另一个。回滚的事务会给前端应用返回一个错误码。

由于第一节提到的原因,这个方案只适用于“DATS改”。步骤三必须等待步骤二释放本地和远程的锁。步骤三拿到锁之后,会看到那张票已在步骤二售出。

3.使用本地锁和本地事务的同步复制

TimesTen的单向Active Standby Pair配置只使用了所谓的“return twosafe复制”。它支持主站点(活动站点)和订阅站点(备用站点)之间完全同步的复制。

TimesTen不涉及分布式事务或分布式锁。只使用本地事务和本地锁。具体来说,主站点的事务提交之前,会先提交订阅站点的本地事务。如果订阅站点不能提交,主站点也不会提交。

任何时候都只能更新活动站点,这大大简化了数据更新的复杂度(否则的话,使用本地锁和本地事务都还不够),也确保了在活动站点失效的情况下,能快速失效转移到备用站点上。

这个方案的优缺点和第二节那个方案的优缺点类似。

不过它的性能要更好一些,因为它规避了分布式事务所需的两阶段提交。由于只允许活动站点进行更新,这个方案也消除了死锁问题。

虽然备用站点看起来是一种功能浪费,但你可以把备用站点和另一个活动站点放在一起,如图1所示(尤其是活动站点和相搭配的备用站点有着不同的数据)。

这个方案的数据一致性并不是很高,因为主站点若是提交失败,即便订阅站点提交成功了,也会导致不一致性(根本原因是这个方案没有使用分布式事务。但你也应该知道,两阶段提交的第二次提交或回滚阶段要是失败了,也会导致暂时的数据不一致)。

TimesTen在这个地方的做法,延续了他们在异步日志记录、使用后写策略的数据缓存等方面偏重高性能的配置思路。Gigaspaces IMDB采用了一种非常类似的拓扑结构,叫做主-备份复制。唯一的区别在于,Gigaspaces IMDB使用了分布式事务,而不仅仅是本地事务。所以和TimesTen比起来,Gigaspaces IMDB有更高的数据一致性。

使用Gigaspaces IMDB的另一个好处是,Gigaspaces IMDB的失效转移对最终用户来说是透明的,而TimesTen的用户仍然需要求助于第三方或定制的集群管理软件。

由于第一节提到的原因,这个方案只能应用于“DATS改”。位于纽约的两个站点,其一是活动站点,另一个则是备用站点要连接到活动站点上更新数据。活动站点上的本地锁会防止超卖的情况发生。

和前面两个同步方案相比,强烈建议使用这个方案和图1所示的数据分区,原因有:

  • 这个方案大大简化了数据更新的复杂性,同时还提供了高可用性;
  • 尽管前两个同步方案允许在任何地方更新数据,但更新同一个资源意味着需要网络上的锁协调和分布式事务。可伸缩的更新通常通过数据分区来实现;
  • 虽然前两个同步方案允许分布式和可伸缩的读取操作,但你仍然可以对分区进行微调,允许更多的并发读取。

图1:Gigaspaces IMDB中的主-备份分区

4.随处更新的异步复制

Oracle多主复制的另一种数据一致性协议是异步复制,异步复制允许用户在任何参与站点更新数据。这个方案也用在Oracle的可更新物化视图复制和TimesTen双向的主-订阅者复制中,处理一般的分布式工作负载。

使用这个方案,一个站点上的数据变化会在本地提交,并存储在队列中,以便传递到其他站点。队列中的变化会在一个独立事务里分批传递,所以它不需要使用分布式锁或分布式事务。相反,它只在相应的本地事务中使用所需的本地锁。

这个方案具备良好的读写性能、易于实现、适用于低速的局域网和广域网,适用于网络断开的更新。特别是广域网部署能让地理分散的数据中心的做到真正灾难恢复。

缺点则是数据一致性取决于数据刷新的频率,比较有限,而且可能会有数据变更冲突。

由于不涉及分布式锁或分布式事务,如果不同站点发起的两个事务差不多同时去更新同一行内容,就会出现复制冲突。(当队列里的更改传播到另一个站点的时候,另一个站点上的数据变更会有两个版本。在这种情况下,应用需要决定应该用哪一个。)

必须提供解决冲突的方法来处理数据的不一致性。Oracle和TimesTen都预置了一个“最新时间戳”的解决方法,以时间戳最新的修改为准。Oracle还允许你根据业务需求定制解决方法。

要是DATS不允许出现超卖情况,这个方案就不适用于DATS,因为纽约站点和洛杉矶站点的变更可以在两个不同的事务中单独提交,这会导致两名顾客购买同一张票。

如果允许偶尔出现超卖情况,纽约站点和洛杉矶站点可以利用三小时的时差在不同时间出售机票。要真的出现复制冲突,应该根据前端应用采取的措施把相关信息记录到数据库中(现实里的预订系统并不会采用这种方案)。

5.只更新主站点的异步复制

Oracle的只读物化视图复制、TimesTen的单向主-订阅者复制、Gigaspaces IMDB的主-本地复制都使用了这种方案。

笼统地说,当你使用乐观锁创建多个数据库会话的时候,就等于用了这个方案。首先在一个会话里进行查询,返回的实际上是数据库主数据的副本。接着当你要保存所作的更改,就把它们持久化到后端的数据库中。

由于只在主站点进行变更,所以分布式锁和分布式事务根本用不上。这个方案的利弊和第四节介绍的方案类似。不过鉴于只允许在主站点进行更新,这就消除了臭名昭著的复制冲突,在异步复制环境中,这个设计在大部分情况下都是非常完善的。

我们要是在原始DATS设计里采用这个方案,并假设纽约站点或有第三个站点充当主站点的话,如果洛杉矶首先获得了主站点的本地锁,纽约站点就必须等待。主站点的本地锁会防止超卖的情况发生。

和第三节结尾处讨论的内容类似,推荐采用本方案时同时采用数据分区。DATS可以通过分区得到增强,例如让纽约负责东海岸的航班、洛杉矶负责西海岸的航班。

使用图2所示的Gigaspaces IMDB主-本地拓扑结构能让事情变得更加简单,因为这种拓扑能自动把本地缓存更新到主站点,主站点则会把同样的更新再传播到其他本地缓存里。Gigaspaces IMDB也支持版本化的乐观锁。

不论你使用Oracle的只读物化视图复制,还是TimesTen的单向主-订阅者复制,你都要自己处理这些问题。

图2:Gigaspaces的主-本地拓扑,图1的内容可以充当主站点

6.结论

数据复制大致可分为同步和异步。同步复制能确保高度的数据一致性,但需要昂贵的高可用性和高速网络。同步复制通常用来保护关键任务的数据,比如金融业的数据。

异步复制提供了更好的写入伸缩性,但会降低数据一致性的程度。通常用异步复制均衡写入操作、提供灾难恢复。

每种复制类别都有好几种方案,提供不同的并发控制。即便合适的方案取决于特定的业务需求,我们还是建议使用第三节和第五节讨论的方案。

最后,读者朋友应该注意两点内容:一是还有一些有趣的复制方案这里并没有提及。比如用TimesTen的“return receipt复制”和MySQL 5.5实现的“半同步复制”,还有Gigaspaces数据后写功能对同异步复制的结合采用。

另一个需要注意的是NoSQL目前的发展趋势。由于大部分NoSQL产品都自夸有可伸缩的能力,而且都假设失败必然发生,所以他们依靠数据复制来保证读写操作的负载均衡和高可用性。本文只会提到三个比较典型的NoSQL实现。

CouchDB构建在Erlang OTP平台上,借助双向的异步增量复制,CouchDB允许进行分布式、甚至是连接断开的文档更新。

Cassandra允许跨数据中心的复制,也提供了不同程度的数据一致性。

最后,Gigaspaces作为IMDB运行,依靠复制实现高可用性和后写功能,降低了传统关系数据库的重要性。除了原有的键值映射接口,最新的8.0版本还支持一种新的文档接口。

原文地址:http://www.infoq.com/cn/minibooks/architect-july-10-2011

分享到:
评论

相关推荐

    分布式事务的并发控制

    总的来说,分布式事务的并发控制需要解决分布式系统中的诸多问题,包括但不限于事务一致性、系统可用性、系统响应时间、以及数据一致性等。要实现有效的并发控制,必须采用恰当的算法和协议,并对可能出现的异常情况...

    论文研究-虚拟样机协同设计并发控制策略研究.pdf

    针对虚拟样机协同设计中数据量大、事务长、多层嵌套的问题 ,提出了一种基于事务语义的并发控制策略,阐述了并发控制机制中事务结构、事务提交、锁机制和冲突协调等关键性问题。根据数据要求生成复制事务,事务发生改变...

    协同CAD系统图档数据库并发控制研究.pdf

    在传统的CAD系统中,图档事务并发控制面临一系列问题,包括数据一致性不高、文件复制量大以及中间版本难以维护。这些问题严重影响了设计的效率和协作的流畅性。 2. 对象导向的存储结构 为了解决上述问题,研究者...

    Oracle Streams 11g数据复制

    ### Oracle Streams 11g数据复制详解 #### 一、Oracle Streams概述 Oracle Streams 是一个高级的数据集成解决方案,它能够捕获并应用数据库中的变化,从而实现数据在多个Oracle数据库之间的复制与同步。这一功能...

    服务端并发的网络复制命令scp

    【服务端并发的网络复制命令scp】 在Linux操作系统中,`scp`(Secure Copy)是一个强大的命令行工具,用于在本地主机与远程主机之间安全地传输文件。它基于SSH(Secure Shell)协议,确保数据传输过程中的安全性。`...

    SQL Server 2005的并发控制.pdf

    在探讨SQL Server 2005的并发控制机制时,我们需要了解的几个核心概念包括封锁类型、封锁粒度、锁间相容性、自动...总之,理解并合理应用SQL Server 2005的并发控制机制是保证数据库系统高性能和数据一致性的重要因素。

    JAVA将一个数据中数据定时自动复制(抽取)到另一个数据库

    5. **数据复制**:获取到数据后,你需要将它们插入到目标数据库。同样,使用`PreparedStatement`可以执行INSERT语句。注意处理可能出现的并发问题,比如确保数据的一致性和避免重复插入。 6. **异常处理和日志记录*...

    Lec15-并发控制理论1

    在DBMS(数据库管理系统)中,并发控制和数据库恢复是两个关键的组件,它们跨越多个层级以确保数据的一致性和可靠性。并发控制的主要目标是防止数据竞争,即多个事务同时访问并修改同一数据时可能导致的不一致性。在...

    cpp-Comdb2基于乐观并发控制技术的群集RDBMS

    3. **高效的数据复制**:Comdb2支持多种复制模式,包括异步复制和半同步复制,确保数据在集群中的快速传播。 4. **灵活的数据模型**:Comdb2支持SQL查询,并提供了多种数据类型,包括字符串、整数、浮点数等,同时...

    高并发下如何避免产生重复数据?.doc

    这使得基础系统的复制接口被多次调用,尤其是在RocketMQ的多线程并发消费机制下,相同的请求参数可能被多个线程并行处理,导致并发插入时的重复数据问题。尽管在代码中添加了判断是否存在相同数据的逻辑,但由于并发...

    高并发解决方案

    8. **无锁编程与并发控制**:在多线程环境下,使用无锁数据结构(如Atomic类)和适当的并发控制策略(如乐观锁、悲观锁)可以降低锁竞争,提高并发性能。 9. **HTTP/2与QUIC协议**:这些协议支持多路复用,允许多个...

    redis百万并发访问数据库测试

    7. **Redis的并发控制**:虽然Redis是单线程模型,但可以通过事务(Transaction)、Lua脚本等机制实现一定程度的并发控制。比如,使用Lua脚本可以在服务器端原子性地执行一系列操作,避免了客户端的多次网络通信。 ...

    大数据量高并发的数据库优化总结

    2. **考虑并发控制**:在高并发场景下,数据库可能会遇到各种并发问题,如数据竞争、死锁等。合理设计可以有效避免这些问题的发生。例如,在日期边界条件下的数据更新操作,可以通过加锁机制或使用乐观锁来确保数据...

    SqlServer并发调优

    综上所述,SQL Server并发调优涉及到多个层面的技术细节,包括但不限于锁的合理使用、事务隔离级别的正确选择、数据版本控制的应用以及锁策略的动态调整。理解和掌握这些核心概念和技术,对于优化数据库性能、提升...

    并发容器的原理,7大并发容器详解、及使用场景

    并行容器是 Java 多线程编程中不可或缺的一部分,它们...开发者应根据业务场景选择合适的容器,避免全局锁带来的性能损失,充分利用并发容器提供的高级并发控制机制,确保在多线程环境下数据的一致性和程序的高效运行。

    高速(高并发)数据库访问 Delphi 类

    综上所述,"高速(高并发)数据库访问 Delphi 类"的实现涉及到数据库连接管理、并发控制、数据同步、事务处理、查询优化等多个方面。"UDBSyncMng.pas"作为关键组件,很可能是实现这些功能的核心代码。通过深入理解和...

    大型网站应用之海量数据和高并发解决方案总结.docx

    ### 大型网站应用之海量数据和高并发解决方案 #### 一、网站应用背景 随着互联网的迅猛发展,用户数量激增,对于网站而言,如何高效处理海量数据及应对高并发访问成为了关键技术挑战之一。在初期阶段,一个简单的...

    mysql并发控制限流设计

    ### MySQL并发控制与限流设计 #### 一、MySQL性能概览 MySQL作为一款广泛使用的开源关系型数据库管理系统,在各种应用场景下展现出了优秀的性能特点。然而,在高并发场景下,MySQL也面临着诸多挑战。为了更好地...

    内存映射文件实现大数据量快速存储

    由于内存映射文件将文件内容映射到进程的虚拟内存,程序可以直接使用指针进行访问,避免了传统I/O的读写过程中的数据复制和上下文切换,大大减少了数据传输的时间。此外,现代操作系统采用的页缓存机制也使得内存...

    单机模拟ORACLE分布式数据库数据复制环境的实现.pdf

    分布式数据库的关键特性包括数据分片、复制和并发控制。数据分片是指将一个关系数据表分割成多个片段,分别存储在不同的节点上,以提高查询性能和负载均衡。数据复制则是指在多个节点之间保持数据的一致性,确保所有...

Global site tag (gtag.js) - Google Analytics