`
san_yun
  • 浏览: 2662511 次
  • 来自: 杭州
文章分类
社区版块
存档分类
最新评论

分布式事务处理学习总结

 
阅读更多

其实大多数互联网应用对事务性要求都不高,更多的挑战在于更好的性能和更高的可扩展性,只有少数涉及到账户和交易的系统才对事务和一致性有着强烈的需求。

事务机制: ACID原则

当我们需要对2个及以上的数据实体进行写操作,这些数据存在依赖关系,需要保证同时成功或者失败的时候,我们就需要 原子性 操作。例如总账户和交易明细,他们是存在依赖关系的,如果更新了总账户,没有产生交易明细,就会出现不一致的状态。
仅仅原子性还不能保证数据的一致性,原子性只能保证一起写成功/失败。例如在一个原子性更新交易明细成功之后,更新总账户之前,另一个写操作更新了总账户,就会导致总账户和交易明细的不一致,因此事务机制提供了 隔离性 来解决这个问题,如果隔离性存在问题,就会导致“脏读” 和 “幻读”。
数据库采用锁机制实现隔离性。在事务开始时,数据库会对其加锁,直到整个事务完成之后才会释放锁,在隔离期间其他事务进行排队等待,退化成串行操作,数据库的TPS明显下降。
在设计分布式事务时,为了保证性能,事务的执行时间越短越好,资源锁定时间越短越好,尽量使用无锁实现,牺牲 强一致性 ,保证 高可用性 。

基石: CAP原则

CAP原则对于分布式系统的意义就像牛顿三大定律对于经典物理学。

  • Consistency:一致性要求读操作和读操作即时完成,不存在重叠,如果一个写操作成功,后续所有的读都必须能对到这个新的数据;如果写操作失败,后续的所有的读都不能返回这个新值。在实际的业务中,往往只要求 最终一致性,当写入一个新值后,有可能读不出来,但在某个时间窗口后保证最终能够读出来。
  • Availability:每一个非故障节点对于灭一个请求都要做出响应。
  • Partition tolerance:以实际效果而言,分区相当于对通信的时限要求。系统如果不能在时限内达成数据一致性,就意味着发生了分区的情况,必须就当前操作在C和A之间做出选择。(如果网络中不存在分区,客户端和服务端在同一环境中,通过事务可以保证一致性和可用性,满足CA,例如单点数据库)
  • 由于CAP三者不能同时满足的特点,在分布式环境中系统间存在通信的特点,分区是必然存在的,因此往往只能在可用性和一致性间做权衡,而在实际情况中,对可用性的需求高于强一致性的需求,具体的实现也是向着AP发展,通过后续补偿机制满足最终一致性。

分布式事务实现:AP向

基本方向就是保证最终一致性,实现高可用性。使用 状态机 进行业务流程状态控制,先写入非基本数据,最后写入基本数据,如果一切成功,万事大吉;如果基本数据写失败,通过 补偿机制 实现非基本数据回滚。另外实现一个 检测系统定期扫描事务写操作结果,应对网络中断,系统宕机等节点故障的情况。

可以设想一个最简单的分布式事务场景,对于跨银行的转账操作,该操作涉及到调用两个异地的Service服务,一个是本地提供的取款服务,一个是目标银行提供的存款服务,该两个服务本身无状态且独立,构成一个完整的事务。对于事务的处理初步分析:

事务补偿机制 
事务补偿即在事务链中的任何一个正向事务操作,都必须存在一个完全符合回滚规则的可逆事务。如果是一个完整的事务链,则必须事务链中的每一个业务服务或操作都有对应的可逆服务。对于Service服务本身无状态,也不容易实现前面讨论过的通过DTC或XA机制实现的跨应用和资源的事务管理,建立跨资源的事务上下文。因此也较难以实现真正的预提交和正式提交的分离。

在这种情况下以上面例子来说,首先调用取款服务,完全调用成功并返回,数据已经持久化。然后调用异地的存款服务,如果也调用成功,则本身无任何问题。如果调用失败,则需要调用本地注册的逆向服务(本地存款服务),如果本地存款服务调用失败,则必须考虑重试,如果约定重试次数仍然不成功,则必须log到完整的不一致信息。也可以是将本地存款服务作为消息发送到消息中间件,由消息中间件接管后续操作。

在上面方式中可以看到需要手工编写大量的代码来处理以保证事务的完整性,我们可以考虑实现一个通用的事务管理器,实现事务链和事务上下文的管理。对于事务链上的任何一个服务正向和逆向操作均在事务管理和协同器上注册,由事务管理器接管所有的事务补偿和回滚操作。

基于消息的最终一致性 
在这里首先要回答的是我们需要时实时一致性还是最终一致性的问题,如果需要的是最终一致性,那么BASE策略中的基于消息的最终一致性是比较好的解决方案。这种方案真正实现了两个服务的真正解耦,解耦的关键就是异步消息和消息持久化机制。

还是以上面的例子来看。对于转账操作,原有的两个服务调用变化为第一步调用本地的取款服务,第二步发送异地取款的异步消息到消息中间件。如果第二步在本地,则保证事务的完整性基本无任何问题,即本身就是本地事务的管理机制。只要两个操作都成功即可以返回客户成功。

由于解耦,我们看到客户得到成功返回的时候,如果是上面一种情况则异地卡马上就能查询账户存款增加。而第二种情况则不一定,因为本身是一种异步处理机制。消息中间件得到消息后会去对消息解析,然后调用异地银行提供的存款服务进行存款,如果服务调用失败则进行重试。

异地银行存款操作不应该长久地出现异常而无法使用,因此一旦发现异常我们可以迅速的解决,消息中间件中异常服务自然会进行重试以保证事务的最终一致性。这种方式假设问题一定可以解决,在不到万不得已的情况下本地的取款服务一般不进行可逆操作。

在本地取款到异地存款两个服务调用之间,会存在一个真空期,这段时间相关现金不在任何一个账户,而只是在一个事务的中间状态,但是客户并不关心这个,只要在约定的时间保证事务最终的一致性即可。

关于等幂操作的问题 
重复调用多次产生的业务结果与调用一次产生的业务结果相同,简单点讲所有提供的业务服务,不管是正向还是逆向的业务服务,都必须要支持重试。因为服务调用失败这种异常必须考虑到,不能因为服务的多次调用而导致业务数据的累计增加或减少。

关于是否可以补偿的问题 
在这里我们谈的是多个跨系统的业务服务组合成一个分布式事务,因此在对事务进行补偿的时候必须要考虑客户需要的是否一定是最终一致性。客户对中间阶段出现的不一致的承受度是如何的。

在上面的例子来看,如果采用事务补偿机制,基本可以是做到准实时的补偿,不会有太大的影响。而如果采用基于消息的最终一致性方式,则可能整个周期比较长,需要较长的时间才能给得到最终的一致性。比如周六转款,客户可能下周一才得到通知转账不成功而进行了回退,那么就必须要考虑客户是否能给忍受。

其次对于前面讨论,如果真正需要的是实时的一致性,那么即使采用事务补偿机制,也无法达到实时的一致性。即很可能在两个业务服务调用中间,客户前台业务操作对持久化的数据进行了其它额外的操作。在这种模式下,我们不得不考虑需要在数据库表增加业务状态锁的问题,即整个事务没有完整提交并成功前,第一个业务服务调用虽然持久化在数据库,但是仍然是一个中间状态,需要通过业务锁来标记,控制相关的业务操作和行为。但是在这种模式下无疑增加了整个分布式业务系统的复杂度。

参考资料:
http://wenku.baidu.com/view/be946bec0975f46527d3e104.html
http://coolshell.cn/articles/10910.html
http://zh.wikipedia.org/wiki/CAP%E5%AE%9A%E7%90%86

分享到:
评论
1 楼 呵呵6666 2016-10-17  
不错学习了!分享一个参考内容以电商购物支付流程中,在各大参与者系统中可能会遇到分布式事务问题的场景及对应的解决方案:http://www.roncoo.com/course/view/7ae3d7eddc4742f78b0548aa8bd9ccdb

相关推荐

    大规模SOA系统中的分布式事务处理_程立

    总结来说,大规模SOA系统中的分布式事务处理是通过一系列技术和策略保证跨服务操作的一致性。程立的分享可能涵盖了从基础理论到实际应用的各种解决方案,对于理解和实践分布式事务具有很高的参考价值。通过深入学习...

    若依框架分布式事务配置和项目启动手册

    若依框架作为一款广受欢迎的Java开发框架,提供了丰富的功能支持,包括分布式事务处理。本文将深入探讨若依框架在分布式事务配置以及项目启动方面的知识,帮助开发者更好地理解和应用。 1. **若依框架简介** 若依...

    分布式事务视频教程

    ### 分布式事务基础知识与实践 #### 一、分布式事务概念及重要性 在现代软件架构中,随着业务复杂度的提升...此外,随着技术的发展,未来可能会有更多高效、可靠的分布式事务处理方式出现,值得我们持续关注和学习。

    分布式事务实践 解决数据一致性

    介绍分布式事务的定义、原则和实现原则,介绍使用Spring框架实现分布式事务的几种方式,包括使用JTA、Spring事务同步、链式事务等,并通过实战介绍其实现。除此以外还介绍了一些分布式事务相关的技术,如幂等性、...

    基于mysql,SpringBoot 分布式事务例子

    总结来说,学习SpringBoot的分布式事务处理需要理解分布式事务的基本概念、Spring的事务管理机制以及如何在MySQL环境中配置和使用。"spring-boot-example"项目提供了一个实战平台,让你能亲手实践这些理论知识,加深...

    lcn分布式事务搭建.rar

    分布式事务在现代微服务架构中扮演着至关重要的角色,它确保了在多个服务间的数据一致性。...通过学习和实践这个案例,开发者可以更好地理解和掌握如何在实际项目中处理分布式事务,提升微服务架构下的数据一致性。

    分布式事务seata开发指南,demo说明

    Seata的主要目标是为微服务提供简单、高效且可扩展的分布式事务处理能力。它支持AT(Automatic Transaction)、TCC(Try-Confirm-Cancel)、SAGA(Saga Transactions)和XA这四种分布式事务模式,满足不同业务场景的...

    JTA 分布式事务 XAPool 1.5和1.6的所有jar包,源码包

    总结来说,XAPool是JTA分布式事务处理的重要组件,提供了一种高效的数据库连接池解决方案,对于构建大规模、高并发的Java应用尤其有价值。这个资源包包含了XAPool的两个主要版本,以及对应的源码,对于学习和使用...

    在分布式事务中实现基于Oracle PLSQL UL LOCK的悲观离线锁

    总结来说,实现基于Oracle PL/SQL的Ultra Lock悲观离线锁是为了解决分布式事务中的并发控制问题。通过精细的锁策略,我们可以确保数据的一致性,但同时也需要关注其对并发性能的影响,并采取适当的措施来防止死锁。...

    高级Java人才培训专家-分布式事务

    ### 高级Java人才培训专家-分布式事务 #### 一、分布式事务概述 在现代软件开发中,随着应用系统的不断扩展和技术架构的日益复杂,分布式系统成为了解决大规模并发访问和海量数据处理的有效手段之一。分布式系统的...

    分布式事务管理与恢复PPT学习教案.pptx

    总结来说,分布式事务管理与恢复涉及如何在多节点、并发环境下保证数据一致性,实现事务的原子性、一致性、持久性和独立性,以及如何处理事务执行中的故障和并发冲突。这部分知识对于构建可靠、高效的分布式数据库...

    tcc分布式事务框架-hmily #资源达人分享计划#

    总结来说,这个分享的资源是学习和实践TCC分布式事务的一个良好起点,它结合了Spring Boot的便捷性和Feign的通信能力,让开发者能够快速理解和运用TCC模式。通过对hmily框架的理解和实践,开发者可以更好地应对...

    学习总结 包括Java JVM MySQL NoSQL UML 缓存 消息 分布式事务-StudySummary.zip

    分布式事务处理的ACID(原子性、一致性、隔离性、持久性)原则和CAP(一致性、可用性、分区容错性)定理是核心理论。理解2PC(两阶段提交)、TCC(尝试、确认、补偿)等分布式事务解决方案,并根据实际场景选择合适...

    基于SpringBoot+Zookeeper+Seata实现Dubbo分布式事务管理系统-源码

    Seata包含了AT(Automatic Transaction)模式、TCC(Try-Confirm-Cancel)模式、Saga模式以及二阶段提交模式等多种分布式事务处理方式。在这个系统中,Seata作为核心组件,用于管理和协调跨服务的分布式事务,确保在...

    学习总结 包括Java JVM MySQL NoSQL UML 缓存 消息 分布式事务 SOA 微服务 敏捷 架构设.zip

    这个名为"学习总结 包括Java JVM MySQL NoSQL UML 缓存 消息 分布式事务 SOA 微服务 敏捷 架构设.zip"的压缩包文件,显然包含了一系列IT领域的核心主题,这些主题都是现代软件开发和系统设计的基石。以下是对每个...

    分布式事务tcc案例(不需要自己搭建springcloud,数据库表,下载就可以跑,然后研究tcc二段提交)

    总结来说,TCC模式是一种有效的处理分布式事务的策略,它将事务的处理责任分散到了各个服务中,降低了中心化的协调压力。Seata作为一个强大的分布式事务框架,提供了对TCC模式的良好支持。通过这个案例,你可以深入...

    资源前后端分离式分布式微服务架构项目媒资分布式事务讲义+源码+视频

    在分布式系统中,事务处理变得更加复杂。为了解决这一问题,需要深入理解分布式事务的概念及其解决方案。 - **理解什么是分布式事务**:分布式事务是指跨越多个节点上的数据库操作集合,这些操作要么全部成功,要么...

    从银行转账失败到分布式事务:总结与思考

    在上述例子中,作者通过个人经历——银行转账失败,引发了对分布式事务深入学习的兴趣。 【事务的定义】 在编程领域,事务是一个关键概念,它代表了一组操作,这些操作作为一个整体执行,以确保数据的一致性和完整...

    技能大赛分布式数据库多事务调控模型构建.pdf

    此外,分布式数据库还涉及分布式事务处理,即如何保证在多个节点间执行的事务能够正确、可靠地完成。 多事务调控模型构建是在分布式数据库中保证多事务协调和同步的重要组成部分。事务是指一组操作的集合,要么全部...

    一个通用的开源工具集,集Web、Restful服务、分布式服务、分布式数据库、分布式事务、大数据等.zip

    本文将深入探讨一个全面的开源工具集,它涵盖了Web开发、RESTful服务、分布式服务、分布式数据库、分布式事务、大数据处理、数据分析、云计算以及人工智能领域的深度学习、机器学习和算法等多个关键领域。...

Global site tag (gtag.js) - Google Analytics