摘要
谈及一些分布式系统的理论和思想,包括CAP、BASE、NWR等。并简单分析一些主流数据库分布式方案的利弊,以便我们在开发时更深入全面地进行思考、选择和设计。
正文
在讨论常见架构前,先简单了解下CAP理论:
CAP 是 Consistency、Availablity 和 Partition-tolerance 的缩写。分别是指:
- 一致性(Consistency):每次读操作都能保证返回的是最新数据;
- 可用性(Availablity):任何一个没有发生故障的节点,会在合理的时间内返回一个正常的结果;
- 分区容忍性(Partition-tolerance):当节点间出现网络分区,照样可以提供服务。
CAP理论指出:CAP三者只能取其二,不可兼得。其实这一点很好理解:
- 首先,单机系统都只能保证CP。
- 有两个或以上节点时,当网络分区发生时,集群中两个节点不能互相通信。此时如果保证数据的一致性C,那么必然会有一个节点被标记为不可用的状态,违反了可用性A的要求,只能保证CP。
- 反之,如果保证可用性A,即两个节点可以继续各自处理请求,那么由于网络不通不能同步数据,必然又会导致数据的不一致,只能保证AP。
一、单实例
单机系统很显然,只能保证CP,牺牲了可用性A。单机版的MySQL,Redis,MongoDB等数据库都是这种模式。
实际中,我们需要一套可用性高的系统,即使部分机器挂掉之后仍然可以继续提供服务。
二、多副本
相比于单实例,这里多了一个节点去备份数据。
对于读操作来说,因为可以访问两个节点中的任意一个,所以可用性提升。
对于写操作来说,根据更新策略分为三种情况:
- 同步更新:即写操作需要等待两个节点都更新成功才返回。这样的话如果一旦发生网络分区故障,写操作便不可用,牺牲了A。
- 异步更新:即写操作直接返回,不需要等待节点更新成功,节点异步地去更新数据。
这种方式,牺牲了C来保证A。即无法保证数据是否更新成功,还有可能会由于网络故障等原因,导致数据不一致。 -
折衷:更新部分节点成功后便返回。
这里,先介绍下类Dynamo系统用于控制分布式存储系统中的一致性级别的策略——NWR:- N:同一份数据的副本个数
- W:写操作需要确保成功的副本个数
- R:读操作需要读取的副本个数
当W+R>N时,由于读写操作覆盖到的副本集肯定会有交集,读操作只要比较副本集数据的修改时间或者版本号即可选出最新的,所以系统是强一致性的;
反之,当W+R<=N时是弱一致性的。如:(N,W,R)=(1,1,1)为单机系统,是强一致性的;(N,W,R)=(2,1,1)为常见的master-slave模式,是弱一致性的。
举例:
-
如像Cassandra中的折衷型方案
QUORUM
,只要超过半数的节点更新成功便返回,读取时返回多数副本的一致的值。然后,对于不一致的副本,可以通过read repair的方式解决。read repair
:读取某条数据时,查询所有副本中的这条数据,比较数据与大多数副本的最新数据是否一致,若否,则进行一致性修复。其中,W+R>N,故而是强一致性的。
-
又如Redis的master-slave模式,更新成功一个节点即返回,其他节点异步地去备份数据。这种方式只保证了最终一致性。
最终一致性
:相比于数据时刻保持一致的强一致性,最终一致性允许某段时间内数据不一致。但是随着时间的增长,数据最终会到达一致的状态。其中,W+R<N,所以只能保证最终一致性。
此外,N越大,数据可靠性越好。但是由于W或R越大,写或读开销越大,性能越差,所以一般需要综合考虑一致性、可用性和读写性能,设置 W、R 都为 N/2 + 1。
其实,折衷方案和异步更新的方式从本质上来说是一样的,都是损失一定的C来换取A的提高。而且,会产生‘脑裂’的问题——即网络分区时节点各自处理请求,无法同步数据,当网络恢复时,导致不一致。
一般的,数据库都会提供分区恢复的解决方案:
- 从源头解决:如设定节点通信的超时时间,超时后‘少数派’节点不提供服务。这样便不会出现数据不一致的情况,不过可用性降低。
- 从恢复解决:如在通信恢复时,对不同节点的数据进行比较、合并,这样可用性得到了保证。但是在恢复完成之前,数据是不一致的,而且可能出现数据冲突。
光这样还不够,当数据量较大时,由于一台机器的资源有限并不能容纳所有的数据,我们会想把数据分到好几台机器上存储。
三、分片
相比于单实例,这里多了一个节点去分割数据。
由于所有数据都只有一份,一致性得以保证;节点间不需要通信,分区容忍性也有。
然而,当任意一个节点挂掉,丢失了一部分的数据,系统可用性得不到保证。
综上,这和单机版的方案一样,都只能保证CP。
那么,有那些好处呢?
- 某个节点挂掉只会影响部分服务,即服务降级;
- 由于分片了数据,可以均衡负载;
- 数据量增大/减小后可以相应地扩容/缩容。
大多数的数据库服务都提供了分片的功能。如Redis的slots,Cassandra的partitions,MongoDB的shards等。
基于分片解决了数据量大的问题,可是我们还是希望我们的系统是高可用的,那么,如何牺牲一定的一致性去保证可用性呢?
四、集群
可以看到,上面这种方式综合了前两种方式。同上分析,采用不同的数据同步策略,系统的CAP保证各有不同。不过,一般数据库系统都会提供可选的配置,我们根据不同的场景选择不同的策略以实现不同的特性。
其实,对于大多数的非金融类互联网公司,要求并非强一致性,而是可用性和最终一致性的保证。这也是NoSQL流行于互联网应用的一大原因,相比于强一致性系统的ACID原则,它更加倾向于BASE:
-
Basically Available
: 基本可用,即允许分区失败,出了问题仅服务降级; -
Soft-state
: 软状态,即允许异步; -
Eventual Consistency
: 最终一致性,允许数据最终一致,而不是时刻一致。
五、总结
基本上,上面讨论的几种方式已经涵盖了大多数的分布式存储系统了。我们可以看到,这些个方案总是需要通过牺牲一部分去换取另一部分,总没法达到100%的CAP。
选择哪种方案,依据就是在特定场景下,究竟哪些特性是更加重要的了。
https://my.oschina.net/MaxLeap/blog/737574
相关推荐
分布式系统是计算机科学中的一个重要领域,它涉及到多个独立计算节点通过网络进行协同工作,以解决单个计算机无法处理的大规模问题。在电子科技大学的2020年期末考试中,这个主题显然成为了考察的重点。这份回忆版...
分布式系统实验报告 分布式系统实验报告.pdf 文件是一个详细的实验报告,涵盖了分布式系统的多个方面,包括数据包 socket 应用、流式 socket 应用、客户/服务器应用开发、虚拟机的使用与 Linux 系统的安装等。下面...
同时,分布式系统实验报告也强调学生的分析和思考能力,鼓励学生对实验结果进行分析和总结,并回答思考题。 分布式系统实验报告是计算机科学和技术专业的学生不可或缺的一部分,它可以帮助学生深入理解分布式系统的...
本书主要是讲如何构建一个分布式系统,构建一个分布式系统时主要要思考那些问题。至于作者推荐自己的包工头-工人模式分布式系统,是不是当前最好的业务模式,这可以见仁见智。但是作者这种深入浅出,有条不紊的介绍...
1.1 大型分布式系统的特征 1.2 魔术总线故事 1.3 魔术总线故事给我们的启示 1.4 soa历史 1.5 五页幻灯讲完soa 第2章:soa 2.1 soa定义 2.2 soa驱动因素 2.3 soa概念 2.4 soa要素 2.5 ...
分布式系统由多个分散的、自治的计算单元组成,这些计算单元通过网络协同工作,实现复杂的功能。分布式系统的主要特点包括:可扩展性、高可用性、容错性、灵活的计算能力和良好的用户体验等。在处理大规模数据和高...
为了应对这些挑战,本文提出了一个基于分布式系统架构的电信账务系统设计方案。 首先,我们来分析一下传统电信账务系统存在的问题。传统的电信运营商账务系统通常依赖于Unix系统和Oracle数据库,这样的系统虽然稳定...
### 分布式系统课程实验报告知识点总结 #### 实验背景与目标 - **实验名称**:《分布式系统》课程实验报告之一 - **实验重点**:多核程序设计实验,特别是Intel C++ Compiler(icl)编译器环境的配置与性能分析。 ...
为了迎头赶上,我们需要对分布式能源系统的发展进行深入思考和策略规划,包括加强技术研发、优化政策环境、完善基础设施建设,以及推动市场机制的创新。只有这样,才能充分发挥分布式能源的优势,推动我国能源结构的...
【分布式系统中的面向对象技术】是北京邮电大学邹华教授在分布式计算课程第四章讲解的重点内容。在分布式计算环境中,面向对象技术扮演着至关重要的角色。传统的面向对象技术主要包含封装、继承和多态这三大特性,它...
1.1 大型分布式系统的特征 1.2 魔术总线故事 1.3 魔术总线故事给我们的启示 1.4 soa历史 1.5 五页幻灯讲完soa 第2章:soa 2.1 soa定义 2.2 soa驱动因素 2.3 soa概念 2.4 soa要素 2.5 ...
分布式系统架构在银行综合业务系统设计中的应用成为了解决传统集中式架构问题的重要途径。随着业务的快速发展和市场需求的多样化,传统银行系统的不足逐渐显现,如性能瓶颈、系统复杂性、数据处理效率低下等问题。...
这些笔记可以帮助学习者巩固课堂所学,尤其是在处理分布式系统中的并发控制、故障恢复、一致性算法等问题时,提供了实用的思考框架和解决问题的步骤。 在实验过程中,学生将有机会接触到诸如Gossip协议、Paxos或...
分布式系统在现代信息技术环境中起着至关重要的作用,其高可用性设计是确保服务连续性和可靠性的重要环节。在《高可用分布式系统的设计之道》中,主要探讨了如何应对高可用问题,以及采用何种工具和方法来设计和验证...