在分布式算法领域,有个非常重要的算法叫Paxos, 它的重要性有多高呢,Google的Chubby [1]中提到
all working protocols for asynchronous consensus we have so far encountered have Paxos at their core.
关于Paxos算法的详述在维基百科中有更多介绍,中文版介绍的是choose value的规则[2],英文版介绍的是Paxos 3 phase commit的流程[3],中文版不是从英文版翻译而是独立写的,所以非常具有互补性。Paxos算法是由Leslie Lamport提出的,他在Paxos Made Simple[4]中写道
The Paxos algorithm, when presented in plain English, is very simple.
当你研究了很长一段时间Paxos算法还是有点迷糊的时候,看到上面这句话可能会有点沮丧。但是公认的它的算法还是比较繁琐的,尤其是要用程序员严谨的思维将所有细节理清的时候,你的脑袋里更是会充满了问号。Leslie Lamport也是用了长达9年的时间来完善这个算法的理论。
实际上对于一般的开发人员,我们并不需要了解Paxos所有细节及如何实现,只需要知道Paxos是一个分布式选举算法就够了。本文主要介绍一下Paxos常用的应用场合,或许有一天当你的系统增大到一定规模,你知道有这样一个技术,可以帮助你正确及优雅的解决技术架构上一些难题。
1. database replication, log replication等, 如bdb的数据复制就是使用paxos兼容的算法。Paxos最大的用途就是保持多个节点数据的一致性。
2. naming service, 如大型系统内部通常存在多个接口服务相互调用。
1) 通常的实现是将服务的ip/hostname写死在配置中,当service发生故障时候,通过手工更改配置文件或者修改DNS指向的方法来解决。缺点是可维护性差,内部的单元越多,故障率越大。
2) LVS双机冗余的方式,缺点是所有单元需要双倍的资源投入。
通过Paxos算法来管理所有的naming服务,则可保证high available分配可用的service给client。象ZooKeeper还提供watch功能,即watch的对象发生了改变会自动发notification, 这样所有的client就可以使用一致的,高可用的接口。
3.config配置管理
1) 通常手工修改配置文件的方法,这样容易出错,也需要人工干预才能生效,所以节点的状态无法同时达到一致。
2) 大规模的应用都会实现自己的配置服务,比如用http web服务来实现配置中心化。它的缺点是更新后所有client无法立即得知,各节点加载的顺序无法保证,造成系统中的配置不是同一状态。
4.membership用户角色/access control list, 比如在权限设置中,用户一旦设置某项权限比如由管理员变成普通身份,这时应在所有的服务器上所有远程CDN立即生效,否则就会导致不能接受的后果。
5. 号码分配。通常简单的解决方法是用数据库自增ID, 这导致数据库切分困难,或程序生成GUID, 这通常导致ID过长。更优雅的做法是利用paxos算法在多台replicas之间选择一个作为master, 通过master来分配号码。当master发生故障时,再用paxos选择另外一个master。
这里列举了一些常见的Paxos应用场合,对于类似上述的场合,如果用其它解决方案,一方面不能提供自动的高可用性方案,同时也远远没有Paxos实现简单及优雅。
Yahoo!开源的ZooKeeper [5]是一个开源的类Paxos实现。它的编程接口看起来很像一个可提供强一致性保证的分布式小文件系统。对上面所有的场合都可以适用。但可惜的是,ZooKeeper并不是遵循Paxos协议,而是基于自身设计并优化的一个2 phase commit的协议,因此它的理论[6]并未经过完全证明。但由于ZooKeeper在Yahoo!内部已经成功应用在HBase, Yahoo! Message Broker, Fetch Service of Yahoo! crawler等系统上,因此完全可以放心采用。
另外选择Paxos made live [7]中一段实现体会作为结尾。
* There are significant gaps between the description of the Paxos algorithm and the needs of a real-world system. In order to build a real-world system, an expert needs to use numerous ideas scattered in the literature and make several relatively small protocol extensions. The cumulative effort will be substantial and the final system will be based on an unproven protocol.
* 由于chubby填补了Paxos论文中未提及的一些细节,所以最终的实现系统不是一个理论上完全经过验证的系统* The fault-tolerance computing community has not developed the tools to make it easy to implement their algorithms.
* 分布式容错算法领域缺乏帮助算法实现的的配套工具, 比如编译领域尽管复杂,但是yacc, ANTLR等工具已经将这个领域的难度降到最低。* The fault-tolerance computing community has not paid enough attention to testing, a key ingredient for building fault-tolerant systems.
* 分布式容错算法领域缺乏测试手段
这里要补充一个背景,就是要证明分布式容错算法的正确性通常比实现算法还困难,Google没法证明Chubby是可靠的,Yahoo!也不敢保证它的ZooKeeper理论正确性。大部分系统都是靠在实践中运行很长一段时间才能谨慎的表示,目前系统已经基本没有发现大的问题了。
转载地址:http://timyang.net/distributed/paxos-scenarios/
相关推荐
- **应用场景**:在多个系统之间需要实时协调数据变更时,例如数据库复制、服务发现等场景下。 - **技术实现**:利用Paxos协议来确保所有参与者对数据的变更有一致的认识,从而实现实时处理数据变更。 #### 3. ...
Paxos算法是一种在异步分布式系统中实现共识...通过深入探讨Paxos议会与分布式系统设计中的相似性,Paxos算法的价值和应用范围得到了强调,同时,该文献也对Paxos算法在不同计算机科学领域的应用和研究发展进行了说明。
5. 应用场景和优势:Paxos算法及其变种在分布式计算环境中有广泛的应用,包括但不限于数据复制、分布式数据库、分布式文件系统等。其主要优势在于能够在不可靠的网络环境下提供强一致性,确保数据状态在各个节点间...
在Paxos算法中,为了保证系统的安全性(Safety),算法确保了只有一个值可以被选定,并且服务器永远不会认为某个值已被选定,除非它真的被选定了。另一方面,算法的活跃性(Liveness)要求,只要系统中有大多数服务器是...
首先,它简化了Paxos中的提案编号,使得在某些情况下可以省略部分步骤,从而减少了消息传递的数量。其次,它利用了一种被称为“单步提交”的策略,使得在没有冲突的情况下,提案可以直接被接受,减少了两阶段提交的...
通过详细的步骤说明和角色映射,我们可以更好地理解Paxos算法的核心原理及其在实际应用场景中的表现形式,如Zookeeper等。通过学习Paxos算法,开发者可以更好地设计和优化分布式系统,提高系统的稳定性和可用性。
Paxos算法是一种在分布式系统中解决一致性问题的经典协议,由Leslie Lamport提出。它的主要目标是在存在网络延迟、消息丢失或重复、节点故障等不可靠因素的情况下,确保一组分布式节点能够就一个值达成一致。在...
分布式一致性问题在大型分布式系统中至关重要,因为这关系到系统的稳定性和可靠性。PAXOS算法为解决一致性提供了理论基础,而ZooKeeper则将其转化为实用的工具,广泛应用于Hadoop、Kafka等分布式框架中。 在《从...
尽管 Paxos 算法解决了分布式一致性问题,但在实际应用中仍需考虑一些优化措施,比如减少网络通信次数、减少延迟等。这些优化措施可以帮助提高系统的性能和效率。 通过以上介绍可以看出,Paxos 算法及其变种为构建...
在分布式系统中,Paxos被广泛应用,如数据库复制、状态机复制等场景。 **Paxos基本概念** 1. **提案者(Proposer)**:发起提议的节点,负责提出需要达成一致的值。 2. **接受者(Acceptor)**:接收并处理提案的...
总结来看,文档的标题和描述中提到的“从paxos到zookeeper”表明了内容的涵盖范围:从理论上的Paxos算法原理,到实际应用中如何在Zookeeper这样的系统中实现分布式一致性。文档还强调了Paxos算法在实践中的直接应用...
在非拜占庭(non-Byzantine)故障的异步消息传递系统中,Paxos算法要求系统能够容忍进程的失败,并且即使在部分节点失败的情况下也能最终达成一致。在传统的一致性问题陈述中,每个进程提出一个值,并且选定的值必须...
尽管理论文献中已有大量关于Paxos的研究,但在实际工程应用中构建此类系统仍面临诸多非平凡的问题。 #### 引言 在计算机科学领域,通过复制技术实现硬件故障容忍性是众所周知的方法。一种常见的做法是利用一致性...
在IT行业中,Java语言因其平台无关性...总结来说,Java在大型分布式系统中的应用广泛且深入,从基础的编程模型到高级的框架工具,都能看到Java的身影。理解和掌握这些知识点,对于开发和维护高效的分布式系统至关重要。
在Paxos中,存在提议者、接受者和学习者三种角色,它们相互协作,以实现最终的一致性。Paxos的复杂性和挑战在于如何在节点之间有效地通信并处理各种可能的网络延迟和故障情况。 接着,我们来看看Zookeeper,这是一...
在实际应用中,单个Paxos实例可能无法满足所有需求,因此通常会使用多轮Paxos或者基于Paxos的变种,如Chubby锁服务采用的Multi-Paxos,它通过减少通信开销和简化流程,进一步提高了系统的性能和效率。 总之,...
**Paxos算法详解** Paxos算法是分布式系统中的...然而,理解和应用Paxos需要深入理解分布式系统原理和挑战,以及如何在实际场景中权衡效率和可用性。通过不断的研究和实践,Paxos及其变种将继续推动分布式系统的发展。
Paxos是一种分布式一致性算法,由Leslie Lamport提出,旨在解决在分布式系统中达成共识的问题。它确保了即使在网络不稳定、节点故障等复杂情况下,一组进程也能就某个值达成一致。这个算法的核心在于其简单性和容错...
《从Paxos到Zookeeper分布式一致性原理与实践》是一本深入探讨分布式系统一致性问题的著作,其中重点讲解了Paxos算法与Zookeeper在实际应用中的理论与实践。Paxos是分布式计算领域中著名的共识算法,为解决分布式...