`
youyu4
  • 浏览: 441993 次
社区版块
存档分类
最新评论

互联网一致性架构设计 -- 消息时序一致性

 
阅读更多

互联网一致性架构设计 -- 消息时序一致性

 

 

为什么时序难以保证,消息一致性难?

 

 

    原因

 

  • 时钟不一致
  • 多客户端(发送方)
  • 服务集群(多接收方)
  • 网络传输与多线程

 

    时钟不一致

 

       分布式环境下,有多个客户端、有web集群、service集群、db集群,他们都分布在不同的机器上,机器之间都是使用的本地时钟,而没有一个所谓的“全局时钟”,所以不能用“本地时间”来完全决定消息的时序。



 

 

   

    多客户端(发送方)

 

       绝对时序上,APP1先发出msg1,APP2后发出msg2,都发往服务器web1,网络传输是不能保证msg1一定先于msg2到达的,所以即使以一台服务器web1的时间为准,也不能精准描述msg1与msg2的绝对时序。


     
 

 

 

    服务集群(多接收方)

 

       绝对时序上,web1先发出msg1,后发出msg2,由于网络传输及多接收方的存在,无法保证msg1先被接收到先被处理,故也无法保证msg1与msg2的处理时序。



 

 

 

    网络传输与多线程

 

       web1先发出msg1,后发出msg2,即使msg1先到达(网络传输其实还不能保证msg1先到达),由于多线程的存在,也不能保证msg1先被处理完。



 

 

 

    怎么保证绝对时序

 

       可以通过只有一个发送方,一个接收方,上下游连接只有一条连接池,通过阻塞的方式通讯,来保证先发出的消息先处理。但是吞吐量会非常低,而且单发送方单接收方单连接池的假设不太成立,高并发高可用的架构不会允许这样的设计出现。

 

 

 

 

 

优化方案

 

    以客户端或者服务端的时序为准

 

       要“有序”,先得有衡量“有序”的标尺,可以是客户端标尺,可以是服务端标尺。

 

       多客户端、多服务端导致“时序”的标准难以界定,需要一个标尺来衡量时序的先后顺序,可以根据业务场景,以客户端或者服务端的时间为准,例如:

 

  1. 邮件展示顺序,其实是以客户端发送时间为准的,潜台词是,发送方只要将邮件协议里的时间调整为1970年或者2970年,就可以在接收方收到邮件后一直“置顶”或者“置底”
  2. 秒杀活动时间判断,肯定得以服务器的时间为准,不可能让客户端修改本地时间,就能够提前秒杀

 

 

    服务端能够生成单调递增的id

 

       这个是毋庸置疑的,不展开讨论,例如利用单点写db的seq/auto_inc_id肯定能生成单调递增的id,只是说性能及扩展性会成为潜在瓶颈。对于严格时序的业务场景,可以利用服务器的单调递增id来保证时序。

 

 

 

    大部分业务能接受误差不大的趋势递增id

 

       消息发送、帖子发布时间、甚至秒杀时间都没有这么精准时序的要求:

 

  1. 同1s内发布的聊天消息时序乱了
  2. 同1s内发布的帖子排序不对
  3. 用1s内发起的秒杀,由于服务器多台之间时间有误差,落到A服务器的秒杀成功了,落到B服务器的秒杀还没开始,业务上也是可以接受的(用户感知不到)

       所以,大部分业务,长时间趋势递增的时序就能够满足业务需求,非常短时间的时序误差一定程度上能够接受。

 

 

 

    利用单点序列化,可以保证多机相同时序

 

  1. 先在一台机器上序列化操作
  2. 再将操作序列分发到所有的机器,以保证多机的操作序列是一致的,最终数据是一致的

    单点序列化,是一种常见的保证多机时序统一的方法,典型场景有db主从一致,gfs多文件一致。

 

 

    典型场景一:数据库主从同步

 


 

       数据库的主从架构,上游分别发起了op1,op2,op3三个操作,主库master来序列化所有的SQL写操作op3,op1,op2,然后把相同的序列发送给从库slave执行,以保证所有数据库数据的一致性,就是利用“单点序列化”这个思路。

 

 

    典型场景二:GFS中文件的一致性



 

       GFS(Google File System)为了保证文件的可用性,一份文件要存储多份,在多个上游对同一个文件进行写操作时,也是由一个主chunk-server先序列化写操作,再将序列化后的操作发送给其他chunk-server,来保证冗余文件的数据一致性的。

 

 

 

    单对单聊天,怎么保证发送顺序与接收顺序一致

 

       只需保证发出的时序与接收的时序一致,可以利用客户端seq。

 

  1. 如果利用服务器单点序列化时序,可能出现服务端收到消息的时序为msg3,msg1,msg2,与发出序列不一致
  2. 业务上不需要全局消息一致,只需要对于同一个发送方A,ta发给B的消息时序一致就行,常见优化方案,在A往B发出的消息中,加上发送方A本地的一个绝对时序,来表示接收方B的展现时序


 

       潜在问题:如果接收方B先收到msg3,msg3会先展现,后收到msg1和msg2后,会展现在msg3的前面。无论如何,是按照接收方收到时序展现,还是按照服务端收到的时序展现,还是按照发送方发送时序展现,是pm需要思考的点,技术上都能够实现(接收方按照发送时序展现是更合理的)。

 

 

 

    群聊消息,怎么保证各接收方收到顺序一致

 

       只需保证所有接收方消息时序一致,需要利用服务端seq,方法有两种,一种单点绝对时序,另一种id串行化。

 

    方法一:服务器单点

 

  1. sender1发出msg1,sender2发出msg2
  2. msg1和msg2经过接入集群,服务集群
  3. service层到底层拿一个唯一seq,来确定接收方展示时序
  4. service拿到msg2的seq是20,msg1的seq是30
  5. 通过投递服务讲消息给多个群友,群友即使接收到msg1和msg2的时间不同,但可以统一按照seq来展现

     
 

    缺点:这个生成全局递增序列号的服务很容易成为系统瓶颈。

 

 

    方法二:根据id穿行化

 

       service层不再需要去一个统一的后端拿全局seq,而是在service连接池层面做细小的改造,保证一个群的消息落在同一个service上,这个service就可以用本地seq来序列化同一个群的所有消息,保证所有群友看到消息的时序是相同的。



 

 

 

 

总结

 

    1. 分布式环境下,消息的有序性是很难的,原因多种多样:时钟不一致,多发送方,多接收方,多线程,网络传输不确定性等

 

    2. 要“有序”,先得有衡量“有序”的标尺,可以是客户端标尺,可以是服务端标尺

 

    3. 大部分业务能够接受大范围趋势有序,小范围误差;绝对有序的业务,可以借助服务器绝对时序的能力

 

    4. 单点序列化,是一种常见的保证多机时序统一的方法,典型场景有db主从一致,gfs多文件一致

 

    5. 单对单聊天,只需保证发出的时序与接收的时序一致,可以利用客户端seq

 

    6. 群聊,只需保证所有接收方消息时序一致,需要利用服务端seq,方法有两种,一种单点绝对时序,另一种id串行化

  • 大小: 30 KB
  • 大小: 19.2 KB
  • 大小: 20.3 KB
  • 大小: 23 KB
  • 大小: 91.1 KB
  • 大小: 59 KB
  • 大小: 75.4 KB
  • 大小: 154.5 KB
  • 大小: 104.3 KB
分享到:
评论

相关推荐

    藏经阁-时序数据库LinDB架构演进.pdf

    本文档详细介绍了LinDB的架构演进,包括架构设计、存储引擎、查询优化等方面的演进。 1. 林DB架构演进 LinDB的架构演进可以分为三个阶段:LinDB 1.0、LinDB 2.0和LinDB 3.0。每个阶段都有其特点和改进。 * LinDB ...

    基于ActiveMQ的消息中间件架构设计.docx

    5. **同步处理时序**(未在描述中详细展开,但通常涉及同步通信时,生产者发送消息后需等待消费者响应,保证消息的顺序性和一致性,适用于对实时性要求较高的场景)。 综上所述,基于ActiveMQ的消息中间件架构设计...

    Edgem Native技术架构白皮书-5G确定性网络产业联网(2021.02).zip

    与传统的5G网络相比,确定性网络通过优化网络资源分配和管理,确保了服务的确定性和一致性。 2. **Edge Computing(边缘计算)**:Edgem Native技术是边缘计算的一种实现方式,它强调将计算能力、存储和数据处理...

    时序数据库LinDB架构演进(22页).pdf

    7. Leader-Follower架构:使用Leader-Follower架构来实现高可用性和数据一致性。 8. 数据确认和回传:使用Client-Ack机制来实现数据确认和回传。 四、LinDB架构优点 1. 高性能:LinDB架构具有高性能的数据存储和...

    行业分类-设备装置-用于协议一致性测试的软件架构方法及平台.zip

    总之,协议一致性测试对于设备和系统的正确运行至关重要,而设计良好的软件架构和测试平台则是实现这一目标的关键。通过对压缩包内文件的深入学习,我们可以获得宝贵的指导,以提升通信设备和软件的质量和可靠性。

    基于操作历史图的分布式Key-Value数据库一致性检测算法.pdf

    该算法首先定义了读写操作记录之间的时序关系、安全一致性以及并行一致性原则等概念。时序关系是指对数据项的操作在时间上的先后顺序,这是判断一致性问题的关键依据之一。安全一致性则涉及对数据进行修改的操作(写...

    模型与代码之间一致性检查报告1

    本文主要讨论的是模型与代码之间一致性检查的报告,主要涵盖了用例图、类图、系统架构图、系统活动图、状态图、时序图、组件图、RUCM以及OCL等多个模型与实际代码实现的一致性验证。下面将详细阐述这些模型与代码...

    头歌单总线CPU设计(变长指令周期3级时序)(HUST).zip

    总结起来,"头歌单总线CPU设计(变长指令周期3级时序)"是一个涉及计算机组成原理的实践教学项目,涵盖了变长指令周期的理解、硬布线控制器的逻辑设计、时序发生器的FSM实现、MIPS指令的译码以及单总线架构的整合等多...

    模型一致性检查报告1

    本报告主要介绍了模型的一致性检查结果,包括UML、RUCM、架构图和OCL模型。通过对模型的一致性分析,确保了不同模型之间的一致性。 一、UML模型的一致性 UML模型包括用例图、类图、活动图、状态图和时序图等。在...

    千兆网口一致性测试手册

    《千兆网口一致性测试手册》是一份详细指导如何对网络接口进行性能验证的重要文档,主要针对千兆、百兆和十兆级别的网络接口进行一致性测试。这份手册由Accton公司编制,版权保护,自2013年9月发布至今已有五年的...

    变长指令周期CPU设计.zip

    本主题聚焦于“变长指令周期CPU设计”,这是一种在计算机组成原理中常见的概念,尤其在单总线架构中常见。本文将深入探讨变长指令周期的概念、其优缺点以及在实际设计中的实现细节。 变长指令周期是指CPU处理不同...

    高速信号完整性工程师培训课程 ---DDR原理及物理层一致性测试

    高速信号完整性工程师培训课程,特别是围绕DDR原理和物理层一致性测试的课程,是电子工程领域中一项重要的技能培训,主要面向需要进行DDR内存设计、测试和维护的工程师。 课程内容涵盖了DDR SDRAM的架构特点、工作...

    嵌入式软件架构设计

    这种架构的主要目的是提供一个一致性的开发、测试和维护平台,使开发团队能够高效地管理复杂的软件系统。通过采用一致的软件架构,即使随着文件数量的增长或团队成员的变化,软件的使用和维护也会变得更加容易。此外...

    时序数据库LinDB架构演进.pdf

    LinDB是一款面向物联网(IoT)场景设计的时序数据库,其架构经历了多次迭代与优化。从2015年到2018年期间,LinDB经历了三个主要版本的演进:LinDB 1.0、LinDB 2.0 和 LinDB 3.0。每个版本都针对不同的需求进行了改进...

    数字逻辑设计及应用教学课件:8-4 时序电路的设计 同步设计 .ppt

    迭代设计是指通过重复某个过程来达到设计目标,而同步设计则关注整个系统在同一个时钟周期内的一致性。同步设计中,所有的操作都按照同一个时钟信号进行,以确保数据的正确传递和处理。 时序系统的同步设计面临一些...

    软件系统架构设计师教程经典图例

    - **界面集成**:确保用户界面的一致性和用户体验。 - **控制集成**:协调各个子系统的运行。 - **事件驱动集成**:基于事件的集成方式,通过事件触发相应的处理逻辑。 - **分布式应用集成框架**:这部分内容介绍...

    微服务技术架构设计图.pptx

    而统一认证、授权和消息系统则确保了服务间的安全交互和信息传递的一致性。 分布式计算是微服务架构的基石,包括使用Presto进行分布式查询,Elasticsearch(ES)用于分布式搜索,以及Kafka处理分布式消息。这些工具...

    UML模型和Java代码之间的一致性检测方法.pdf

    然后,我们设计了UML模型和Java源代码之间的一致性检测算法,包括对类间静态信息以及时序调用图SD-CG与方法调用图CG之间的一致性检测。 最后,我们通过开发UML模型和Java源代码一致性检测工具,验证了所提出的方法...

Global site tag (gtag.js) - Google Analytics