`
m635674608
  • 浏览: 5042255 次
  • 性别: Icon_minigender_1
  • 来自: 南京
社区版块
存档分类
最新评论

RocketMQ架构模块解析

 
阅读更多

RocketMQ是一个分布式开放消息中间件,底层基于队列模型来实现消息收发功能。RocketMQ集群中包含4个模块:Namesrv, Broker, Producer, Consumer。

  • Namesrv: 存储当前集群所有Brokers信息、Topic跟Broker的对应关系。
  • Broker: 集群最核心模块,主要负责Topic消息存储、消费者的消费位点管理(消费进度)。
  • Producer: 消息生产者,每个生产者都有一个ID(编号),多个生产者实例可以共用同一个ID。同一个ID下所有实例组成一个生产者集群。
  • Consumer: 消息消费者,每个订阅者也有一个ID(编号),多个消费者实例可以共用同一个ID。同一个ID下所有实例组成一个消费者集群。


集群部署架构

结合部署结构图,描述集群工作流程:
1,启动Namesrv,Namesrv起来后监听端口,等待Broker、Produer、Consumer连上来,相当于一个路由控制中心。
2,Broker启动,跟所有的Namesrv保持长连接,定时发送心跳包。心跳包中包含当前Broker信息(IP+端口等)以及存储所有topic信息。注册成功后,namesrv集群中就有Topic跟Broker的映射关系。
3,收发消息前,先创建topic,创建topic时需要指定该topic要存储在哪些Broker上。也可以在发送消息时自动创建Topic。
4,Producer发送消息,启动时先跟Namesrv集群中的其中一台建立长连接,并从Namesrv中获取当前发送的Topic存在哪些Broker上,然后跟对应的Broker建长连接,直接向Broker发消息。
5,Consumer跟Producer类似。跟其中一台Namesrv建立长连接,获取当前订阅Topic存在哪些Broker,然后直接跟Broker建立连接通道,开始消费消息。

 

模块功能特性

Namesrv

  1. Namesrv用于存储Topic、Broker关系信息,功能简单,稳定性高。多个Namesrv之间相互没有通信,单台Namesrv宕机不影响其他Namesrv与集群;即使整个Namesrv集群宕机,已经正常工作的Producer,Consumer,Broker仍然能正常工作,但新起的Producer, Consumer,Broker就无法工作。
  2. Namesrv压力不会太大,平时主要开销是在维持心跳和提供Topic-Broker的关系数据。但有一点需要注意,Broker向Namesr发心跳时,会带上当前自己所负责的所有Topic信息,如果Topic个数太多(万级别),会导致一次心跳中,就Topic的数据就几十M,网络情况差的话,网络传输失败,心跳失败,导致Namesrv误认为Broker心跳失败。

 

Broker

1,高并发读写服务

Broker的高并发读写主要是依靠以下两点:

  • 消息顺序写,所有Topic数据同时只会写一个文件,一个文件满1G,再写新文件,真正的顺序写盘,使得发消息TPS大幅提高。
  • 消息随机读,RocketMQ尽可能让读命中系统pagecache,因为操作系统访问pagecache时,即使只访问1K的消息,系统也会提前预读出更多的数据,在下次读时就可能命中pagecache,减少IO操作。

2,负载均衡与动态伸缩

负载均衡:Broker上存Topic信息,Topic由多个队列组成,队列会平均分散在多个Broker上,而Producer的发送机制保证消息尽量平均分布到所有队列中,最终效果就是所有消息都平均落在每个Broker上。

动态伸缩能力(非顺序消息):Broker的伸缩性体现在两个维度:Topic, Broker。

  • Topic维度:假如一个Topic的消息量特别大,但集群水位压力还是很低,就可以扩大该Topic的队列数,Topic的队列数跟发送、消费速度成正比。
  • Broker维度:如果集群水位很高了,需要扩容,直接加机器部署Broker就可以。Broker起来后想Namesrv注册,Producer、Consumer通过Namesrv发现新Broker,立即跟该Broker直连,收发消息。

3,高可用&高可靠

高可用:集群部署时一般都为主备,备机实时从主机同步消息,如果其中一个主机宕机,备机提供消费服务,但不提供写服务。

高可靠:所有发往broker的消息,有同步刷盘和异步刷盘机制;同步刷盘时,消息写入物理文件才会返回成功,异步刷盘时,只有机器宕机,才会产生消息丢失,broker挂掉可能会发生,但是机器宕机崩溃是很少发生的,除非突然断电

4,Broker与Namesrv的心跳机制
单个Broker跟所有Namesrv保持心跳请求,心跳间隔为30秒,心跳请求中包括当前Broker所有的Topic信息。Namesrv会反查Broer的心跳信息,如果某个Broker在2分钟之内都没有心跳,则认为该Broker下线,调整Topic跟Broker的对应关系。但此时Namesrv不会主动通知Producer、Consumer有Broker宕机。

 

消费者

消费者启动时需要指定Namesrv地址,与其中一个Namesrv建立长连接。消费者每隔30秒从nameserver获取所有topic的最新队列情况,这意味着某个broker如果宕机,客户端最多要30秒才能感知。连接建立后,从namesrv中获取当前消费Topic所涉及的Broker,直连Broker。

Consumer跟Broker是长连接,会每隔30秒发心跳信息到Broker。Broker端每10秒检查一次当前存活的Consumer,若发现某个Consumer 2分钟内没有心跳,就断开与该Consumer的连接,并且向该消费组的其他实例发送通知,触发该消费者集群的负载均衡。

消费者端的负载均衡
先讨论消费者的消费模式,消费者有两种模式消费:集群消费,广播消费。

  • 广播消费:每个消费者消费Topic下的所有队列。
  • 集群消费:一个topic可以由同一个ID下所有消费者分担消费。具体例子:假如TopicA有6个队列,某个消费者ID起了2个消费者实例,那么每个消费者负责消费3个队列。如果再增加一个消费者ID相同消费者实例,即当前共有3个消费者同时消费6个队列,那每个消费者负责2个队列的消费。

消费者端的负载均衡,就是集群消费模式下,同一个ID的所有消费者实例平均消费该Topic的所有队列。

 

生产者(Producer)

Producer启动时,也需要指定Namesrv的地址,从Namesrv集群中选一台建立长连接。如果该Namesrv宕机,会自动连其他Namesrv。直到有可用的Namesrv为止。

生产者每30秒从Namesrv获取Topic跟Broker的映射关系,更新到本地内存中。再跟Topic涉及的所有Broker建立长连接,每隔30秒发一次心跳。在Broker端也会每10秒扫描一次当前注册的Producer,如果发现某个Producer超过2分钟都没有发心跳,则断开连接。

生产者端的负载均衡

生产者发送时,会自动轮询当前所有可发送的broker,一条消息发送成功,下次换另外一个broker发送,以达到消息平均落到所有的broker上。

 

这里需要注意一点:假如某个Broker宕机,意味生产者最长需要30秒才能感知到。在这期间会向宕机的Broker发送消息。当一条消息发送到某个Broker失败后,会往该broker自动再重发2次,假如还是发送失败,则抛出发送失败异常。业务捕获异常,重新发送即可。客户端里会自动轮询另外一个Broker重新发送,这个对于用户是透明的。

 

demo演示:
git clone https://github.com/javahongxi/incubator-rocketmq.git
创建配置文件conf.properties
rocketmqHome=D:\\github\\incubator-rocketmq\\distribution
namesrvAddr=127.0.0.1:9876
mapedFileSizeCommitLog=52428800
mapedFileSizeConsumeQueue=30000

-c conf.properties
依次启动NamesrvStartup,BrokerStartup,Consumer,Producer


rocketmq扩展:https://github.com/javahongxi/incubator-rocketmq-externals.git

rocketmq扩展:https://github.com/javahongxi/incubator-rocketmq-externals.git
 
http://blog.csdn.net/javahongxi/article/details/72956608
分享到:
评论

相关推荐

    Apache RocketMQ 源码解析1

    本篇文章将深入解析RocketMQ的源码,特别是关于DLedger多副本和主从切换的部分,以及如何利用Raft协议实现这些功能。 首先,RocketMQ 4.5.0版本引入了DLedger,这是一个基于多副本机制的设计,目的是为了提高系统的...

    Rocketmq核心源码剖析-图灵杨过老师1

    在深入探讨RocketMQ核心源码之前,...通过对RocketMQ的CommitLog和ConsumeQueue的理解,以及NameServer和Broker架构的解析,我们可以更深入地掌握RocketMQ的工作原理,这对于优化系统性能和解决实际问题具有重要意义。

    rocketmq相关jar包.zip

    2. `rocketmq-common-4.7.0.jar`:这个jar包包含了RocketMQ的通用模块,提供了一些基础工具类和常量,如NameServer地址解析、配置管理、时间戳处理、线程池管理等。同时,它也包含了一些核心的数据结构,如Message...

    rocketmq-externals-master.zip

    下面将详细阐述RocketMQ的核心概念、架构、工作流程以及源码解析的关键点。 1. **核心概念** - **消息**:RocketMQ中的基本单位,用于在生产者和消费者之间传递信息。 - **主题(Topic)**:消息的分类,多个生产...

    深入探索RocketMQ源码:透视消息中间件的内核机制

    通过对RocketMQ源码的逐层解析,我们可以理解其内部工作机制,包括NameServer的角色、Broker的启动与注册、Producer与Consumer的工作模式,以及消息存储和延迟处理的细节。这将有助于我们在实际开发中更好地利用...

    淘宝电商架构的发展历程

    以下是对淘宝电商架构发展历程的详细解析。 在淘宝的早期阶段,其架构相对简单,主要基于PHP语言构建,采用LAMP(Linux + Apache + MySQL + PHP)架构,这种架构在当时是中小型网站的常见选择,具有成本低、开发...

    开发工程师 架构师,知识图谱

    1. **架构师图谱**:这是对整体系统架构设计的全面概述,包括了如何规划、设计和管理软件系统的架构,涉及到模块划分、接口设计、技术选型、性能优化等方面。 2. **Java架构师图谱**:针对Java开发的高级知识,涵盖...

    亿级流量网站架构核心技术-跟开涛学搭建高可用高并发系统

    2. **模块化设计**:将整个系统分解成多个独立的模块,每个模块负责一部分功能,并且这些模块之间通过接口进行通信。这样不仅可以提高系统的可维护性,还可以使得系统更加灵活,便于后续的扩展和优化。 3. **采用...

    海量用户推送后台系统架构实践.pptx

    【海量用户推送后台系统架构实践】的PPT详细解析了极光推送服务在面对亿级用户推送时的技术挑战和解决方案。以下将从关键点进行详细阐述: 1. **极光推送服务架构**:极光推送服务由API接口、用户筛选、用户分发、...

    开源推动下Apache ShardingSphere架构演进——潘娟.pdf

    1. **核心解析(Core Parse)**:解析SQL语句,识别出分片条件。 2. **分片规则(Sharding Orchestration)**:定义数据分片策略,如按照时间或用户ID进行分片。 3. **流量控制(Traffic Control)**:管理数据库...

    淘宝网技术框架解析

    淘宝网技术框架解析 在深入探讨淘宝网技术框架之前,我们先来理解一下为何电子商务网站的架构设计如此重要。随着互联网技术的飞速发展,电子商务已成为人们日常生活中不可或缺的一部分,而作为中国乃至全球最大的...

    大型供应链系统技术架构设计方案.pptx

    - **垂直多HAP集成**:进一步发展,采用了垂直多HAP集成的方式,将不同业务模块进行拆分,形成独立的服务单元。 - **分布式架构**:最终演进为基于SOA(Service Oriented Architecture)的分布式架构,通过HAP+服务...

    springCloud

    ActiveMQ Kafka RabbitMQ RocketMQ 目前Spring Cloud Bus 支持 RabbitMQ 和 Kafka,spring-cloud-starter-bus-amqp 、spring-cloud-starter-bus-kafka RabbitMQ简介 RabbitMQ是一个开源的AMQP实现,服务器端用...

    藏经阁-微服务治理技术白皮书-379页

    随着微服务架构的广泛应用,它既带来了技术优势,如模块化、独立部署和扩展性,但也引入了复杂性,使得开发、运维和部署更为复杂。本书由阿里巴巴、bilibili、字节跳动等企业及Apache Dubbo等社区共同维护的...

    spring整合资料.zip

    在微服务架构中,RocketMQ常被用来解耦服务间的通信,提高系统的并发处理能力和稳定性。 这些技术在实际开发中常常协同工作,Spring MVC处理后端业务逻辑,Spring Data简化数据访问,Swagger提供API文档,ES6和...

    Tedu5阶段Spring Cloud Alibaba入门

    - **分布式**指的是由多个进程、节点或模块共同完成同一项任务的架构模式。 - 微服务架构解决了传统单体架构的一些局限性,但也带来了新的挑战,如远程调用、熔断机制、分布式事务等问题。 #### 三、微服务框架...

    薪资15Kjava工程师简历模板

    以下是对该简历内容的详细解析: 首先,个人基本信息包括姓名、性别、年龄、学历以及联系方式。在实际简历中,这些信息应该清晰明了,以便招聘方能够快速联系到求职者。 接着,技能部分是简历的核心。此简历的Java...

    武汉理工大学JavaEE课程大作业

    - **实现方式**:在用户成功登录后生成JWT,并将其发送给客户端,客户端在后续请求中携带该JWT,后端通过解析JWT验证用户身份。 4. **利用Redis进行缓存优化** - **简介**:Redis是一个开源的内存数据结构存储...

Global site tag (gtag.js) - Google Analytics