`
壹佰案例
  • 浏览: 36072 次
  • 性别: Icon_minigender_2
  • 来自: 北京
社区版块
存档分类
最新评论

案例精选 | 知乎千万级高性能长连接网关揭秘

阅读更多


实时的响应总是让人兴奋的,就如你在微信里看到对方正在输入,如你在王者峡谷里一呼百应,如你们在直播弹幕里不约而同的 666,它们的背后都离不开长连接技术的加持。
每个互联网公司里几乎都有一套长连接系统,它们被应用在消息提醒、即时通讯、推送、直播弹幕、游戏、共享定位、股票行情等等场景。而当公司发展到一定规模,业务场景变得更复杂后,更有可能是多个业务都需要同时使用长连接系统。
业务间分开设计长连接会导致研发和维护成本陡增、浪费基础设施、增加客户端耗电、无法复用已有经验等等问题。共享长连接系统又需要协调好不同系统间的认证、鉴权、数据隔离、协议拓展、消息送达保证等等需求,迭代过程中协议需要向前兼容,同时因为不同业务的长连接汇聚到一个系统导致容量管理的难度也会增大。
经过了一年多的开发和演进,经过我们服务面向内和外的数个 App、接入十几个需求和形态各异的长连接业务、数百万设备同时在线、突发大规模消息发送等等场景的锤炼,我们提炼出一个长连接系统网关的通用解决方案,解决了多业务共用长连接时遇到的种种问题。
知乎长连接网关致力于业务数据解耦、消息高效分发、解决容量问题,同时提供一定程度的消息可靠性保证。


我们怎么设计通讯协议?
业务解耦
支撑多业务的长连接网关实际上是同时对接多客户端和多业务后端的,是多对多的关系,他们之间只使用一条长连接通讯。

这种多对多的系统在设计时要避免强耦合。业务方逻辑也是会动态调整的,如果将业务的协议和逻辑与网关实现耦合会导致所有的业务都会互相牵连,协议升级和维护都会异常困难。
所以我们尝试使用经典的发布订阅模型来解耦长连接网关跟客户端与业务后端,它们之间只需要约定 Topic 即可自由互相发布订阅消息。传输的消息是纯二进制数据,网关也无需关心业务方的具体协议规范和序列化方式。

权限控制
我们使用发布订阅解耦了网关与业务方的实现,我们仍然需要控制客户端对 Topic 的发布订阅的权限,避免有意或无意的数据污染或越权访问。
假如讲师正在知乎 Live 的 165218 频道开讲,当客户端进入房间尝试订阅 165218 频道的 Topic 时就需要知乎 Live 的后端判断当前用户是否已经付费。这种情况下的权限实际上是很灵活的,当用户付费以后就能订阅,否则就不能订阅。权限的状态只有知乎 Live 业务后端知晓,网关无法独立作出判断。
所以我们在 ACL 规则中设计了基于回调的鉴权机制,可以配置 Live 相关 Topic 的订阅和发布动作都通过 HTTP 回调给 Live 的后端服务判断。

同时根据我们对内部业务的观察,大部分场景下业务需要的只是一个当前用户的私有 Topic 用来接收服务端下发的通知或消息,这种情况下如果让业务都设计回调接口来判断权限会很繁琐。
所以我们在 ACL 规则中设计了 Topic 模板变量来降低业务方的接入成本,我们给业务方配置允许订阅的 Topic 中包含连接的用户名变量标识,表示只允许用户订阅或发送消息到自己的 Topic。

此时网关可以在不跟业务方通信的情况下,独立快速判断客户端是否有权限订阅或往 Topic 发送消息。
消息可靠性保证
网关作为消息传输的枢纽,同时对接业务后端和客户端,在转发消息时需要保证消息在传输过程的可靠性。
TCP 只能保证了传输过程中的顺序和可靠性,但遇到 TCP 状态异常、客户端接收逻辑异常或发生了 Crash 等等情况时,传输中的消息就会发生丢失。
为了保证下发或上行的消息被对端正常处理,我们实现了回执和重传的功能。重要业务的消息在客户端收到并正确处理后需要发送回执,而网关内暂时保存客户端未收取的消息,网关会判断客户端的接收情况并尝试再次发送,直到正确收到了客户端的消息回执。

而面对服务端业务的大流量场景,服务端发给网关的每条消息都发送回执的方式效率较低,我们也提供了基于消息队列的接收和发送方式,后面介绍发布订阅实现时再详细阐述。
在设计通讯协议时我们参考了 MQTT 规范,拓展了认证和鉴权设计,完成了业务消息的隔离与解耦,保证了一定程度的传输可靠性。同时保持了与 MQTT 协议一定程度上兼容,这样便于我们直接使用 MQTT 的各端客户端实现,降低业务方接入成本。



我们怎么设计系统架构?
在设计项目整体架构时,我们优先考虑的是:

  • 可靠性
  • 水平扩展能力
  • 依赖组件成熟度


简单才值得信赖。
为了保证可靠性,我们没有考虑像传统长连接系统那样将内部数据存储、计算、消息路由等等组件全部集中到一个大的分布式系统中维护,这样增大系统实现和维护的复杂度。我们尝试将这几部分的组件独立出来,将存储、消息路由交给专业的系统完成,让每个组件的功能尽量单一且清晰。
同时我们也需要快速地水平扩展能力。互联网场景下各种营销活动都可能导致连接数陡增,同时发布订阅模型系统中下发消息数会随着 Topic 的订阅者的个数线性增长,此时网关暂存的客户端未接收消息的存储压力也倍增。将各个组件拆开后减少了进程内部状态,我们就可以将服务部署到容器中,利用容器来完成快速而且几乎无限制的水平扩展。
最终设计的系统架构如下图:

系统主要由四个主要组件组成:
1、接入层使用 OpenResty 实现,负责连接负载均衡和会话保持2、长连接 Broker,部署在容器中,负责协议解析、认证与鉴权、会话、发布订阅等逻辑3、Redis 存储,持久化会话数据4、Kafka 消息队列,分发消息给 Broker 或业务方
其中 Kafka 和 Redis 都是业界广泛使用的基础组件,它们在知乎都已平台化和容器化,它们也都能完成分钟级快速扩容。


我们如何构建长连接网关?


接入层
OpenResty 是业界使用非常广泛的支持 Lua 的 Nginx 拓展方案,灵活性、稳定性和性能都非常优异,我们在接入层的方案选型上也考虑使用OpenResty。
接入层是最靠近用户的一侧,在这一层需要完成两件事:
1、负载均衡,保证各长连接 Broker 实例上连接数相对均衡2、会话保持,单个客户端每次连接到同一个 Broker,用来提供消息传输可靠性保证
负载均衡其实有很多算法都能完成,不管是随机还是各种 Hash 算法都能比较好地实现,麻烦一些的是会话保持。
常见的四层负载均衡策略是根据连接来源 IP 进行一致性 Hash,在节点数不变的情况下这样能保证每次都 Hash 到同一个 Broker 中,甚至在节点数稍微改变时也能大概率找到之前连接的节点。
之前我们也使用过来源 IP Hash 的策略,主要有两个缺点:
1、分布不够均匀,部分来源 IP 是大型局域网 NAT 出口,上面的连接数多,导致 Broker 上连接数不均衡2、不能准确标识客户端,当移动客户端掉线切换网络就可能无法连接回刚才的 Broker 了
所以我们考虑七层的负载均衡,根据客户端的唯一标识来进行一致性 Hash,这样随机性更好,同时也能保证在网络切换后也能正确路由。常规的方法是需要完整解析通讯协议,然后按协议的包进行转发,这样实现的成本很高,而且增加了协议解析出错的风险。
最后我们选择利用 Nginx 的 preread 机制实现七层负载均衡,对后面长连接 Broker 的实现的侵入性小,而且接入层的资源开销也小。
Nginx 在接受连接时可以指定预读取连接的数据到 preread buffer 中,我们通过解析 preread buffer 中的客户端发送的第一个报文提取客户端标识,再使用这个客户端标识进行一致性 Hash 就拿到了固定的 Broker。
发布与订阅
我们引入了业界广泛使用的消息队列 Kafka 来作为内部消息传输的枢纽。前面提到了一些这么使用的原因:

  • 减少长连接 Broker 内部状态,让 Broker 可以无压力扩容
  • 知乎内部已平台化,支持水平扩展


还有一些原因是:

  • 使用消息队列削峰,避免突发性的上行或下行消息压垮系统
  • 业务系统中大量使用 Kafka 传输数据,降低与业务方对接成本


其中利用消息队列削峰好理解,下面我们看一下怎么利用 Kafka 与业务方更好地完成对接。
(1)发布
长连接 Broker 会根据路由配置将消息发布到 Kafka Topic,同时也会根据订阅配置去消费 Kafka 将消息下发给订阅客户端。路由规则和订阅规则是分别配置的,那么可能会出现四种情况:
1、消息路由到 Kafka Topic,但不消费,适合数据上报的场景。


2、消息路由到 Kafka Topic,也被消费,普通的即时通讯场景。


3、直接从 Kafka Topic 消费并下发,用于纯下发消息的场景。


4、消息路由到一个 Topic,然后从另一个 Topic 消费,用于消息需要过滤或者预处理的场景。

这套路由策略的设计灵活性非常高,可以解决几乎所有的场景的消息路由需求。同时因为发布订阅基于 Kafka,可以保证在处理大规模数据时的消息可靠性。
(2)订阅
当长连接 Broker 从 Kafka Topic 中消费出消息后会查找本地的订阅关系,然后将消息分发到客户端会话。
我们最开始直接使用 HashMap 存储客户端的订阅关系。当客户端订阅一个 Topic 时我们就将客户端的会话对象放入以 Topic 为 Key 的订阅 Map 中,当反查消息的订阅关系时直接用 Topic 从 Map 上取值就行。
因为这个订阅关系是共享对象,当订阅和取消订阅发生时就会有连接尝试操作这个共享对象。为了避免并发写我们给 HashMap 加了锁,但这个全局锁的冲突非常严重,严重影响性能。
最终我们通过分片细化了锁的粒度,分散了锁的冲突。
本地同时创建数百个 HashMap,当需要在某个 Key 上存取数据前通过 Hash 和取模找到其中一个 HashMap 然后进行操作,这样将全局锁分散到了数百个 HashMap 中,大大降低了操作冲突,也提升了整体的性能。
会话
(1)持久化
当消息被分发给会话 Session 对象后,由 Session 来控制消息的下发。
Session 会判断消息是否是重要 Topic 消息, 是的话将消息标记 QoS 等级为 1,同时将消息存储到 Redis 的未接收消息队列,并将消息下发给客户端。等到客户端对消息的 ACK 后,再将未确认队列中的消息删除。
有一些业界方案是在内存中维护了一个列表,在扩容或缩容时这部分数据没法跟着迁移。也有部分业界方案是在长连接集群中维护了一个分布式内存存储,这样实现起来复杂度也会变高。
我们将未确认消息队列放到了外部持久化存储中,保证了单个 Broker 宕机后,客户端重新上线连接到其他 Broker 也能恢复 Session 数据,减少了扩容和缩容的负担。
(2)滑动窗口
在发送消息时,每条 QoS 1 的消息需要被经过传输、客户端处理、回传 ACK 才能确认下发完成,路径耗时较长。如果消息量较大,每条消息都等待这么长的确认才能下发下一条,下发通道带宽不能被充分利用。
为了保证发送的效率,我们参考 TCP 的滑动窗口设计了并行发送的机制。我们设置一定的阈值为发送的滑动窗口,表示通道上可以同时有这么多条消息正在传输和被等待确认。

我们应用层设计的滑动窗口跟 TCP 的滑动窗口实际上还有些差异。
TCP 的滑动窗口内的 IP 报文无法保证顺序到达,而我们的通讯是基于 TCP 的所以我们的滑动窗口内的业务消息是顺序的,只有在连接状态异常、客户端逻辑异常等情况下才可能导致部分窗口内的消息乱序。
因为 TCP 协议保证了消息的接收顺序,所以正常的发送过程中不需要针对单条消息进行重试,只有在客户端重新连接后才对窗口内的未确认消息重新发送。消息的接收端同时会保留窗口大小的缓冲区用来消息去重,保证业务方接收到的消息不会重复。
我们基于 TCP 构建的滑动窗口保证了消息的顺序性同时也极大提升传输的吞吐量。

写在最后
基础架构组负责知乎的流量入口和内部基础设施建设,对外我们奋斗在直面海量流量的的第一战线,对内我们为所有的业务提供坚如磐石的基础设施,用户的每一次访问、每一个请求、内网的每一次调用都与我们的系统息息相关。
文章来源:https://zhuanlan.zhihu.com/p/66807833
不知大家读完此文是否想了解更多的知乎案例?7月6-7日,第43届MPD工作坊北京站我们邀请到了知乎测试架构师王守宇,为我们进行3小时的深度分享:





课程概要:QA 团队的主要目标是保障产品的交付质量,在工作过程中我们会碰到多个共性的问题:提测质量差、人工测试多、线上故障多。本次 Topic ,知乎 QA 团队给出了一条新的解决问题之道,通过建设全员重视质量、全员参与质量保障的质量文化来获得高质量的产品。
除知乎外,阿里、百度、腾讯、新浪、去哪儿、滴滴、网易、VIPKID等企业的一线专家及技术大牛们,将通过演讲、实操、分组讨论、组别之间的PK等形式,以案例说话,还原真实工作场景,交付真实的工作技能。

 

分享到:
评论

相关推荐

    知乎千万级高性能长连接网关揭秘

    【知乎千万级高性能长连接网关揭秘】 长连接技术在当今互联网行业中扮演着至关重要的角色,尤其是在实时交互的场景中,如微信的消息提醒、在线游戏的即时反馈、直播弹幕的同步显示等。随着企业规模的扩大,业务...

    应用重构:《从知乎 iPhone 端重构说开去:Web 为主的复杂社交产品的 iOS 端开发策略及实践》| 知乎 耿健桓 | iOS DevCamp

    ### 应用重构:以知乎iPhone端为例的iOS开发策略及实践 #### 一、议题背景及重要性 随着移动互联网的发展,越来越多的社交产品选择Web作为主要的技术栈来构建其核心功能。这类以Web为主的复杂社交产品,在移动端的...

    iOS DevCamp幻灯片分享:从知乎 iPhone 端重构说开去:Web 为主的复杂社交产品的 iOS 端开发策略及实践 | 知乎 耿健桓(更新版)

    ### iOS DevCamp幻灯片分享:从知乎iPhone端重构说开去 #### 一、议题背景及重要性 随着移动互联网的发展,越来越多的社交产品选择Web作为主要的技术栈,这主要是因为Web技术能够快速响应市场变化,实现产品的快速...

    WeCenter问答程序 | 类似知乎这样的问答源码,亲测好用,值得拥有

    WeCenter问答程序是一款基于PHP开发的开源问答系统,它的设计灵感来源于知乎,旨在提供一个类似知乎的互动式知识交流平台。这款源码被广大开发者和网站管理员所青睐,因为其功能强大,易于定制,且经过实际测试,...

    知乎爬虫(知乎网站爬取工具,爬取知乎网页内容)

    【知乎爬虫】是一种用于自动化抓取知乎网站信息的程序,通常由编程语言如Java实现。这个特定的爬虫工具,名为"ZhihuDown",可能是以Java编写的一个开源项目,用户可以下载并尝试使用。它允许用户批量或定时获取知乎...

    关于微信小程序案例的知乎教程

    关于微信小程序案例的知乎教程

    案例正文_知乎大数据之青年群体择偶观分析1

    摘要在青年的价值观体系中,择偶观是不可忽视的一个重要方面,对择偶问题的关注也成为青年生活的重要内容之一。在新世纪和多元时代下成长起来的"90后"在恋爱观、择偶观

    案例说明_知乎大数据之青年群体择偶观分析1

    本案例主要围绕着大数据在青年群体择偶观分析中的应用展开,旨在让学生理解和掌握大数据处理的实际操作流程。其中,涉及的主要知识点包括: 1. **大数据处理**:案例中提到了两个重要的大数据处理框架——Hadoop和...

    知乎分析报告:用知识连接社区.pdf

    【知乎分析报告】深入解析知识问答社区的演变与成功之道 知乎,作为中国领先的网络问答社区,自2010年成立以来,历经多次迭代和发展,已从一个小众的知识创作平台演变为涵盖多元功能的大型社交知识平台。本分析报告...

    【用户运营】用户金字塔模型的应用:知乎案例分析.docx

    【用户运营】用户金字塔模型的应用:知乎案例分析.docx

    Vue3.0+TS 仿知乎

    仿知乎每天更新好文章,包括权威的时事解读、有趣的生活建议  更符合用户口味的「主题日报」,覆盖电影、财经、设计、体育等领域  长评优先展示  离线下载功能,及时缓存近期的 30 篇文章

    知乎首页登录背景图

    大尺寸或高分辨率的背景图可能会拖慢页面加载时间,因此在保持视觉质量的同时,优化图片大小和格式至关重要。同时,考虑到SEO(搜索引擎优化),背景图的alt标签应当准确描述图片内容,帮助搜索引擎理解和索引。 ...

    知乎助手 Setup 2.3.0.rar

    《知乎助手 Setup 2.3.0:一款实用的辅助工具详解》 知乎助手 Setup 2.3.0 是一个专为知乎用户设计的软件工具,旨在提供一系列实用功能,帮助用户更高效、便捷地使用知乎平台。这个版本2.3.0的更新可能包含了性能...

    微信小程序源码 知乎(学习版)

    微信小程序源码 知乎(学习版)微信小程序源码 知乎(学习版)微信小程序源码 知乎(学习版)微信小程序源码 知乎(学习版)微信小程序源码 知乎(学习版)微信小程序源码 知乎(学习版)微信小程序源码 知乎(学习版)微信小程序...

    传媒行业:知乎,高品质社区为基石,探索多元商业化蓝图.rar

    《传媒行业:知乎,高品质社区为基石,探索多元商业化蓝图》 知乎,作为中国领先的问答式在线社区,自2010年成立以来,以其高质量的内容和专业知识分享吸引了大量的用户。这个社区的核心价值在于其用户群体的广泛性...

    微信小程序 知乎 (源码)

    微信小程序 知乎 (源码)微信小程序 知乎 (源码)微信小程序 知乎 (源码)微信小程序 知乎 (源码)微信小程序 知乎 (源码)微信小程序 知乎 (源码)微信小程序 知乎 (源码)微信小程序 知乎 (源码)微信小程序 知乎 (源码)...

    解码知乎网:知乎组织架构模型“大剖析”.docx

    通过这些机制,知乎有效地减缓了有价值信息的流失速度,让它们能够在更长的时间内保持可见性和影响力。 #### 收藏模块 收藏模块允许用户保存对自己有用的内容,并且支持创建收藏文件夹来更好地管理这些内容。值得...

    知乎(一款模拟知乎的软件)

    【知乎模拟软件详解】 知乎,作为国内知名的问答社区,聚集了众多领域的专业人士,分享知识、经验和见解。而这里提到的“知乎(一款模拟知乎的软件)”,则是一款旨在模仿知乎平台核心功能的应用程序,旨在为用户...

    优选知乎-电子商务案例分析-虚拟社区PPT文档.ppt

    【知乎电子商务案例分析】 知乎,作为一个真实的网络问答社区,自其成立以来,凭借其独特的社区氛围和用户群体,逐渐成为互联网上知识分享的重要平台。社区的核心特点是邀请问答制,吸引了超过400万用户,其中包括...

Global site tag (gtag.js) - Google Analytics