从入职京东到现在,做读服务已经一年多的时间了,经历了各种亿级到百亿级的读服务;这段时间也进行了一些新的读服务架构尝试,从架构到代码的编写,各个环节都进行了反复尝试,压测并进行调优,希望得到一个自己满意的读服务架构。
一些设计原则
- 无状态
- 数据闭环
- 缓存银弹
- 并发化
- 降级开关
- 限流
- 切流量
- 其他
无状态
如果设计的应用是无状态的,那么应用就可以水平扩展,当然实际生产环境可能是这样子的: 应用无状态,配置文件有状态。比如不同的机房需要读取不同的数据源,此时就需要通过配置文件指定。
数据闭环
如果依赖的数据来源特别多,此时就可以考虑使用数据闭环,基本步骤:
1、数据异构:通过如MQ机制接收数据变更,然后原子化存储到合适的存储引擎,如redis或持久化KV存储;
2、数据聚合:这步是可选的,数据异构的目的是把数据从多个数据源拿过来,数据聚合目的是把这些数据做个聚合,这样前端就可以一个调用拿到所有数据,此步骤一般存储到KV存储中;
3、前端展示:前端通过一次或少量几次调用拿到所需要的数据。
这种方式的好处就是数据的闭环,任何依赖系统出问题了,还是能正常工作,只是更新会有积压,但是不影响前端展示。
另外此处如果一次需要多个数据,可以考虑使用Hash Tag机制将相关的数据聚合到一个实例,如在展示商品详情页时需要:商品基本信息:p:123:, 商品规格参数:d:123:,此时就可以使用冒号中间的123作为数据分片key,这样相同id的商品相关数据就在一个实例。
缓存银弹
缓存对于读服务来说可谓抗流量的银弹。
浏览器端缓存
设置请求的过期时间,如响应头Expires、Cache-control进行控制。这种机制适用于如对实时性不太敏感的数据,如商品详情页框架、商家评分、评价、广告词等;但对于如价格、库存等实时要求比较高的,就不能做浏览器端缓存。
CDN缓存
有些页面/活动页/图片等服务可以考虑将页面/活动页/图片推送到离用户最近的CDN节点让用户能在离他最近的节点找到想要的数据。一般有两种机制:推送机制(当内容变更后主动推送到CDN边缘节点),拉取机制(先访问边缘节点,当没有内容时回源到源服务器拿到内容并存储到节点上),两种方式各有利弊。 使用CDN时要考虑URL的设计,比如URL中不能有随机数,否则每次都穿透CDN,回源到源服务器,相当于CDN没有任何效果。对于爬虫可以返回过期数据而选择不回源。
接入层缓存
对于没有CDN缓存的应用来说,可以考虑使用如Nginx搭建一层接入层,该接入层可以考虑如下机制实现:
1、URL重写:将URL按照指定的顺序或者格式重写,去除随机数;
2、一致性哈希:按照指定的参数(如分类/商品编号)做一致性Hash,从而保证相同数据落到一台服务器上;
3、proxy_cache:使用内存级/SSD级代理缓存来缓存内容;
4、proxy_cache_lock:使用lock机制,将多个回源合并为一个,减少回源量,并设置相应的lock超时时间;
5、shared_dict:此处如果架构使用了nginx+lua实现,可以考虑使用lua shared_dict进行cache,最大的好处就是reload缓存不丢失。
此处要注意,对于托底/异常数据不应该让其缓存,否则用户会在很长一段时间看到这些数据。
应用层缓存
如我们使用Tomcat时可以使用堆内缓存/堆外缓存,堆内缓存的最大问题就是重启时内存中的缓存丢失,如果此时流量风暴来临可能冲垮应用;还可以考虑使用local redis cache来代替堆外内存;或者在接入层使用shared_dict来将缓存前置,减少风暴。
分布式缓存
一种机制就是废弃分布式缓存,改成应用local redis cache,即在应用所在服务器中部署一个redis,然后使用主从机制同步数据。如果数据量不大这种架构是最优的;如果数据量太大,单服务器存储不了,还可以考虑分片机制将流量分散到多台;或者直接就是分布式缓存实现。常见的分片规则就是一致性哈希了。
如上图就是我们一个应用的架构:
1、首先接入层读取本地proxy cache / local cache;
2、如果不命中,会读取分布式redis集群;
3、如果还不命中,会回源到tomcat,然后读取堆内cache;如果没有,则直接调用依赖业务获取数据;然后异步化写到redis集群;
因为我们使用了nginx+lua,第二、三步可以使用lua-resty-lock非阻塞锁减少峰值时的回源量;如果你的服务是用户维度的,这种非阻塞锁不会有什么大作用。
并发化
假设一个读服务是需要如下数据:
1、数据A 10ms
2、数据B 15ms
3、数据C 20ms
4、数据D 5ms
5、数据E 10ms
那么如果串行获取那么需要:60ms;
而如果数据C依赖数据A和数据B、数据D谁也不依赖、数据E依赖数据C;那么我们可以这样子来获取数据:
那么如果并发化获取那么需要:30ms;能提升一倍的性能。
假设数据E还依赖数据F(5ms),而数据F是在数据E服务中获取的,此时就可以考虑在此服务中在取数据A/B/D时预取数据F,那么整体性能就变为了:25ms。
降级开关
对于一个读服务,很重要的一个设计就是降级开关,在设计降级开关时主要如下思路:
1、开关集中化管理:通过推送机制把开关推送到各个应用;
2、可降级的多级读服务:比如只读本地缓存、只读分布式缓存、或者只读一个默认的降级数据;
3、开关前置化:如架构是nginx--->tomcat,可以将开关前置到nginx接入层,在nginx层做开关,请求不打到后端应用。
限流
目的是防止恶意流量,恶意攻击,可以考虑如下思路:
1、恶意流量只访问cache;
2、对于穿透到后端应用的可以考虑使用nginx的limit模块处理;
3、对于恶意ip可以使用如nginx deny进行屏蔽。
大部分时候是不进行接入层限流的,而是限制流量穿透到后端薄弱的应用层。
切流量
对于一个大型应用,切流量是非常重要的,比如多机房有机房挂了、或者有机架挂了、或者有服务器挂了等都需要切流量,可以使用如下手段进行切换:
1、DNS:切换机房入口;
2、LVS/HaProxy:切换故障的nginx接入层;
3、Nginx:切换故障的应用层;
另外我们有些应用为了更方便切换,还可以在nginx接入层做切换,通过nginx进行一些流量切换,而没有通过如LVS/HaProxy做切换。
其他
不需要cookie的应用使用无状态域名,如3.cn;
接入层请求头过滤,只转发有用的请求头到后端应用;
数据过滤逻辑前置,比如在接入层进行请求参数的合法性过滤;
内网设置合理的连接、读、写超时时间;
根据需要开启gzip压缩减少流量;
使用unix domain socket减少本机连接数;
内网考虑使用http长连接;
响应请求时,考虑响应头加上服务器ip等信息,方便调试。
我们处理的读服务大部分都是KV的,因此抗流量的思路就是大量缓存;而且怎么让缓存怎么更接近用户,离用户越近速度就越快。再一个点就是要考虑好降级方案,在异常情况下应用不被拖垮拖死。我们系统大量使用了如nginx+lua+redis技术,使用这些技术解决了我们很多读服务问题。
相关推荐
在构建前端知识框架的过程中,首先需要理解前端开发的基本概念。前端是互联网应用中与用户直接交互的部分,主要包括网页设计、用户界面(UI)和用户体验(UX)的构建。本资源包提供了一个全面的学习路径,涵盖了从...
【标题】:“基于vuecli Element构建的前端权限管理页”是指使用Vue CLI工具结合Element UI库搭建的一个前端项目,主要用于实现用户权限管理的功能。Vue CLI是Vue.js官方提供的一个脚手架工具,它极大地简化了Vue...
蛋糕构建以其简洁易读的语法和丰富的插件生态系统,深受前端开发者和全栈工程师的喜爱。 ### 1. 什么是Cake Build? 蛋糕构建(Cake Build)是一种跨平台的构建工具,它使用C#方言(基于Roslyn编译器)编写构建脚本...
适读人群 :本书适合对前端工程化有一定理解和实践的中高级前端工程师阅读,同样适合对前端工程化感兴趣的服务器端开发者以及运维人员阅读。 1.本书由周爱民老师倾情作序,美团技术总监赵强、搜狐高级技术经理邵充、...
总结,"绘本跟读_微信小程序模板js代码前台前端H5页面源码.rar"是一个关于微信小程序开发的实践案例,涉及到的技术包括H5页面构建、前端JavaScript编程、微信小程序的生命周期管理、模板使用以及语音识别功能的实现...
在IT行业中,前端开发是构建Web应用程序不可或缺的一部分。在这个领域,高效的布局系统是提升用户体验和设计美感的关键。本文将深入探讨“前端项目-grd.zip”所代表的知识点,这是一个基于Flexbox的CSS网格框架。 ...
### 使用grunt进行前端工程化构建 #### 一、引言 在前端开发领域,随着项目的复杂度不断提高,传统的手动操作已经难以满足高效开发的需求。此时,自动化构建工具应运而生,其中Grunt作为一款非常受欢迎的任务运行...
前端代码是构建现代互联网应用的关键组成部分,它涵盖了用户在浏览器中看到和交互的所有内容。前端开发者使用HTML、CSS和JavaScript等技术,将设计概念转化为实际的网页和应用程序。在这个“财务云前端代码”项目中...
在前端开发过程中,精准的布局和尺寸控制是至关重要的,特别是在构建响应式网站或需要精确像素对齐的设计时。"前端专用刻度尺.zip" 提供了一种实用的解决方案,帮助开发者更方便地进行视觉调整和尺寸测量。这个压缩...
读书笔记:基于layim前端框架和laravel后端框架构建的PCmobile网页即时聊天(IM)应用
Layui是一个轻量级、模块化、响应式的前端开发框架,广泛应用于网页开发,尤其是后台管理系统。Laychat是Layui的一个扩展,专门用于构建实时通讯的聊天界面,提供丰富的交互体验和定制化服务。 在laychat前端框架中...
开发过程中,可以使用Spring Boot或Struts等框架,它们提供了强大的MVC模式支持,帮助开发者更高效地构建和管理学生信息管理系统的前端模板。 为了更好地管理和维护前端模板,我们可以利用Webpack或Gulp等构建工具...
技术应用方面,除了基本的身份验证,身份证电子读卡服务还可以用于大数据分析,例如人口流动统计、客户画像构建等。同时,随着隐私保护意识的增强,如何在合法合规的前提下使用这些数据,也成为了一个重要的课题,...
讲解一个真实的、复杂的大型企业级亿级高并发项目,是java架构实战课程。 通过本套课程的学习,可以积累大量架构设计经验,迈入架构师行列。 课程特色: 1、完整的大型电商详情页系统架构:不再只是关注电商详情页...
在IT行业中,前端开发是构建Web应用程序不可或缺的一部分,它涉及到用户与网站或应用程序交互的所有界面。这份"前端手册"涵盖了前端开发中的关键技术,包括jQuery、JavaScript和Bootstrap,这些都是前端开发者必备的...
因此,前端应该只发送无害的参数,后端负责验证和构建安全的SQL语句。 6. **JSON**:数据交换格式中,JSON因其简洁和易读性成为首选。前端发送JSON对象到后端,后端将处理结果也转化为JSON返回。JSON支持的数据类型...
1. **Web前端基础**:前端开发是构建Web应用程序的关键部分,它负责用户在浏览器中看到和交互的所有内容。这个项目涉及到HTML、CSS和JavaScript的基础知识,HTML用于创建网页结构,CSS负责样式设计,JavaScript则...
在IT行业中,前端开发是构建Web应用程序不可或缺的一部分,它专注于用户与网站或应用的交互界面。"蓝色前端登陆模板"是一个专为创建登录页面设计的前端资源,它可以帮助开发者快速搭建一个美观且功能完整的登录界面...