互联网架构 -- 高可用 -

youyu4

浏览: 449982 次

最近访客更多访客>>

紫藤萝

leetaedong2018

shenzlly

caplike

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

互联网架构 -- 高可用

博客分类：

架构--学习

互联网架构 -- 高可用

什么是高可用

高可用HA(High Availability)是分布式系统架构设计中必须考虑的因素之一，它通常是指，通过设计减少系统不能提供服务的时间。

高可用标准

假设系统一直能够提供服务，我们说系统的可用性是100%。
如果系统每运行100个时间单位，会有1个时间单位无法提供服务，我们说系统的可用性是99%。
很多公司的高可用目标是4个9，也就是99.99%，这就意味着，系统的年停机时间为8.76个小时。

高可用例子

百度的搜索首页，是业内公认高可用保障非常出色的系统，甚至人们会通过www.baidu.com 能不能访问来判断“网络的连通性”，百度高可用的服务让人留下啦“网络通畅，百度就能访问”，“百度打不开，应该是网络连不上”的印象，这其实是对百度HA最高的褒奖。

如何保障系统的高可用

集群化（冗余去单点）
自动故障转移

集群化

我们都知道，单点是系统高可用的大敌，单点往往是系统高可用最大的风险和敌人，应该尽量在系统设计的过程中避免单点。方法论上，高可用保证的原则是“集群化”，或者叫“冗余”：只有一个单点，挂了服务会受影响;如果有冗余备份，挂了还有其他backup能够顶上。

自动故障转移

有了冗余之后，还不够，每次出现故障需要人工介入恢复势必会增加系统的不可服务实践。所以，又往往是通过“自动故障转移”来实现系统的高可用。

常见的互联网分层架构

常见互联网分布式架构如上，分为：

1. 客户端层：典型调用方是浏览器browser或者手机应用APP

2. 反向代理层：系统入口，反向代理

3. 站点应用层：实现核心应用逻辑，返回html或者json

4. 服务层：如果实现了服务化，就有这一层；如果没有，有站点应用层就够了

5. 数据-缓存层：缓存加速访问存储

6.数据-数据库层：数据库固化数据存储

整个系统的高可用，又是通过每一层的集群化 + 自动故障转移来综合实现的。

【客户端层->反向代理层】的高可用

集群化

以nginx为例：有两台或多台nginx，一台对线上提供服务，另一台冗余以保证高可用，常见的实践是 keepalived 存活探测，相同virtual IP提供服务。

自动故障转移

当nginx挂了的时候，keepalived能够探测到，会自动的进行故障转移，将流量自动迁移到shadow-nginx，由于使用的是相同的virtual IP，这个切换过程对调用方是透明的。

【反向代理层->站点层】的高可用

集群化

假设反向代理层是nginx，nginx.conf里能够配置多个web后端，并且nginx能够探测到多个后端的存活性。其实我们也可以用云平台（如：AWS）代替nginx做负载均衡，同时也可以监控流量。

自动故障转移

当web-server挂了的时候，nginx能够探测到，会自动的进行故障转移，将流量自动迁移到其他的web-server，整个过程由nginx自动完成，对调用方是透明的。

【站点层->服务层】的高可用

集群化

服务层集群化是通过服务层的冗余来实现的。“服务连接池”会建立与下游服务多个连接，每次请求会“随机”选取连接来访问下游服务。

自动故障转移

当service挂了的时候，service-connection-pool能够探测到，会自动的进行故障转移，将流量自动迁移到其他的service，整个过程由连接池自动完成，对调用方是透明的(所以说RPC-client中的服务连接池是很重要的基础组件)。

【服务层>缓存层】的高可用

集群化：方法一

利用客户端的封装，service对cache进行双读或者双写，这样就不需要考虑自动故障转移，因为已经有多台缓存数据库做集群，当然读写的时候会比较耗时。

集群化：方法二

缓存层也可以通过支持主从同步的缓存集群来解决缓存层的高可用问题。redis天然支持主从同步，redis官方也有sentinel哨兵机制，来做redis的存活性检测。

自动故障转移

当redis主挂了的时候，sentinel能够探测到，会通知调用方访问新的redis，整个过程由sentinel和redis集群配合完成，对调用方是透明的。

允许“cache miss”

说完缓存的高可用，这里要多说一句，业务对缓存并不一定有“高可用”要求，更多的对缓存的使用场景，是用来“加速数据访问”：把一部分数据放到缓存里，如果缓存挂了或者缓存没有命中，是可以去后端的数据库中再取数据的。

应对“cache miss”的缓存架构建议

1. 将kv缓存封装成服务集群，上游设置一个代理(代理可以用集群冗余的方式保证高可用)，代理的后端根据缓存访问的key水平切分成若干个实例，每个实例的访问并不做高可用。

2. 缓存实例挂了屏蔽：当有水平切分的实例挂掉时，代理层直接返回cache miss，此时缓存挂掉对调用方也是透明的。key水平切分实例减少，不建议做re-hash，这样容易引发缓存数据的不一致。

【服务层>数据库层】的高可用

大部分互联网技术，数据库层都用了“主从同步，读写分离”架构，所以数据库层的高可用，又分为：

读库高可用
写库高可用

读库高可用

其实是通过读库的冗余来实现的。既然冗余了读库，一般来说就至少有2个从库，“数据库连接池”会建立与读库多个连接，每次请求会路由到这些读库。

自动故障转移

当读库挂了的时候，db-connection-pool能够探测到，会自动的进行故障转移，将流量自动迁移到其他的读库，整个过程由连接池自动完成，对调用方是透明的(所以说DAO中的数据库连接池是很重要的基础组件)。

写库高可用

其实是通过写库的冗余来实现的。可以设置两个mysql双主同步，一台对线上提供服务，另一台冗余以保证高可用，常见的实践是keepalived存活探测，相同virtual IP提供服务。

自动故障转移

当写库挂了的时候，keepalived能够探测到，会自动的进行故障转移，将流量自动迁移到shadow-db-master，由于使用的是相同的virtual IP，这个切换过程对调用方是透明的。

总结

高可用HA(High Availability)是分布式系统架构设计中必须考虑的因素之一，它通常是指，通过设计减少系统不能提供服务的时间。

方法论上：高可用是通过冗余+自动故障转移来实现的。

步骤如下：

1.【客户端层】到【反向代理层】的高可用，是通过反向代理层的冗余实现的，常见实践是keepalived + virtual IP自动故障转移

2.【反向代理层】到【站点层】的高可用，是通过站点层的冗余实现的，常见实践是nginx与web-server之间的存活性探测与自动故障转移

3.【站点层】到【服务层】的高可用，是通过服务层的冗余实现的，常见实践是通过service-connection-pool来保证自动故障转移

4.【服务层】到【缓存层】的高可用，是通过缓存数据的冗余实现的，常见实践是缓存客户端双读双写，或者利用缓存集群的主从数据同步与sentinel保活与自动故障转移;更多的业务场景，对缓存没有高可用要求，可以使用缓存服务化来对调用方屏蔽底层复杂性

5.【服务层】到【数据库“读”】的高可用，是通过读库的冗余实现的，常见实践是通过db-connection-pool来保证自动故障转移

6.【服务层】到【数据库“写”】的高可用，是通过写库的冗余实现的，常见实践是keepalived + virtual IP自动故障转移

查看图片附件

分享到：

互联网架构 -- 高并发 | 互联网项目架构

2017-09-07 18:08
浏览 582
评论(0)
分类:企业架构
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

互联网架构 -- 高可用

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

互联网架构 -- 高可用

评论

发表评论

相关推荐

分布式事务解决方案

分布式应用雪崩效用

分布式ID生成方法

互联网一致性架构设计 -- 库存扣除一致性

互联网一致性架构设计 -- 事务一致性

互联网一致性架构设计 -- 消息时序一致性

互联网一致性架构设计 -- 冗余表数据一致性

互联网一致性架构设计 -- DB和Cache一致性

互联网一致性架构设计 -- DB双主一致性

互联网一致性架构设计 -- DB主从一致性

互联网一致性架构设计 -- session一致性

缓存架构设计

DNS轮询是否可被完全替代

互联网架构 -- 负载均衡

互联网架构 -- 高并发

互联网架构 -- 高并发

互联网项目架构

如何构建一个安全, 稳定, 高效的互联网平台体系架构

互联网系统架构的变迁

关于HTTP和HTTPS的安全问题

最近访客更多访客>>