`
javafan_303
  • 浏览: 957923 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

58同城数据库软件架构设计与实践

 
阅读更多

转载自

http://mp.weixin.qq.com/s?__biz=MjM5ODYxMDA5OQ==&mid=400465735&idx=1&sn=8d7067de4cc8f73ea5558f07e0a9340e&scene=0#wechat_redirect

缘起:受@萧田国 萧总邀请,上周五晚上在“高效运维1号群”内分享了《58同城数据库软件架构设计与实践》(这个topic今年在数据库大会上分享过),应组织方要求,发出纪要。


一、基本概念

二、数据库架构设计思路

1)可用性

2)读性能

3)一致性

4)扩展性

 


一、基本概念

概念一“单库”

 

概念二“分片”


分片解决的是“数据量太大”的问题,也就是通常说的“水平切分”。

一旦引入分片,势必有“数据路由”的概念,哪个数据访问哪个库。

 

路由规则通常有3种方法:

1范围range

优点:简单,容易扩展

缺点:各库压力不均(新号段更活跃)

2哈希hash

优点:简单,数据均衡,负载均匀

缺点:迁移麻烦(2库扩3库数据要迁移)

3路由服务router-config-server

优点:灵活性强,业务与路由算法解耦

缺点:每次访问数据库前多一次查询

 

大部分互联网公司采用的方案二:哈希分库,哈希路由

 

概念三“分组”


分组解决“可用性”问题,分组通常通过主从复制的方式实现。

 

互联网公司数据库实际软件架构是:又分片,又分组(如下图)

 


二、数据库架构设计思路

数据库软件架构师平时设计些什么东西呢?至少要考虑以下四点:

1)如何保证数据可用性

2)如何提高数据库读性能(大部分应用读多写少,读会先成为瓶颈)

3)如何保证一致性

4)如何提高扩展性


2.1如何保证数据的可用性?

解决可用性问题的思路是=>冗余

如何保证站点的可用性?复制站点,冗余站点

如何保证服务的可用性?复制服务,冗余服务

如何保证数据的可用性?复制数据,冗余数据

 

数据的冗余,会带来一个副作用=>引发一致性问题(先不说一致性问题,先说可用性)

 

如何保证数据库“读”高可用?

冗余读库


冗余读库带来的副作用?读写有延时,可能不一致

上面这个图是很多互联网公司mysql的架构,写仍然是单点,不能保证写高可用。

 

如何保证数据库“写”高可用?

冗余写库


采用双主互备的方式,可以冗余写库

带来的副作用?双写同步,数据可能冲突(例如“自增id”同步冲突),如何解决同步冲突,有两种常见解决方案:

1)两个写库使用不同的初始值,相同的步长来增加id1写库的id0,2,4,6...2写库的id1,3,5,7…

2)不使用数据的id,业务层自己生成唯一的id,保证数据不冲突

 

58同城没有使用上述两种架构来做读写的“高可用”,58同城采用的是“双主当主从用”的方式


仍是双主,但只有一个主提供服务(读+写),另一个主是“shadow-master”,只用来保证高可用,平时不提供服务。

master挂了,shadow-master顶上(vip漂移,对业务层透明,不需要人工介入)

这种方式的好处

1)读写没有延时

2)读写高可用

不足

1)不能通过加从库的方式扩展读性能

2)资源利用率为50%,一台冗余主没有提供服务

 

那如何提高读性能呢?进入第二个话题,如何提供读性能。


2.2如何扩展读性能?

提高读性能的方式大致有三种,第一种是建立索引这种方式不展开,要提到的一点是,不同的库可以建立不同的索引


写库不建立索引;

线上读库建立线上访问索引,例如uid

线下读库建立线下访问索引,例如time

 

第二种扩充读性能的方式是,增加从库,这种方法大家用的比较多,但是,存在两个缺点:

1)从库越多,同步越慢

2)同步越慢,数据不一致窗口越大(不一致后面说,还是先说读性能的提高)

 

58同城没有采用这种方法提高数据库读性能(没有从库),采用的是增加缓存常见的缓存架构如下:


上游是业务应用,下游是主库,从库(读写分离),缓存。

 

58同城的玩法是:服务+数据库+缓存一套


业务层不直接面向dbcache,服务层屏蔽了底层dbcache的复杂性。为什么要引入服务层,今天不展开,58采用了“服务+数据库+缓存一套”的方式提供数据访问,用cache提高读性能。

 

不管采用主从的方式扩展读性能,还是缓存的方式扩展读性能,数据都要复制多份(主+从,db+cache),一定会引发一致性问题。


2.3如何保证一致性?

主从数据库的一致性,通常有两种解决方案:

1)中间件


如果某一个key有写操作,在不一致时间窗口内,中间件会将这个key的读操作也路由到主库上。

这个方案的缺点是,数据库中间件的门槛较高(百度,腾讯,阿里,360等一些公司有,当然58也有)

2)强制读主


58的“双主当主从用”的架构,不存在主从不一致的问题。

 

第二类不一致,是db与缓存间的不一致


常见的缓存架构如上,此时写操作的顺序是

1)淘汰cache

2)写数据库

读操作的顺序是

1)读cache,如果cache hit则返回

2)如果cache miss,则读从库

3)读从库后,将数据放回cache

 

在一些异常时序情况下,有可能从【从库读到旧数据(同步还没有完成),旧数据入cache后】,数据会长期不一致。

 

解决办法是“缓存双淘汰”,写操作时序升级为:

1)淘汰cache

2)写数据库

3)在经验“主从同步延时窗口时间”后,再次发起一个异步淘汰cache的请求

 

这样,即使有脏数据如cache,一个小的时间窗口之后,脏数据还是会被淘汰。带来的代价是,多引入一次读miss(成本可以忽略)。

 

除此之外,58同城的最佳实践之一是:建议为所有cache中的item设置一个超时时间。

 

说完一致性,最后一个话题是扩展性。


2.4如何提高数据库的扩展性?

原来用hash的方式路由,分为2个库,数据量还是太大,要分为3个库,势必需要进行数据迁移,58同城有一个很帅气的“数据库秒级扩容”方案。

如何秒级扩容?

首先,我们不做2库变3库的扩容,我们做2库变4(库加倍)的扩容(未来4->8->16

服务+数据库是一套(省去了缓存)

数据库采用“双主”的模式。

 

扩容步骤

第一步,将一个主库提升

第二步,修改配置,2库变4库(原来MOD2,现在配置修改后MOD4

扩容完成

MOD2为偶的部分,现在会MOD40或者2

MOD2为奇的部分,现在会MOD41或者3

数据不需要迁移,同时,双主互相同步,一遍是余0,一边余2,两边数据同步也不会冲突,秒级完成扩容!

 

最后,要做一些收尾工作:

1)将旧的双主同步解除

2)增加新的双主(双主是保证可用性的,shadow-master平时不提供服务)

3)删除多余的数据(余0的主,可以将余2的数据删除掉)


这样,秒级别内,我们就完成了2库变4库的扩展。


OK,今天主要分享了58同城,数据库软件架构上:

1)如何保证数据可用性

2)如何提高数据库读性能

3)如何保证数据一致性

4)如何进行秒级扩容

希望大家有收获,谢谢大家!

分享到:
评论

相关推荐

    MongoDB在58同城的应用实践.pdf

    本文将详细介绍 MongoDB 在 58 同城的应用实践,包括为什么选择 MongoDB、MongoDB 在 58 同城的架构设计与实践、数据设计、部署和监控等方面。 为什么选择 MongoDB? MongoDB 的可扩展性和高可用性是其主要优势。...

    互联网数据库架构设计最佳实践.docx

    【互联网数据库架构设计最佳实践】 在互联网环境中,数据库架构设计是一项关键任务,它涉及到系统的可用性、读写性能、一致性以及扩展性等多个方面。本文主要探讨了几个关键的设计思路和解决方案。 1. 可用性设计...

    互联网数据库架构设计.docx

    58同城的实践提供了多种解决方案,包括复制与冗余、读写分离、索引策略、缓存管理和动态扩展等,以应对互联网服务的高并发和大数据挑战。对于每个环节,都需要细致地权衡利弊,确保系统的稳定性和高效性。

    58同城人工智能平台架构实践.pdf

    包括“大数据分析与生态系统论坛”、“深度学习论坛”、“推荐系统论坛”、“大数据安全与政策论坛”、“大数据可视分析论坛”、“精准医疗大数据论坛”、“数据科学与大数据技术教育论坛”、“数据库论坛”、“金融...

    58同城高级系统架构师带你实战MongoDB集群分布式存储

    - 在58同城的实际应用中,MongoDB集群被广泛应用于用户行为分析、广告推荐系统等多个场景。通过对数据进行合理的分片和副本集配置,实现了高并发访问下的稳定运行。 - 例如,在用户行为分析系统中,根据用户的ID...

    沈剑-58数据库架构.pdf

    根据给定文件的信息,我们可以提炼出一系列与数据库架构相关的知识点,包括基本概念、58同城在实际业务场景中的最佳实践以及这些实践所面临的挑战和解决方案。以下是对这些内容的详细阐述: ### 基本概念 #### 单...

    仿58同城源代码

    【仿58同城源代码】是一个用于学习和参考的项目,旨在模仿国内知名分类信息服务网站58同城的功能和设计。这个源代码可以帮助开发者理解和构建类似的本地生活服务平台,提供包括但不限于二手物品交易、房屋租赁、招聘...

    58同城流式语音识别引擎实践-SACC2021年中国系统架构师大会.pdf

    58同城流式语音识别引擎的实践涉及到其整体架构的设计。引擎的接入层支持多种平台,如iOS、Android、Java SDK等,这使得它能够接入不同的客户端设备。在服务逻辑层,58同城使用了实时语音服务、语音接入服务、静音...

    58同城mysql分库分表实践

    为了解决这一问题,58同城的技术中心分享了他们在MySQL数据库上的分库分表实践,这是一个非常有价值的技术实践,可以帮助理解如何在大数据环境下扩展MySQL数据库。 首先,文档提出了几个基本概念,包括分片...

    大数据量下58同城MySQL实践-技术方案

    总的来说,这份58同城的大数据量下MySQL实践技术方案,涵盖了从存储策略、索引优化、缓存管理、监控调优到分布式架构的全面内容,是理解如何在大数据环境下驾驭MySQL的宝贵资料。通过对这些知识点的学习和实践,可以...

    最新58同城源码

    - `3G`: 可能是指移动版或者适配不同设备的页面,表明58同城在设计时考虑到了多终端访问。 - `yi`: 未提供具体信息,可能是一个项目初始目录,包含了项目的配置或者初始化文件。 - `Index.asp`: 网站的主页,展示...

    58同城 研发类笔试

    7. **系统分析与设计**:考察对大型系统的设计能力,包括架构设计、模块划分、接口设计、性能优化等方面。 8. **软件工程**:了解敏捷开发、版本控制(Git等)、持续集成/持续部署(CI/CD)等现代软件开发流程。 9...

    7-1+58同城风控智能化实践.pdf

    【58同城风控智能化实践】 在当今的互联网时代,信息安全成为了各家企业必须重视的问题,特别是对于像58同城这样的本地生活服务平台,其业务涉及到房产、招聘、二手车等多个领域,因此,风险管理至关重要。58同城的...

    android 58同城

    综上所述,Android平台上的58同城应用在开发过程中涵盖了众多技术和知识,包括但不限于Android SDK、Java/Kotlin编程、数据库管理、网络请求、UI设计、动画实现、性能优化以及安全性保障。这些技术的巧妙运用,共同...

    100亿数据1万属性数据架构设计

    ### 数据架构设计——100亿数据1万属性下的高效解决方案 #### 一、背景与业务介绍 在当今数字化时代,随着数据量的急剧增长,企业和组织面临着前所未有的挑战,尤其是在处理大规模数据集时。本篇文章针对的是一个...

    PHP实例开发源码-php高仿赶集网58同城源码.zip

    总结,通过学习和分析这份php高仿赶集网58同城的源码,开发者不仅可以掌握PHP的基本语法和Web开发技巧,还能深入了解大型网站的架构设计、数据处理和安全性控制。实践出真知,对于提升PHP编程能力,这是一个很好的...

    各大型网站架构讲解

    3. **58同城高性能移动push推送平台架构优化之路**: 孙玄的议题关注了58同城如何构建和优化推送服务,这通常涉及到大规模消息队列、实时消息处理、推送通知服务的稳定性和效率。可能涵盖的技术有Apache Kafka、...

    基于PHP的仿58同城php地方分类信息整站基于phpmps源码.zip

    【描述】中的信息与标题一致,再次强调这是一个基于PHP的项目,目的是模仿58同城的网站架构和功能。"php地方分类信息整站"意味着该源码包括了建立一个完整网站所需的各个部分,如前端用户界面、后台管理系统、数据库...

    2016年 58校园招聘笔试

    6. **软件工程与设计模式**:软件生命周期管理、敏捷开发、设计模式等,反映了应聘者的软件工程素养。能够运用合适的设计模式解决实际问题,能提高代码的可维护性和可扩展性。 7. **计算机系统基础**:包括计算机...

Global site tag (gtag.js) - Google Analytics