`

百万级用户量的站内信群发数据库设计

 
阅读更多
随着WEB2.0的发展,用户之间的信息交互也变得十分庞大,而且实时性要求越来越高。现在很多SNS网站和一部分CMS网站都广泛地应用了站内信这一模块,这个看似简单的东西其实背后隐藏着很多需要设计师重视的设计细节,要做好这个“邮递员”是很不容易的。为什么这么说呢?下面我们就一步步来探索设计一个百万级用户量的站内信群发 数据库,看完以后你就会明白什么是真正可靠高效的“邮递员”。

1、几十——几百的用户量

这样的网站规模最小,可能是一个中小企业的CMS系统,面对这样的用户量,我们就不必要考虑短消息数据量太大的问题了,所以按照怎么方便怎么来的原则,群发就每人复制一条消息数据,这样用户可以自己管理自己的消息,可以非常方便进行“已读、未读、删除”等操作。按照这个思路,我们的数据库设计如下:

表T_Message
1
2
3
4
5
6

Id            bigint       --消息ID
SenderId      bigint       --发送者ID
ReceiverId    bigint       --接收者ID
SendTime      datetime    --发送时间
ReadFlag      tinyint     --已读标志
MessageText   text        --消息正文

这样,我们接受自己的消息时只要做如下查询:
1

SELECT * FROM T_Message WHERE ReceiverId=myid

查询自己的未读消息只要做如下查询:
1

SELECT * FROM T_Message WHERE ReceiverId=myid and ReadFlag=0

这种方法很简单,可能是我们第一个想到的,对于这样的用户量的情况这样的设计确实也足够了。



2、几千——几万的用户量

用户量到了这样的级哦别,这个网站应该算是比较大了,笔者估计,可能是一个地区性的SNS网站。那么面对这样的用户量,我们又该如何来设计站内信群发呢?上面第一种思路还行得通吗?应该这样说,如果勉强要用上面那种设计,也是可以的,只不过T_Message可能要考虑分区。但是,大家会不会觉得消息正文复制那么多条对于这样的用户量来讲空间浪费太大,因为考虑到接收者一般是不修改消息正文的,所以我们可以让所有接收者共享一条消息正文。具体数据库设计方法和上面大同小异:

T_Message
1
2
3
4
5
6

Id              bigint       --消息ID
SenderId        bigint       --发送者ID
ReceiverId      bigint       --接收者ID
SendTime        datetime    --发送时间
ReadFlag        tinyint     --已读标志
MessageTextId   bigint       --这里把消息正文内容换成消息正文Id

T_MessageText
1
2
3

Id              bigint       --ID标识
SenderId        bigint       --发送者ID
MessageText     text        --消息正文

这样,我们就大大节省了消息的存储空间,但是查询的时候就稍微麻烦一点,就需要进行联合查询了,查询自己的未读消息可以这样(意思一下,可能还有更高效的查询方式):
1
2
3

SELECT T_Message.*,T_MessageText.* FROM T_Message
INNER JOIN T_MessageText ON T_Message.MessageTextId=T_MessageText.Id
WHERE T_Message.ReceiverId=myid AND T_Message.ReadFlag=0

用这种方法除了正文我们不能随便删除外,用户还是可以自己管理自己的消息。



3、百万级大用户量

如果一个网站到了百万级的用户量了,那我不得不膜拜该网站和网站经营者了,因为经营这样的网站一直是笔者的梦想:)好了,回归正题,如果这样的系统放你面前,让你设计一个站内信群发数据库,你该何去何从,总之,上面两种常规的办法肯定是行不通了的,因为庞大的数据量会让消息表撑爆,即使你分区也无济于事。这时候作为一个系统架构师的你,可能不仅仅要从技术的角度去考虑这个问题,更要从用户实际情况去着手寻找解决问题的办法。这里,有一个概念叫“活跃用户”,即经常登录网站的用户,相对于那些一时冲动注册而接下来又从来不登录的用户来说,活跃用户对网站的忠诚度很高,从商业的角度来讲,忠诚的客户享受更高端的服务。

根据这个思路,我们来探索一种方法。假设网站有500万注册用户,其中活跃用户为60万(这个比例真很不错了),现在我们要对所有用户群发一封致谢信。还是上面两张表,首先我们可以先往消息表中插入一条群发标识为-1 的消息,这里我们用字段SourceMessageId(原始消息)来标识(-1为原始群发消息本身,其他则是原始消息id),这样其实群发的工作已经完成了,用户可以看到这条公共的消息了。但是用户需要有消息的控制权,所以必须让每个用户拥有一条自己的消息。要达到这个目的,我们可以让用户登录时检查是否已经拷贝原始消息,如果没有拷贝,则拷贝一份原始消息并插入消息表,群发标识为原始消息的id ;如果已经存在原始消息的拷贝,则什么都不做。这样,我们就只要为这60万活跃用户消耗消息空间就可以了。具体数据库设计如下:

T_Message
1
2
3
4
5
6
7

Id                  bigint       --消息ID
SenderId            bigint       --发送者ID
ReceiverId          bigint       --接收者ID,如果为原始群发消息则为-1
SendTime            datetime    --发送时间
ReadFlag            tinyint     --已读标志,如果为原始群发消息则统一为0未读
SourceMessageId     bigint       --如果为-1则为原始群发消息,其他则为原始消息id
MessageTextId       bigint       --这里把消息正文内容换成消息正文Id

表T_MessageText 与上面方法的一样。

当然,如果你的活跃用户达到100%,那这种方法相对前一种就没有优势了,但这种情况基本上不太可能,所以,笔者觉得这种方法来处理大用户量的消息群发还是可行的。



4、总结

本文只是大致阐述了实现的原理,很多细节都忽略没有考虑,纯粹一个设计想法而已,有兴趣的朋友可以去自己实践一下,另外,笔者对数据库也不是很精通,如果有哪里阐述错误的还请指出,让我们一起进步。

转【王国峰】
分享到:
评论

相关推荐

    支付交易平台数据库设计文档

    标题“支付交易平台数据库设计文档”表明本文档详细介绍了构建银行支付交易平台时所需设计的数据库架构。数据库设计是信息技术领域中极为重要的一环,尤其是在金融行业,其准确性、完整性和安全性的要求尤为严格。本...

    教务管理系统 数据库设计

    教务管理系统的数据库设计是一个复杂但至关重要的过程,它直接影响到系统的稳定运行和用户体验。通过详细的需求分析、事务需求分析、概念设计、逻辑设计以及物理设计等步骤,可以确保最终设计出的数据库既能满足当前...

    数据库设计教程(第二版)pdf

    根据提供的信息,我们可以推断出这是一本关于数据库设计的教程书籍,并且是其第二版。由于具体的页面内容并未给出,我们将基于标题、描述及标签中的信息,对可能涉及的关键知识点进行归纳总结。 ### 数据库设计的...

    全国计算机等级考试三级数据库技术.pdf

    数据库概念设计是三级数据库技术考试的重要知识点之一。该知识点主要涉及到概念设计的依据及过程、数据建模方法等方面。 * 概念设计依据:需求分析阶段的文档、信息模型、数据库概念设计说明书 * 概念设计过程:...

    数据库设计文档大全经典

    数据库设计是IT行业中至关重要的一个环节,它直接影响到系统的性能、稳定性和可扩展性。"数据库设计文档大全经典"这个压缩包文件集成了丰富的数据库设计知识,是学习和参考的宝贵资源。以下将从多个方面详细阐述其中...

    学生成绩管理系统-数据库设计

    学生成绩管理系统数据库设计 本系统的最终用户为管理员,旨在满足学校管理员对成绩管理的需求。系统的主要功能包括用户查询部分和管理员管理部分。在用户查询部分,管理员可以查询学生信息、成绩信息等。在管理员...

    人事管理系统数据库设计

    5. 安全性与权限控制:数据库设计应考虑数据的安全性,设置用户权限,防止未授权访问。例如,不同角色(如管理员、普通员工)可能有不同的数据查看和操作权限。 6. 性能与扩展性:随着学院规模的扩大,数据库需要...

    数据库毕业设计各种题目的开题报告

    数据库毕业设计是IT专业学生在学习数据库相关课程后进行的一项重要实践项目,旨在培养学生综合运用数据库理论知识和技能,解决实际问题的能力。以下是一些基于给出的题目所涉及的数据库设计与开发的关键知识点: 1....

    数据库的设计文档(设计说明书)

    数据库的设计文档,通常被称为设计说明书,是数据库开发过程中的关键组成部分。它详尽地记录了数据库的架构、逻辑关系以及物理实现方式,为数据库的创建、维护和优化提供了清晰的指导。以下是对这个主题的详细阐述:...

    商品销售管理系统数据库设计报告

    《商品销售管理系统数据库设计报告》是一份详尽的实践教程,专为正在学习数据库设计的学员,特别是参与建桥数据库实训项目的学弟学妹们准备。这份报告包含了从概念设计到实现的全过程,旨在帮助读者深入理解如何构建...

    山东大学火车票售票系统数据库课程设计

    1. **火车线路与车次管理**:数据库中会有一个车次表,包含车次编号、始发站、终点站、出发时间、到达时间等字段,用于记录火车的基本信息。这些信息对于用户查询车次、预订车票至关重要。 2. **座位与票价**:...

    图书销售管理系统数据库课程设计

    图书销售管理系统数据库课程设计是一项旨在实现书店自动化管理的实践项目,涵盖了用户管理、图书管理、图书销售管理、查询管理、报表查询以及数据管理等多个关键功能。以下是对这些功能的详细阐述: 1. 用户管理:...

    数据库课程实验13——网上书店管理系统数据库设计

    华科数据库课程实验13——网上书店管理系统数据库设计。压缩文件包括一个sql文件和WORD文档,其中SQL为初步实现的数据库文件;WORD文档描述了需求分析、数据字典、ER图、ER图转换为关系模式以及初步具体实验代码截图...

    【整理】数据库面试题索引sql优化+数据库SQL优化总结之百万级数据库优化

    1. **数据库架构设计**:在百万级数据量下,合理的设计能避免性能瓶颈,如垂直分割、水平分割,以及读写分离策略。 2. **缓存与预热**:使用内存数据库如Redis或Memcached来缓存热点数据,减少对主数据库的压力;...

    数据库课程设计-JAVA实现学生信息管理系统

    在本项目中,“数据库课程设计-JAVA实现学生信息管理系统”是一个用Java编程语言开发的教育实践项目,旨在帮助学习者理解和应用数据库管理系统的概念。这个系统主要目标是管理和操作学生的信息,提供一个用户友好的...

    java数据库课程设计之学生信息管理系统

    《Java数据库课程设计之学生信息管理系统》 在Java数据库课程设计中,学生信息管理系统是一个典型的应用实例,旨在训练学生将理论知识与实际编程相结合的能力。这个系统涉及到的主要知识点包括Java编程语言、数据库...

    数据库三级体系

    数据库三级体系是数据库系统设计中的一个重要概念,它包括三个层面:用户级(外模式)、概念级(概念模式)和物理级(内模式)。这种分级设计有助于管理和组织复杂的数据结构,并确保数据的一致性和安全性。 #### ...

    在线考试系统数据库设计

    通过以上设计,我们可以构建出一个完整的在线考试系统数据库,满足用户管理、考试组织、试题库管理、成绩统计等核心功能。同时,为了提高查询效率,还可以考虑对频繁查询的字段进行索引优化,确保系统的高效运行。...

    数据库课程设计——物业管理系统

    7. **GUI设计与开发**:利用Java Swing、JavaFX、Qt或.NET Framework等工具,设计和实现用户友好的图形界面,使用户能方便地与数据库交互。 8. **异常处理与日志记录**:编写健壮的代码,捕获并处理可能出现的错误...

    实验室设备管理系统(数据库设计)

    《实验室设备管理系统数据库设计详解》 实验室设备管理系统的数据库设计是一项关键任务,它涉及到系统功能的高效实现和数据的妥善存储。在这个系统中,数据库设计不仅要满足实验室设备管理的日常需求,如设备的登记...

Global site tag (gtag.js) - Google Analytics