在线人数统计业务是我们开发web肯定要设计的业务逻辑,本文就会给出几种设计方案,来分析下各个方案的优缺点:
- 使用有序集合
这种方案能够同时储存在线的用户 和 用户上线时间,能够执行非常多的聚合计算,但是所消耗的内存也是非常可观的。
- 使用集合
这种方案能储存在线的用户,也能够执行一定的聚合计算,相对有序集合,所消耗的内存要小些,但是随着用户量的增多,消耗内存空间也处于增加状态
- 使用hyperloglog
这种方案无论统计多少在线用户, 消耗的内存都是12k,但是只能给出在线用户的统计信息,无法获取准确的在线用户名单
- 使用bitmap
这种方案还是比较好的,在尽可能节省内存空间情况下,记录在线用户的情况,而且能做一定的聚合运算
下面我们就用实际例子来说明:
我们先以每天会有10w~30w的小量用户, 100w的用户群来说明下面的几种方案
方案一:使用有序集合
先生成用户在线记录数据:
- $start_time = mktime(0, 0, 0, 9, 5); //monday
- for ($i=0; $i < 6; $i++) {
- $day_start_time = $start_time + 86400 * $i; //every day begin time
- $day_end_time = $day_start_time + 86400; //every day end time
- $online_user_num = mt_rand(100000, 300000); //online user between 100000 and 300000
- for ($j=1; $j < $online_user_num; $j++) {
- $user_id = mt_rand(1, 1000000);
- $redis->zadd('000|online_users_day_'.$i, mt_rand($day_start_time, $day_end_time), $user_id);
- }
- }
好了记下来我们就来看看都能统计出哪些信息来吧
- //note: 统计每天的在线总人数
- for ($i=0; $i < 6; $i++) {
- print_r($redis->zsize('000|online_users_day_'.$i). "\n");
- }
- //note: 统计最近6天都在线的人数
- var_dump($redis->zInter('000|online_users_day_both_6',
- [
- '000|online_users_day_0',
- '000|online_users_day_1',
- '000|online_users_day_2',
- '000|online_users_day_3',
- '000|online_users_day_4',
- '000|online_users_day_5'
- ]
- ));
- //note: 统计出近6天中共有多少上线
- $redis->zunion('000|online_users_day_total_6', ['000|online_users_day_0', '000|online_users_day_1', '000|online_users_day_2', '000|online_users_day_3', '000|online_users_day_4', '000|online_users_day_5']);
- //note: 统计某个时间段总共在线用户
- print_r($redis->zcount('000|online_users_day_5', mktime(13, 0, 0, 9, 10), mktime(14, 0, 0, 9, 10)));
- //note: 统计某个时间段在线用户名单
- print_r($redis->zrangebyscore('000|online_users_day_5', mktime(13, 0, 0, 9, 10), mktime(14, 0, 0, 9, 10),
- array('withscores' => TRUE)));
不单单只有这些, 我们还能统计出早, 中, 午, 晚 等等时间段的用户在线情况,还有很多其他的,这就让我们发挥想象吧,是不是挺多的? 只是确实也相当耗费内存空间
方案二:使用集合
还是先来成用户在线记录数据:
- //note set 一般聚合
- for ($i=0; $i < 6; $i++) {
- $online_user_num = mt_rand(100000, 300000); //online user between 100000 and 300000
- for ($j=1; $j < $online_user_num; $j++) {
- $user_id = mt_rand(1, 1000000);
- $redis->sadd('001|online_users_day_'.$i, $user_id);
- }
- }
好了记下来我们就来看看都能统计出哪些信息来吧
- //note 判断某个用户是否在线
- var_dump($redis->sIsMember('001|online_users_day_5', 100030));
- //note 每天在线用户总量的统计
- for ($i=0; $i < 6; $i++) {
- print_r($redis->ssize('001|online_users_day_'.$i). "\n");
- }
- //note 对不同时间段的在线用户名单进行聚合
- print_r($redis->sInterStore('001|online_users_day_both_4and5', '001|online_users_day_4', '001|online_users_day_5'). "\n");
- //note 对指定的时间段的在线用户名单进行统计
- print_r($redis->sUnionStore('001|online_users_day_total_4add5', '001|online_users_day_4', '001|online_users_day_5'). "\n");
- //note 哪天上线哪天没上线
- print_r($redis->sDiffStore('001|online_users_day_diff_4jian5', '001|online_users_day_4', '001|online_users_day_5'). "\n");
是不是也挺不错的,先不要着急, 我们接着往下看
方案三:使用hyperloglgo
先来成用户在线记录数据:
- // note HyperLogLog 只需要知道在线总人数
- for ($i=0; $i < 6; $i++) {
- $online_user_num = mt_rand(100000, 300000); //online user between 100000 and 300000
- var_dump($online_user_num);
- for ($j=1; $j < $online_user_num; $j++) {
- $user_id = mt_rand(1, 1000000);
- $redis->pfadd('002|online_users_day_'.$i, [$user_id]);
- }
- }
这种方案,我们来看看都能实现哪些业务呢
- $count = 0;
- for ($i=0; $i < 3; $i++) {
- $count += $redis->pfcount('002|online_users_day_'.$i);
- print_r($redis->pfcount('002|online_users_day_'.$i). "\n");
- }
- var_dump($count);
- //note 3 days total online num
- var_dump($redis->pfmerge('002|online_users_day_both_3', ['002|online_users_day_0', '002|online_users_day_1', '002|online_users_day_2']));
- var_dump($redis->pfcount('002|online_users_day_both_3'));
好少啊,是的, 这种方案仅仅只能统计出某个时间段在线人数的总量, 对在线用户的名单却无能为力,但是却挺节省内存的,对统计数据要求不多情况下 ,我们便可以考虑这种方案。
方案四:使用bitmap
笔者对这种方案其实挺喜欢的,消耗的内存空间不多, 统计的信息却挺多的,还是老步骤,先来生成数据:
- //note bitmap 综合前面3个的优缺点
- for ($i=0; $i < 6; $i++) {
- $online_user_num = mt_rand(100000, 300000); //online user between 100000 and 300000
- for ($j=1; $j < $online_user_num; $j++) {
- $user_id = mt_rand(1, 1000000);
- $redis->setbit('003|online_users_day_'.$i, $user_id, 1);
- }
- }
接下来我们看看能满足的统计信息吧
- //note userid today whether online
- var_dump($userid = mt_rand(1, 1000000));
- var_dump($redis->getbit('003|online_users_day_5', $userid));
- //note how many user is online
- var_dump($redis->bitcount('003|online_users_day_5'));
- //note 6 days both online
- var_dump($redis->bitop('AND', '003|online_users_day_both_6', '003|online_users_day_0', '003|online_users_day_1', '003|online_users_day_2', '003|online_users_day_3', '003|online_users_day_4', '003|online_users_day_5'));
- var_dump($redis->bitcount('003|online_users_day_both_6'));
- //note 6 days total online
- var_dump($redis->bitop('OR', '003|online_users_day_total_6', '003|online_users_day_0', '003|online_users_day_1', '003|online_users_day_2', '003|online_users_day_3', '003|online_users_day_4', '003|online_users_day_5'));
- var_dump($redis->bitcount('003|online_users_day_total_6'));
- //note 6 days only one online
- var_dump($redis->bitop('XOR', '003|online_users_day_only_one_6', '003|online_users_day_0', '003|online_users_day_1', '003|online_users_day_2', '003|online_users_day_3', '003|online_users_day_4', '003|online_users_day_5'));
- var_dump($redis->bitcount('003|online_users_day_only_one_6'));
怎么样? 是不是集合能统计的 这家伙也能统计出来? 而且消耗的内容还少。
对于这几种方案其实各有各的好处, 根据业务统计信息 来取相应的方案来实施吧,这样内存利用也就更合理了
相关推荐
**Redis与LabVIEW的整合:RedisinLabVIEW和LabVIEWRedis工具包** Redis是一个高性能的键值数据库,常用于数据缓存和消息队列。它支持丰富的数据类型,包括字符串、哈希表、列表、集合和有序集合。在LabVIEW...
Redis 是一个开源的内存数据结构存储系统,常被用作数据库、缓存和消息代理。在Windows环境下,Redis 的安装和使用与在Linux系统中有所不同。这里我们将详细讨论Windows版Redis 5.0.14的相关知识点。 1. **Redis ...
最近需要在C#中使用Redis,在Redis的官网找到了ServiceStack.Redis,最后在测试的时候发现这是个坑,4.0已上已经收费,后面只好找到3系列的最终版本,最后测试发现还是有BUG或者是我不会用。没有办法,最好找到了...
在Linux系统中安装Redis是一个常见的任务,特别是在搭建服务器或开发基于Redis的数据缓存应用时。Redis是一个开源的、高性能的键值对存储系统,适用于数据缓存、消息队列等多种场景。本文将详细介绍如何在Linux上...
Redis,全称Remote Dictionary Server,是一款开源的、高性能的键值对存储系统,常被用作数据缓存、消息队列以及数据库等角色。它的设计目标是速度和数据持久化,支持多种数据结构,如字符串、哈希表、列表、集合、...
Redis,全称Remote Dictionary Server,是一款开源的、高性能的键值存储系统,广泛应用于缓存、消息队列、数据持久化等多种场景。它以其高效、轻量级的特性,在IT行业中备受青睐,尤其是在互联网领域。在Windows环境...
redis部署6.2.6最新稳定版文档和程序redis部署6.2.6最新稳定版文档和程序redis部署6.2.6最新稳定版文档和程序redis部署6.2.6最新稳定版文档和程序redis部署6.2.6最新稳定版文档和程序redis部署6.2.6最新稳定版文档和...
Redis是一款高性能的键值对数据库,常用于缓存、消息队列等场景。在Windows操作系统上运行Redis,通常需要借助一些额外的工具。标题提到的"redis在win上的运行脚本redis.bat"就是一个帮助用户在Windows环境下启动...
Redis是世界上最受欢迎的开源内存数据结构存储系统,它可以用作数据库、缓存和消息代理。在Windows 64位环境下,Redis的安装和卸载过程是很多开发者和系统管理员需要了解的重要技能。以下是对这些知识点的详细说明:...
Redis Desktop Manager是一款强大的开源图形化界面工具,专为管理和操作Redis键值存储系统而设计。它为用户提供了直观且高效的界面,使得在处理Redis数据库时能够更加便捷。这个压缩包包含的就是这款工具的安装文件...
基于前后端分离的应用,无论是否使用Redis,都需要考虑如何进行数据的存储和缓存。下面我将分别介绍基于Redis和无Redis的两种版本的特点。 基于Redis的版本 特点 缓存处理:Redis作为内存数据库可以用来缓存频繁访问...
Redis是一款高性能的键值对内存数据库,被广泛应用于缓存、数据存储等领域。在这个Windows 64位版本的Redis 7.0.5中,我们能够看到一系列关键组件和配置文件,这使得它能够在Windows环境下运行。以下是关于Redis ...
Redis7.0.4.zip,解压缩到D盘根目录后,安装后启动为Windows服务 注意是windows 64位系统才可使用,不支持windows 32位系统使用 已经在Win10,Win11,Windows server 2012系统测试运行可用 使用步骤注意事项: ...
Redis,全称Remote Dictionary Server,是一款高性能的键值存储数据库,常用于缓存、消息队列等场景。本文将深入探讨Redis的可视化工具及其免安装绿色版的使用,帮助你更好地管理和操作Redis服务器。 首先,了解...
Redis 是一个高性能的键值数据库,它以键值对的形式存储数据,广泛应用于缓存、消息中间件、实时分析等领域。在 Windows 环境下,通常需要通过安装过程来设置 Redis 服务,但这里提供的资源是“redis 免安装”,意味...
在Windows上安装Redis的过程涉及到多个步骤,包括启用必要的Windows功能、安装WSL2(Windows Subsystem for Linux 2)、设置默认WSL版本以及在Linux环境中安装Redis。以下是对这些步骤的详细说明: 1. **启用...
Redis 使用教程详解 Redis 是一个高性能的 NoSQL 键值存储数据库,广泛应用于缓存、任务列表、网站访问统计数据、过期处理、应用排行榜、分布式集群架构中的 session 分离等领域。下面是 Redis 的详细使用教程。 ...
(1)支持Lua脚本:Redis 3.0支持Lua脚本,可以在Redis中执行脚本,大大提高了Redis的灵活性和可扩展性; (2)可插拔模块化:Redis 3.0提供了可插拔的模块化功能,可以根据用户的需求,自定义模块,实现不同的功能...
Redis是一款高性能的键值存储系统,常用于数据库、缓存和消息代理等场景。它支持丰富的数据类型,如字符串、哈希、列表、集合和有序集合。在Windows平台上使用Redis,通常需要通过编译源码或者寻找预编译的二进制...
"Redis++使用说明,windows下编译Redis-Plus-Plus" 在这篇文章中,我们将详细介绍如何在Windows平台下编译Redis++,包括编译hiredis.lib和Win32_Interop.lib静态库文件的过程,然后安装Cmake并编译Redis++,最后...