丰富的数据结构使得redis的设计非常的有趣。不像关系型数据库那样,DEV和DBA需要深度沟通,review每行sql语句,也不像memcached那样,不需要DBA的参与。redis的DBA需要熟悉数据结构,并能了解使用场景。
下面举一些常见适合kv数据库的例子来谈谈键值的设计,并与关系型数据库做一个对比,发现关系型的不足之处。
用户登录系统
记录用户登录信息的一个系统, 我们简化业务后只留下一张表。
关系型数据库的设计
mysql> select * from login; +---------+----------------+-------------+---------------------+ | user_id | name | login_times | last_login_time | +---------+----------------+-------------+---------------------+ | 1 | ken thompson | 5 | 2011-01-01 00:00:00 | | 2 | dennis ritchie | 1 | 2011-02-01 00:00:00 | | 3 | Joe Armstrong | 2 | 2011-03-01 00:00:00 | +---------+----------------+-------------+---------------------+
user_id表的主键,name表示用户名,login_times表示该用户的登录次数,每次用户登录后,login_times会自增,而last_login_time更新为当前时间。
REDIS的设计
关系型数据转化为KV数据库,我的方法如下:
key 表名:主键值:列名
value 列值
一般使用冒号做分割符,这是不成文的规矩。比如在php-admin for redis系统里,就是默认以冒号分割,于是user:1 user:2等key会分成一组。于是以上的关系数据转化成kv数据后记录如下:
Set login:1:login_times 5 Set login:2:login_times 1 Set login:3:login_times 2 Set login:1:last_login_time 2011-1-1 Set login:2:last_login_time 2011-2-1 Set login:3:last_login_time 2011-3-1 set login:1:name ”ken thompson“ set login:2:name “dennis ritchie” set login:3:name ”Joe Armstrong“
这样在已知主键的情况下,通过get、set就可以获得或者修改用户的登录次数和最后登录时间和姓名。
一般用户是无法知道自己的id的,只知道自己的用户名,所以还必须有一个从name到id的映射关系,这里的设计与上面的有所不同。
set "login:ken thompson:id" 1 set "login:dennis ritchie:id" 2 set "login: Joe Armstrong:id" 3
这样每次用户登录的时候业务逻辑如下(python版),r是redis对象,name是已经获知的用户名。
1 |
#获得用户的id |
2 |
uid = r.get( "login:%s:id" % name)
|
3 |
#自增用户的登录次数 |
4 |
ret = r.incr( "login:%s:login_times" % uid)
|
5 |
#更新该用户的最后登录时间 |
6 |
ret = r. set ( "login:%s:last_login_time" % uid, datetime.datetime.now())
|
如果需求仅仅是已知id,更新或者获取某个用户的最后登录时间,登录次数,关系型和kv数据库无啥区别。一个通过btree pk,一个通过hash,效果都很好。
假设有如下需求,查找最近登录的N个用户。开发人员看看,还是比较简单的,一个sql搞定。
1 |
select * from login order by last_login_time desc limit N
|
DBA了解需求后,考虑到以后表如果比较大,所以在last_login_time上建个索引。执行计划从索引leafblock 的最右边开始访问N条记录,再回表N次,效果很好。
过了两天,又来一个需求,需要知道登录次数最多的人是谁。同样的关系型如何处理?DEV说简单
1 |
select * from login order by login_times desc limit N
|
DBA一看,又要在login_time上建立一个索引。有没有觉得有点问题呢,表上每个字段上都有素引。
关系型数据库的数据存储的的不灵活是问题的源头,数据仅有一种储存方法,那就是按行排列的堆表。统一的数据结构意味着你必须使用索引来改变sql的访问路径来快速访问某个列的,而访问路径的增加又意味着你必须使用统计信息来辅助,于是一大堆的问题就出现了。
没有索引,没有统计计划,没有执行计划,这就是kv数据库。
redis里如何满足以上的需求呢? 对于求最新的N条数据的需求,链表的后进后出的特点非常适合。我们在上面的登录代码之后添加一段代码,维护一个登录的链表,控制他的长度,使得里面永远保存的是最近的N个登录用户。
1 |
#把当前登录人添加到链表里 |
2 |
ret = r.lpush( "login:last_login_times" , uid)
|
3 |
#保持链表只有N位 |
4 |
ret = redis.ltrim( "login:last_login_times" , 0 , N - 1 )
|
这样需要获得最新登录人的id,如下的代码即可
1 |
last_login_list = r.lrange( "login:last_login_times" , 0 , N - 1 )
|
另外,求登录次数最多的人,对于排序,积分榜这类需求,sorted set非常的适合,我们把用户和登录次数统一存储在一个sorted set里。
zadd login:login_times 5 1 zadd login:login_times 1 2 zadd login:login_times 2 3
这样假如某个用户登录,额外维护一个sorted set,代码如此
1 |
#对该用户的登录次数自增1 |
2 |
ret = r.zincrby( "login:login_times" , 1 , uid)
|
那么如何获得登录次数最多的用户呢,逆序排列取的排名第N的用户即可
1 |
ret = r.zrevrange( "login:login_times" , 0 , N - 1 )
|
可以看出,DEV需要添加2行代码,而DBA不需要考虑索引什么的。
TAG系统
tag在互联网应用里尤其多见,如果以传统的关系型数据库来设计有点不伦不类。我们以查找书的例子来看看redis在这方面的优势。
关系型数据库的设计
两张表,一张book的明细,一张tag表,表示每本的tag,一本书存在多个tag。
mysql> select * from book; +------+-------------------------------+----------------+ | id | name | author | +------+-------------------------------+----------------+ | 1 | The Ruby Programming Language | Mark Pilgrim | | 1 | Ruby on rail | David Flanagan | | 1 | Programming Erlang | Joe Armstrong | +------+-------------------------------+----------------+ mysql> select * from tag; +---------+---------+ | tagname | book_id | +---------+---------+ | ruby | 1 | | ruby | 2 | | web | 2 | | erlang | 3 | +---------+---------+ 假如有如此需求,查找即是ruby又是web方面的书籍,如果以关系型数据库会怎么处理?
1 |
select b. name , b.author from tag t1, tag t2, book b
|
2 |
where t1.tagname = 'web' and t2.tagname = 'ruby' and t1.book_id = t2.book_id and b.id = t1.book_id
|
tag表自关联2次再与book关联,这个sql还是比较复杂的,如果要求即ruby,但不是web方面的书籍呢?
关系型数据其实并不太适合这些集合操作。
REDIS的设计
首先book的数据肯定要存储的,和上面一样。
set book:1:name ”The Ruby Programming Language” Set book:2:name ”Ruby on rail” Set book:3:name ”Programming Erlang” set book:1:author ”Mark Pilgrim” Set book:2:author ”David Flanagan” Set book:3:author ”Joe Armstrong”
tag表我们使用集合来存储数据,因为集合擅长求交集、并集
sadd tag:ruby 1 sadd tag:ruby 2 sadd tag:web 2 sadd tag:erlang 3
那么,即属于ruby又属于web的书?
inter_list = redis.sinter("tag.web", "tag:ruby")
即属于ruby,但不属于web的书?
inter_list = redis.sdiff("tag.ruby", "tag:web")
属于ruby和属于web的书的合集?
inter_list = redis.sunion("tag.ruby", "tag:web")
简单到不行阿。
从以上2个例子可以看出在某些场景里,关系型数据库是不太适合的,你可能能够设计出满足需求的系统,但总是感觉的怪怪的,有种生搬硬套的感觉。
尤其登录系统这个例子,频繁的为业务建立索引。放在一个复杂的系统里,ddl(创建索引)有可能改变执行计划。导致其它的sql采用不同的执行计 划,业务复杂的老系统,这个问题是很难预估的,sql千奇百怪。要求DBA对这个系统里所有的sql都了解,这点太难了。这个问题在oracle里尤其严 重,每个DBA估计都碰到过。对于MySQL这类系统,ddl又不方便(虽然现在有online ddl的方法)。碰到大表,DBA凌晨爬起来在业务低峰期操作,这事我没少干过。而这种需求放到redis里就很好处理,DBA仅仅对容量进行预估即可。
未来的OLTP系统应该是kv和关系型的紧密结合。
相关推荐
在构建一个基于MySQL、Redis和MongoDB数据库的命令行新闻管理系统时,我们需要深入了解...在实践中,不断深入理解这三种数据库的优势和应用场景,以及Python与数据库交互的方式,将有助于成长为一名合格的IT专业人员。
Redis的特点和优势: 1. **高性能**:Redis作为一个内存数据库,读写速度极快,可以达到每秒数十万次操作。它通过将数据存储在内存中,避免了磁盘I/O操作的延迟,从而提高了响应速度。 2. **持久化**:尽管Redis数据...
### NoSQL数据库之Redis数据库管理视频教程 ...通过以上介绍,我们可以看到NoSQL数据库如Redis在特定场景下具有非常明显的优势。了解其特点及应用场景可以帮助开发者更好地选择合适的数据库解决方案。
向量图数据库在处理复杂网络关系、推荐系统、社交网络分析等领域具有广泛的应用,因为它们能够有效地存储和查询具有多对多关系的数据。 **一、Redis基础** Redis 是一种开源的、内存中的数据结构存储系统,可以...
Python SSDBYA是针对SSDB数据库的Python接口,它旨在作为Redis的NoSQL数据库替代品。SSDB(Simple Scalable Database)是一款高性能、可扩展的键值存储系统,适用于大量数据的场景。Python SSDBYA客户端为Python...
首先,对NoSQL进行了解释,指出非关系型数据库是为了解决传统关系型数据库面对高并发访问时出现的性能瓶颈问题而设计的。接着,文档列举了NoSQL数据库的优点,比如高可扩展性和低成本;同时,也指出了NoSQL数据库的...
MongoDB采用了面向集合的架构,其中集合类似于关系数据库中的表,可以包含多个文档(类似于记录)。文档使用BSON格式存储,这是一种二进制形式的JSON,支持更为丰富的数据类型,如日期、二进制数据等。 #### 三、...
Redis是一个开源的、网络化的、非关系型数据库,采用键值对的数据模型。键是唯一的,可以是字符串、数字或特殊符号,而值则可以是多种数据类型,包括字符串、哈希、列表、集合和有序集合。这种设计使得Redis在处理...
### Redis非关系型数据库知识点详解 #### 一、Redis简介与特点 - **定义**: Redis是一种开源的、基于内存的日志型Key-Value数据库。它使用ANSI C编写,支持网络连接,提供丰富的API接口供多种编程语言调用。 - **...
#### 三、Redis的优势 - **数据结构简单**:NoSQL数据库通常没有复杂的表间关系,简化了数据管理和维护工作。 - **高读写性能**:尤其适合处理大量数据,读写速度远超关系型数据库。 - **易于扩展**:可以方便地...
MySQL是一款开源、关系型数据库管理系统,广泛应用于Web应用中。它以其高效、稳定和易于使用而著名。主要特点包括支持SQL标准,支持事务处理,具备良好的安全性和可扩展性。在开发中,你可以利用索引优化查询速度,...
Redis数据库是一种开源的使用内存存储数据的非关系型数据库(NoSQL),它支持多种类型的数据结构,如字符串(strings)、哈希(hashes)、列表(lists)、集合(sets)、有序集合(sorted sets)等。由于其内存中的...
以下是对这三个数据库系统的详细介绍: 1. **MySQL**: MySQL是一款开源、免费的关系型数据库管理系统(RDBMS),广泛应用于Web应用程序。它基于ACID(原子性、一致性、隔离性、持久性)事务模型,保证了数据的...
Nosql的兴起源于对传统关系型数据库(RDBMS)在处理海量数据和高并发场景下的局限性。随着互联网的发展,数据量呈爆炸式增长,单一的Mysql已经无法应对。 Nosql的主要优势在于其易扩展性、高性能、处理大数据量的能力...
在这种情况下,可以采取分层缓存策略,将活跃用户的关注关系存入Redis,其他数据则保存在传统数据库中,并通过定期同步或按需加载到Redis。 总的来说,Redis是解决特定问题的强大工具,但并非万能解决方案。开发者...
键值存储数据库使用哈希表存储数据,具有键和指向数据的指针,其优势在于简单和易于部署,但当需要对值的子集进行查询或更新时,效率可能较低。代表产品包括Redis、SSDB、Voldemort、Oracle BDB等。 列存储数据库将...
- Redis作为NoSQL数据库的一员,弥补了传统关系型数据库在扩展性和性能上的不足,常用于高并发场景下的数据缓存。 - 结合MySQL等关系型数据库,二者可以互补,MySQL处理复杂的关系和事务,Redis则专注于高效存储和...
Redis是一个开源的非关系型数据库(NoSQL),它以键值对的形式存储数据,支持多种数据结构如字符串、哈希、列表、集合和有序集合等。在用户数量统计的场景中,我们可以将用户ID作为键,用户的个数作为值,每次有新...
例如,在电商系统中,Redis可以用来缓存热门商品信息,降低对关系数据库的压力;在社交网络中,它可以存储用户的会话信息,提供快速的交互体验。 总结来说,内存数据库如Redis以其高性能、灵活性和广泛的应用场景,...