`
san_yun
  • 浏览: 2638937 次
  • 来自: 杭州
文章分类
社区版块
存档分类
最新评论

redis数据持久化的策略

 
阅读更多

redis数据持久化的策略主要有:

1. 内存快照

2. AOF

 

 

数据持久化通俗讲就是把数据保存到磁盘上,保证不会因为断电等因素丢失数据。

redis需要经常将内存中的数据同步到磁盘来保证持久化。redis支持两种持久化方式,一种是 Snapshotting(快照)也是默认方式,另一种是Append-only file(缩写aof)的方式。先介绍下这两种dump方式再讲讲自己遇到的一些现象和想法,前面的内容是从网上整理出来的。

Snapshotting
快照是默认的持久化方式。这种方式是就是将内存中数据以快照的方式写入到二进制文件中,默认的文件名为dump.rdb。可以通过配置设置自动做快照持久 化的方式。我们可以配置redis在n秒内如果超过m个key被修改就自动做快照,下面是默认的快照保存配置

save 900 1  #900秒内如果超过1个key被修改,则发起快照保存
save 300 10 #300秒内容如超过10个key被修改,则发起快照保存
save 60 10000

下面介绍详细的快照保存过程

  1. 1.redis调用fork,现在有了子进程和父进程。
  2. 2. 父进程继续处理client请求,子进程负责将内存内容写入到临时文件。由于os的写时复制机制(copy on write)父子进程会共享相同的物理页面,当父进程处理写请求时os会为父进程要修改的页面创建副本,而不是写共享的页面。所以子进程的地址空间内的数 据是fork时刻整个数据库的一个快照。
  3. 3.当子进程将快照写入临时文件完毕后,用临时文件替换原来的快照文件,然后子进程退出。


client 也可以使用save或者bgsave命令通知redis做一次快照持久化。save操作是在主线程中保存快照的,由于redis是用一个主线程来处理所有 client的请求,这种方式会阻塞所有client请求。所以不推荐使用。另一点需要注意的是,每次快照持久化都是将内存数据完整写入到磁盘一次,并不 是增量的只同步脏数据。如果数据量大的话,而且写操作比较多,必然会引起大量的磁盘io操作,可能会严重影响性能。

另外由于快照方式是在一定间隔时间做一次的,所以如果redis意外down掉的话,就会丢失最后一次快照后的所有修改。如果应用要求不能丢失任何修改的话,可以采用aof持久化方式。下面介绍

Append-only file


aof 比快照方式有更好的持久化性,是由于在使用aof持久化方式时,redis会将每一个收到的写命令都通过write函数追加到文件中(默认是 appendonly.aof)。当redis重启时会通过重新执行文件中保存的写命令来在内存中重建整个数据库的内容。当然由于os会在内核中缓存 write做的修改,所以可能不是立即写到磁盘上。这样aof方式的持久化也还是有可能会丢失部分修改。不过我们可以通过配置文件告诉redis我们想要 通过fsync函数强制os写入到磁盘的时机。有三种方式如下(默认是:每秒fsync一次)

appendonly yes              //启用aof持久化方式
# appendfsync always      //每次收到写命令就立即强制写入磁盘,最慢的,但是保证完全的持久化,不推荐使用
appendfsync everysec     //每秒钟强制写入磁盘一次,在性能和持久化方面做了很好的折中,推荐
# appendfsync no    //完全依赖os,性能最好,持久化没保证

aof 的方式也同时带来了另一个问题。持久化文件会变的越来越大。例如我们调用incr test命令100次,文件中必须保存全部的100条命令,其实有99条都是多余的。因为要恢复数据库的状态其实文件中保存一条set test 100就够了。为了压缩aof的持久化文件。redis提供了bgrewriteaof命令。收到此命令redis将使用与快照类似的方式将内存中的数据 以命令的方式保存到临时文件中,最后替换原来的文件。具体过程如下

  1. redis调用fork ,现在有父子两个进程
  2. 子进程根据内存中的数据库快照,往临时文件中写入重建数据库状态的命令
  3. 父进程继续处理client请求,除了把写命令写入到原来的aof文件中。同时把收到的写命令缓存起来。这样就能保证如果子进程重写失败的话并不会出问题。
  4. 当子进程把快照内容写入已命令方式写到临时文件中后,子进程发信号通知父进程。然后父进程把缓存的写命令也写入到临时文件。
  5. 现在父进程可以使用临时文件替换老的aof文件,并重命名,后面收到的写命令也开始往新的aof文件中追加。


需要注意到是重写aof文件的操作,并没有读取旧的aof文件,而是将整个内存中的数据库内容用命令的方式重写了一个新的aof文件,这点和快照有点类似。


运维上的想法
其实快照和aof一样,都使用了Copy-on-write技术。多次试验发现每次做数据dump的时候,内存都会扩大一倍(关于这个问题可以参考我去年写的redis的内存陷阱,很多人用redis做为缓存,数据量小,dump耗时非常短暂,所以不太容易发现),这个时候会有三种情况:

一:物理内存足以满足,这个时候dump非常快,性能最好
二:物理内存+虚拟内存可以满足,这个时候dump速度会比较慢,磁盘swap繁忙,服务性能也会下降。所幸的是经过一段比较长的时候数据dump完成了,然后内存恢复正常。这个情况系统稳定性差。
三: 物理内存+虚拟内存不能满足,这个时候dump一直死着,时间久了机器挂掉。这个情况就是灾难!

如果数据要做持久化又想保证稳定性,建议留空一半的物理内存。如果觉得无法接受还是有办法,下面讲:

快照和aof虽然都使用Copy-on-write,但有个不同点,快照你无法预测redis什么时候做dump,aof可以通过bgrewriteaof命令控制dump的时机。

根据这点我可以在一个服务器上开启多个redis节点(利用多CPU),使用aof的持久化方式。

例如在24G内存的服务器上开启3个节点,每天用bgrewriteaof定期重新整理数据,每个节点dump的时间都不一样,这样理论上每个节点可以消耗6G内存,一共使用18G内存,另外6G内存在单个节点dump时用到,内存一下多利用了6G! 当然节点开的越多内存的利用率也越高。如果带宽不是问题,节点数建议 = CPU数。

我的应用里为了保证高性能,数据没有做dump,也没有用aof。因为不做dump发生的故障远远低于做dump的时候,即使数据丢失了,自动修复脚本可以马上数据恢复。毕竟对海量数据redis只能做数据分片,那么落到每个节点上的数据量也不会很多。

redis的虚拟内存建议也不要用,用redis本来就是为了达到变态的性能,虚拟内存、aof看起来都有些鸡肋。

现在还离不开redis,因为它的mget是现在所有db里性能最好的,以前也考虑过用tokyocabinet hash方式做mget,性能不给力。直接用redis,基本上单个redis节点mget可以达到10W/s
纠错

之前说过redis做数据dump的时候内容会扩大一倍,后来我又做了些测试,发现有些地方说的不对。

top命令并不是反映真实的内存占用情况,在top里尽管fork出来的子进程占了和父进程一样的内存,但是当做dump的时候没有写操作,实际使用的是同一份内存的数据。当有写操作的时候内存才会真实的扩大(具体是不是真实的扩大一倍不确定,可能数据是按照页分片的),这才是真正的Copy-on-write。

基于这点在做数据持久化会更加灵活。

 

分享到:
评论

相关推荐

    Redis的持久化方案

    Redis是一种内存数据库,它支持数据的持久化,确保数据的持久性和安全性。持久化是指将内存中的数据保存到磁盘上,以便在Redis服务器重启或者系统崩溃之后,数据依然能够得以保存和恢复。Redis提供了两种持久化方案...

    Redis windows 测试redis持久化功能1

    Redis 是一个高性能的键值数据库,广泛应用于缓存、数据持久化等场景。在 Windows 上测试 Redis 的持久化功能,主要是确保数据在系统重启或异常情况后能够被正确地保存和恢复。以下将详细介绍如何在 Windows 环境下...

    redis持久化方式

    ### Redis持久化方式详解 Redis 是一款高性能的键值存储系统,因其卓越的读写速度、丰富的数据结构以及灵活的应用场景而备受青睐。...在实际应用中,可以根据业务需求灵活配置,以达到最优的数据持久化效果。

    解密Redis持久化

    Redis 是一款高性能的键值存储系统,广泛应用于缓存和数据持久化。持久化是Redis的一个重要特性,确保即使在服务器崩溃或系统断电后,数据也能得以恢复。本文将深入解析Redis的持久化机制,主要包括RDB快照和AOF日志...

    redis 可持久化 Key-Value数据库

    用户可以根据应用场景的需求选择适合的持久化策略,或者结合使用以达到更好的平衡。 Redis还支持网络通信,意味着它可以作为一个分布式缓存系统在多台服务器之间同步数据,通过主从复制和Sentinel哨兵系统实现高...

    04_redis 数据持久化 和 lamp 环境搭建.docx

    ### Redis 数据持久化 #### 一、Redis 数据持久化的重要性 Redis 作为一种内存数据库,在运行过程中将所有的数据存储于内存中。虽然这种设计能够极大提高数据的读写速度,但同时也带来了一个问题:一旦服务器断电...

    Redis持久化以及集群部署

    RDB 是 Redis 默认的持久化方式,它会在指定的时间点创建数据集的快照。通过执行 `SAVE` 或者 `BGSAVE` 命令来触发。`BGSAVE` 会在后台异步执行,不会阻塞主进程。 - **优点**: - 数据恢复速度快,重启后可以直接...

    redis的持久化工具

    Redis是一款高性能的键值对数据库,它以其出色的性能和丰富的数据结构被广泛应用于缓存、消息中间件以及数据持久化等多个场景。而Jedis是Java社区中常用的Redis客户端库,它提供了与Redis服务器进行交互的基本功能。...

    02-Redis持久化、主从与哨兵架构详解.zip

    Redis是一款高性能的键值对内存数据库,常用于缓存、消息队列以及数据持久化等场景。本资料包主要探讨Redis的三个核心概念:持久化、主从复制和哨兵架构,这些都是确保Redis高可用性和数据安全的重要机制。 首先,...

    06_redis 持久化.pdf

    在实际应用中,根据不同的业务场景和需求,可以选择合适的持久化策略。 在选择持久化方式时,需要根据业务的数据安全要求、数据一致性要求、性能要求以及磁盘资源等多方面因素综合考虑。对于业务数据不允许任何丢失...

    第四十六章:Redis数据库持久化1

    根据不同的业务需求,可以选择适合的持久化策略。如果对数据的一致性要求较高,愿意牺牲一些性能,AOF 是更合适的选择;如果优先考虑性能,可以采用 RDB,尤其在大数据集场景下。有时,为了兼顾性能和数据安全性,也...

    Redis的持久化方案.docx

    RDB是Redis默认的持久化策略。它会在特定的时间间隔内,如果满足特定的写操作次数,将内存中的数据快照写入到磁盘上的一个文件,通常命名为`dump.rdb`。这种快照式的备份提供了快速的数据恢复能力,特别适合于大规模...

    redis面试题之持久化.zip

    本篇将深入探讨 Redis 的持久化策略,帮助你应对相关的面试问题。 1. RDB (Redis Database Persistence) RDB 是 Redis 默认的持久化方式,它会定期创建数据库的一个快照(snapshot)。当满足特定条件(如指定时间...

    Redis持久化、主从与哨兵架构详解.pdf

    Redis持久化机制包括RDB快照和AOF(Append Only File)两种方式,它们有不同的特点和使用场景,下面将详细分析这两种机制。...用户应当根据具体的业务需求和对数据安全性的要求来选择最合适的持久化策略。

    redis持久化和内存策略1

    然而,内存中的数据在服务器断电或宕机后会丢失,因此,为了保证数据的持久性,Redis 提供了两种持久化策略:RDB(Redis Database Backup)模式和AOF(Append Only File)模式。 **RDB 模式** RDB 是一种快照式的...

    redis 的持久化方式1

    Redis 是一个高性能的键值数据库,它提供了多种持久化策略以确保数据的可靠性。本文主要讨论Redis的两种持久化方式:RDB(Redis Database)和AOF(Append-only File)。 **RDB 持久化** RDB 是通过创建数据库在...

    从源码解读redis持久化

    在实际应用中,用户可以根据业务需求和性能要求,选择单一或结合使用RDB和AOF来实现Redis的数据持久化。例如,可以使用RDB作为定期备份,AOF作为实时数据保护,以达到最佳的数据安全性与性能平衡。 总之,Redis的...

    spring集成redis,集成redis集群

    - **持久化策略**:根据业务需求,选择合适的Redis数据持久化策略,如RDB快照或AOF日志。 - **Sentinel监控和故障转移**:通过Redis Sentinel可以监控集群状态并自动处理主从切换。 - **Cluster Slot分配**:了解...

    Redis的持久化方案.pdf(两种持久化方案:RDB 和 AOF,共15页)

    Redis是一种高性能的键值数据库,它提供了两种主要的数据持久化机制:RDB(Redis Database Backup)和AOF(Append Only File)。这两种方法各有特点,适用于不同的场景。 #### RDB 持久化方案 **概述** RDB方式...

Global site tag (gtag.js) - Google Analytics