Redis 是内存数据库,数据都是存储在内存中,为了避免进程退出导致数据的永久丢失,需要定期将 Redis 中的数据以某种形式(数据或命令)从内存保存到硬盘。当下次 Redis 重启时,利用持久化文件实现数据恢复。除此之外,为了进行灾难备份,可以将持久化文件拷贝到一个远程位置。Redis 的持久化机制有两种:
RDB(Redis Data Base) 内存快照
AOF(Append Only File) 增量日志
持久化的执行
RDB ( Redis Data Base) 指的是在指定的时间间隔内将内存中的数据集快照写入磁盘,RDB 是内存快照(内存数据的二进制序列化形式)的方式持久化,每次都是从 Redis 中生成一个快照进行数据的
全量备份。是 Redis 默认使用的持久化功能。
SAVE:阻塞服务器并创建 RDB 文件
通过在 redis-cli 客户端中执行 save 命令可立即进行一次持久化保存。save 命令在执行期间会阻塞 redis-server 进程,直至持久化过程完毕。而在 redis-server 进程阻塞期间,Redis 不能处理任何读写请求,无法对外提供服务。

BGSAVE:以非阻塞方式创建 RDB 文件
通过在 redis-cli 客户端中执行 bgsave 命令可立即进行一次持久化保存。不同于 save 命令的是,正如该命令的名称一样,background save,后台运行 save。bgsave 命令会使服务器进程 redis-server 生成一个子进程,由该子进程负责完成保存过程。在子进程进行保存过程中,不会阻塞 redis-server 进程对客户端读写请求的处理。

需要注意的是由于执行 BGSAVE 命令需要创建子进程,所以父进程占用的内存数量越大,创建子进程这一操作耗费的时间也会越长,因此 Redis 服务器在执行 BGSAVE 命令时,仍然可能会由于创建子进程而被短暂地阻塞。
通过配置文件自动创建 RDB 文件
自动条件触发的本质仍是 bgsave 命令的执行。只不过是用户通过在配置文件中做相应的设置后,Redis 会根据设置信息自动调用 bgsave 命令执行。
持久化策略按照如下顺序进行:
- 如果服务器在 60 秒之内,对数据库进行了至少 10000 次修改,则进行持久化。
- 如果服务器在 300 秒之内,对数据库进行了至少 100 次修改,则进行持久化。
- 如果服务器在 3600 秒(一小时)之内,对数据库进行了至少 1 次修改,则进行持久化。
查看最近持久化时间
通过 lastsave 命令可以查看最近一次执行持久化的时间,其返回的是一个 Unix 时间戳。

RDB 优化配置
RDB 相关的配置在 redis.conf 文件的 SNAPSHOTTING 部分。
- save
该配置用于设置快照的自动保存触发条件,即 save point,保存点。该触发条件是在指定时间段内发生了指定次数的写操作。如果不启用 RDB 持久化,只需设置 save 的参数为空串即可:save “”。
- stop-write-on-bgsave-error
-
翻译:
然而,如果您已经设置了对 Redis 服务器持久化的正确监控,您可能需要禁用此功能,以便 Redis 能够继续正常工作,即使磁盘、权限等出现问题。
-
解释:
如果在没有设置持久化正确结果的监控的情况下,启用了 RDB 且最后一次持久化数据失败(磁盘损坏,权限等原因),Redis 就会停止接收数据。这会让用户意识到数据没有正确持久化到磁盘上,否则没有人会注意到出故障了。当然,如果 bgsave 命令后来可以正常工作了,Redis 将自动允许再次写入。
- rdbcompression
-
翻译:
是否在导出.rdb 数据库文件的时候采用 LZF 压缩字符串和对象? 默认情况下总是设置成‘yes’,因为它几乎总是一场胜利。 如果你想在存储的子进程中节省一些 CPU 就设置成’no’, 但是这样如果你的 kye/value 是可压缩的,你得到的数据就会很大。
-
解释:
设置为 yes 时,进行持久化会启用 LZF 算法压缩来压缩字符串对象。虽然压缩 RDB 文件会消耗系统资源和 CPU,降低性能,但可大幅降低磁盘文件的大小,方便保存到磁盘,加速主从集群中从节点的数据同步。
- rdbchecksum
-
翻译:
从 RDB 的版本 5 开始 CRC64 校验和被放置在文件的末尾。这使格式更能抵抗损坏,但有一定的性能在保存和加载 RDB 文件时按需付费(约 10%),因此您可以禁用它以获得最大性能。 在禁用校验和的情况下创建的 RDB 文件的校验和为零,这将告诉加载代码跳过检查。
-
解释:
在存储快照后,我们还可以让 redis 使用 CRC64 算法来进行数据校验,但是这样做会增加大约 10%的性能消耗,如果希望获取到最大的性能提升,可以关闭此功能。
- sanitize-dump-payload
-
翻译:
该配置用于设置在加载 RDB 文件或进行持久化时是否开启对 zipList、listPack 等数据的全面安全检测。该检测可以降低命令处理时发生系统崩溃的可能。其可设置的值有三种选择:
-
no:不检测
-
yes:总是检测
-
clients:只有当客户端连接时检测。排除了加载 RDB 文件与进行持久化时的检测。
默认值本应该是 clients,但其会影响 Redis 集群的工作,所以默认值为 no,不检测。
-
- dbfilename

指定 RDB 文件的默认名称,默认为 dump.rdb。
- rdb-del-sync-files
主从复制时,是否删除用于同步的从机上的 RDB 文件。默认是 no,不删除。不过需要注意,只有当从机的 RDB 和 AOF 持久化功能都未开启时才生效。
- dir
设置快照文件的存放路径,这个配置项一定是个目录,而不能是文件名。默认是和当前配置文件保存在同一目录。
RDB 文件结构
rdb 文件整体上可分为三个区域:头信息区、数据区、尾信息区。
1. 头部信息区
-
魔数
以 ascii 码 “REDIS” 开头。用来验证当前文件的格式。类似 java 程序编译后的 class 文件,以 “CAFEBABE” 魔数开头,寓意 java 和 cafe 的千丝万缕的关系。
-
RDB version
表示 RDB 文件的版本。并且高版本 redis 可以 100% 向后兼容加载旧版 rdb 文件。版本信息使用 4 个字节表示。 如:
30 30 30 37转换为 ascii 码00 00 00 07,代表 rdb version 文件为第 7 版。 -
AUX metadata
可以存放多组 key-value,用来表示对应元信息。每一对 key-value,都以 0xFA 开头。key 和 value 均采用 rdb 字符串编码方法。
默认元信息列表:
- redis-ver:redis 版本信息。
- redis-bits:输出 rdb 文件机器的位数,64bit 或 32 bit。
- ctime:rdb 文件创建时间。
- used-mem:rdb 加载到内存中的内存使用量。
2. 数据区
-
SELECTDB
常量的长度为 1 字节。当读入程序遇到这个值的时候, 它知道接下来要读入的将是一个数据库号码。
-
db_number
保存着一个数据库号码, 根据号码的大小不同, 这个部分的长度可以是 1 字节、 2 字节或者 5 字 B 节。 当程序读入 db_number 部分之后, 服务器会调用 SELECT 命令, 根据读入的数据库号码进行数据库切换, 使得之后读入的键值对可以载入到正确的数据库中。
-
key_value_pairs
保存了数据库中的所有键值对数据。
不带过期时间的键值对:
-
TYPE 记录了 value 的类型, 长度为 1 字节, 值可以是以下常量的其中一个:
REDIS_RDB_TYPE_STRINGREDIS_RDB_TYPE_LISTREDIS_RDB_TYPE_SETREDIS_RDB_TYPE_ZSETREDIS_RDB_TYPE_HASHREDIS_RDB_TYPE_LIST_ZIPLISTREDIS_RDB_TYPE_SET_INTSETREDIS_RDB_TYPE_ZSET_ZIPLISTREDIS_RDB_TYPE_HASH_ZIPLIST
以上列出的每个 TYPE 常量都代表了一种对象类型或者底层编码, 当服务器读入 RDB 文件中的键值对数据时, 程序会根据 TYPE 的值来决定如何读入和解释 value 的数据。
-
key 总是一个字符串对象, 它的编码方式和 REDIS_RDB_TYPE_STRING 类型的 value 一样。 根据内容长度的不同, key 的长度也会有所不同。
-
value 会根据 TYPE 类型的不同, 以及保存内容长度的不同, 保存 value 的结构和长度也会有所不同。
带有过期时间的键值对:
- EXPIRETIME_MS 常量的长度为 1 字节, 它告知读入程序, 接下来要读入的将是一个以毫秒为单位的过期时间。
- ms 是一个 8 字节长的带符号整数, 记录着一个以毫秒为单位的 UNIX 时间戳, 这个时间戳就是键值对的过期时间。
- 带有过期时间的键值对中的 TYPE 、 key 、 value 三个部分的意义, 和前面介绍的不带过期时间的键值对的 TYPE 、 key 、 value 三个部分的意义完全相同。
-
3. 尾信息区
该区域最为简单。固定使用 9 byte。第一 byte 为 0xFF ,之后固定跟着 8 byte 用于 crc64 校验。该校验码采用 crc-64-jones 算法生成,用于校验 rdb 文件的合法性。
RDB 持久化过程
RDB 持久化方案进行备份时,Redis 会单独 fork 一个子进程来进行持久化,会将数据写入一个临时文件中,持久化完成后替换旧的 RDB 文件。在整个持久化过程中,主进程(为客户端提供服务的进程)不参与 IO 操作,这样能确保 Redis 服务的高性能,RDB 持久化机制适合对数据完整性要求不高但追求高效恢复的使用场景。下面展示 RDB 持久化流程:
关键执行步骤如下
-
Redis 父进程首先判断:当前是否在执行 save,或 bgsave/bgrewriteaof 的子进程,如果在执行则 bgsave 命令直接返回。bgsave/bgrewriteaof 的子进程不能同时执行,主要是基于性能方面的考虑:两个并发的子进程同时执行大量的磁盘写操作,可能引起严重的性能问题。
-
父进程执行 fork 操作创建子进程,这个过程中父进程是阻塞的,Redis 不能执行来自客户端的任何命令。父进程 fork 后,bgsave 命令返回”Background saving started”信息并不再阻塞父进程,并可以响应其他命令。
-
子进程进程对内存数据生成快照文件。
-
父进程在此期间接收的新的写操作,使用 COW 机制写入。
-
子进程完成快照写入,替换旧 RDB 文件,随后子进程退出。
在生成 RDB 文件的步骤中,在同步到磁盘和持续写入这个过程是如何处理数据不一致的情况呢?生成快照 RDB 文件时是否会对业务产生影响?
Fork 子进程的作用
上面说到了 RDB 持久化过程中,主进程会 fork 一个子进程来负责 RDB 的备份,这里简单介绍一下 fork:
-
Linux 操作系统中的程序,fork 会产生一个和父进程完全相同的子进程。子进程与父进程所有的数据均一致,但是子进程是一个全新的进程,与原进程是父子进程关系。
-
出于效率考虑,Linux 操作系统中使用 COW(Copy On Write)写时复制机制,fork 子进程一般情况下与父进程共同使用一段物理内存,只有在进程空间中的内存发生修改时,内存空间才会复制一份出来。
在 Redis 中,RDB 持久化就是充分的利用了这项技术,Redis 在持久化时调用 glibc 函数 fork 一个子进程,全权负责持久化工作,这样父进程仍然能继续给客户端提供服务。fork 的子进程初始时与父进程(Redis 的主进程)共享同一块内存;当持久化过程中,客户端的请求对内存中的数据进行修改,此时就会通过 COW (Copy On Write) 机制对数据段页面进行分离,也就是复制一块内存出来给主进程去修改。
数据丢失情况分析
save 命令数据丢失
| 时间 | 事件 |
|---|---|
| T0 | 服务器开始运行 |
| T1 | 服务器执行 SET k1 v1 |
| T2 | 服务器执行 SET k2 v2 |
| T3 | 服务器执行 SAVE 命令,成功创建 RDB 文件 |
| T4 | 服务器执行 SET k3 v3 |
| T5 | 服务器执行 SET k4 v4 |
| T6 | 服务器执行 SAVE 命令,成功创建 RDB 文件 |
| T7 | 服务器执行 SET k5 v5 |
| T8 | 服务器执行 SET k6 v6 |
| T9 | 服务器停机 |
- 因为服务器最后一次成功执行 SAVE 命令是在 T6,所以服务器创建出的 RDB 文件将包含键 k1 至键 k4 在内的数据,服务器在重启时将使用这个 RDB 文件进行数据恢复
- 因为服务器在 T6 之后创建了键 k5 和键 k6,并在之后出现停机,所以当服务器重启时,键 k5、k6 的数据将丢失,而键 k1 至键 k4 的数据将被恢复。
bgsave 命令数据丢失
| 时间 | 事件 |
|---|---|
| T0 | 服务器开始运行 |
| T1 | 服务器执行 SET k1 v1 |
| T2 | 服务器执行 SET k2 v2 |
| T3 | 服务器执行 BGSAVE 命令,开始创建 RDB 文件 |
| T4 | 服务器执行 SET k3 v3 |
| T5 | RDB 文件创建完毕 |
| T6 | 服务器执行 SET k4 v4 |
| T7 | 服务器执行 BGSAVE 命令,开始创建 RDB 文件 |
| T8 | 服务器执行 SET k5 v5 |
| T9 | 服务器执行 SET k6 v6 |
| T10 | 服务器停机 |
- 因为 T7 创建的新 RDB 文件尚未完成,所以服务器在停机之后将使用 T5 成功创建的 RDB 文件进行数据恢复。
- 虽然服务器现有的 RDB 文件是在 T5 成功创建的,但由于这个文件是在 T3 开始创建的,所以它只包含了 T3 之前的数据,即键 k1 和键 k2 的数据。
- 基于上述原因,当服务器重启时,只有键 k1 和键 k2 的数据会被恢复,而键 k3 至键 k6 的数据则会丢失。
RDB 的优缺点
优点:
-
存储紧凑,节省内存空间。
-
恢复速度非常快。
-
适合全量备份、全量复制的场景,经常用于灾难恢复(对数据的完整性和一致性要求相对较低的场合)。
缺点:
- 容易丢失数据,容易丢失两次快照之间 Redis 服务器中变化的数据。
- RDB 通过 fork 子进程对内存快照进行全量备份,是一个重量级操作,频繁执行成本高。