面试官:聊聊Redis中RDBAOF持久化原理!

news2026/4/15 2:49:55
Redis 中数据的持久化前言我们知道 Redis 是内存数据库所有操作都在内存上完成。内存的话服务器断电内存上面的数据就会丢失了。这个问题显然是需要解决的。Redis 中引入了持久化来避免数据的丢失主要有两种持久化的方式 RDB 持久化和 AOF 持久化。AOF 持久化什么是 AOF 持久化AOF(Append Only File):通过保存数据库执行的命令来记录数据库的状态。AOF日志对数据库命令的保存顺序是Redis 先执行命令把数据写入内存然后才记录日志。为什么要后记录日志呢1、后写能够避免记录到错误的命令。因为是先执行命令后写入日志只有命令执行成功了命令才能被写入到日志中。2、避免阻塞当前的写操作是在命令执行后才记录日志所以不会阻塞当前的写操作。AOF 的潜在风险1、如果命令执行成功写入日志的时候宕机了命令没有写入到日志中这时候就有丢失数据的风险了因为这时候没有写入日志服务断电之后这部分数据就丢失了。这种场景在别的地方也很常见比如基于 MQ 实现分布式事务也会出现业务处理成功 事务消息发送失败这种场景RabbitMQRocketMQKafka 事务性消息丢失和消息重复发送的处理策略2、AOF 日志写入也是在主线程进行的如果磁盘的压力很大写入速度变慢了会影响后续的操作。这两种情况可以通过调整 AOF 文件的写入磁盘的时机来避免AOF 文件的写入和同步AOF 文件持久化的功能分成三个步骤文件追加(append),文件写入文件同步(sync)。AOF 文件在写入磁盘之前是先写入到 aof_buf 缓冲区中然后通过调用 flushAppendOnlyFile 将缓冲区中的内容保存到 AOF 文件中。写入的策略通过 appendfsync 来进行配置Always同步写回 每次操作命令执行完后同步将 AOF 日志数据写回硬盘Everysec每秒写回 每次操作命令执行完后先将命令写入到 AOF 文件的内核缓冲区然后每隔一秒将缓冲区里的内容写回到硬盘No操作系统控制的写回 Redis 不在控制命令的写会时机交由系统控制。每次操作命令执行完成之后命令会被放入到 AOF 文件的内核缓冲区之后什么时候写入到磁盘交由系统控制。AOF 文件重写机制因为每次执行的命令都会被写入到 AOF 文件中随着系统的运行越来越多的文件会被写入到 AOF 文件中这样 AOF 文件势必会变得很大这种情况该如何去处理呢为了解决这种情况Redis 中引入了重写的机制什么是重写呢因为 AOF 文件中记录的是每个命令的操作记录举个比如当一个键值对被多条写命令反复修改时AOF文件会记录相应的多条命令那么重写机制就是根据这个键值对当前的最新状态为它生成对应的写入命令保存成一行操作命令。这样就精简了 AOF 文件的大小。192.168.56.118:6379 set name xiaoming OK 192.168.56.118:6379 get name xiaoming 192.168.56.118:6379 set name xiaozhang OK 192.168.56.118:6379 set name xiaoli OK # 重写后就是 192.168.56.118:6379 set name xiaoli简单来讲就是多变一就是把 AOF 中日志根据当前键值的状态合并成一条操作命令。重写之后的文件会保存到新的 AOF 文件中这是旧的 AOF 文件和新的 AOF 文件中键值对应的状态是一样的。然后新的 AOF 文件会替换掉旧的 AOF 文件这样 重写操作一直在进行AOF 文件就不至于变得过大。重写是后台进行的 AOF 重写会放到子进程中进行的使用子进程的优点1、子进程处理 AOF 期间不会影响 Redis 主线程对数据的处理2、子进程拥有所在线程的数据副本子进程能够避免锁的使用保证数据的安全。这里来看下AOF 的处理流程AOF 重写也有一个缓冲区当服务节接收到新的命令的时候如果在正在进行 AOF 重写命令同样也会被发送到 AOF 缓冲区的进程执行 AOF 重写的过程,服务端进程主要处理以下内容1、接收并处理客户端发送的命令2、将执行后的命令写入到 AOF 缓冲区3、将执行后的命令也写入到 AOF 重写缓冲区AOF 缓冲区和 AOF 重写缓冲区中的内容会被定期的同步到 AOF 文件和 AOF 重写文件中当子进程完成重写的时候会给父进程发送一个信号这时候父进程主要主要进行下面的两步操作1、将 AOF 重写缓冲区中的内容全部写入到 AOF 重写文件中这时候重写 AOF 文件保存的数据状态是和服务端数据库的状态一致的2、将 AOF 重写文件替换旧的 AOF 文件通过 AOF 的重写操作新的 AOF 文件不断的替换旧的 AOF 文件这样就能控制 AOF 文件的大小AOF 的数据还原AOF 文件包了重建数据库索引锁需要的全部命令所以只需要读入并重新执行一遍 AOF 文件中保存的命令即可还原服务关闭之前数据库的状态。RDB 持久化什么是 RDB 持久化RDB(Redis database)实现方式是将存在 Redis 内存中的数据写入到 RDB 文件中保存到磁盘上从而实现持久化的。和 AOF 不同的是 RDB 保存的是数据而不是操作在进行数据恢复的时候直接把 RDB 的文件读入到内存即可完成数据恢复。RDB 如何做内存快照Redis 中对于如何备份数据到 RDB 文件中提供了两种方式1、save: 在主线程中执行不过这种会阻塞 Redis 服务进程2、bgsave: 主线程会 fork 出一个子进程来负责处理 RDB 文件的创建不会阻塞主线程的命令操作这也是 Redis 中 RDB 文件生成的默认配置对于 save 和 bgsave 这两种快照方式服务端是禁止这两种方式同时执行的防止产生竞争条件。Redis 中可以使用 save 选项来配置服务端执行 BGSAVE 命令的间隔时间# # Save the DB on disk: # # save seconds changes # # Will save the DB if both the given number of seconds and the given # number of write operations against the DB occurred. # # In the example below the behaviour will be to save: # after 900 sec (15 min) if at least 1 key changed # after 300 sec (5 min) if at least 10 keys changed # after 60 sec if at least 10000 keys changed # # Note: you can disable saving completely by commenting out all save lines. # # It is also possible to remove all the previously configured save # points by adding a save directive with a single empty string argument # like in the following example: # # save save 900 1 save 300 10 save 60 10000save 900 1 就是服务端在900秒读数据进行了至少1次修改就会触发一次 BGSAVE 命令save 300 10 就是服务端在300秒读数据进行了至少10次修改就会触发一次 BGSAVE 命令快照时发生数据修改举个栗子我们在t时刻开始对内存数据内进行快照假定目前有 2GB 的数据需要同步磁盘写入的速度是 0.1GB/s 那么快照的时间就是 20s那就是在 t20s 完成快照。如果在 t6s 的时候修改一个还没有写入磁盘的内存数据 test 为 test-hello。那么就会破坏快照的完整性了因为 t 时刻备份的数据已经被修改了。当然是希望在备份期间数据不能被修改。如果不能被修改就意味这在快照期间不能对数据进行修改操作就如上面的栗子快照需要进行20s,期间不允许处理数据更新操作这显然也是不合理的。这里需要聊一下 bgsave 是可以避免阻塞不过需要注意的是避免阻塞和正常读写操作是有区别的。避免阻塞主线程确实没有阻塞可以处理读操作但是为了保护快照的完整性是不能修改快照期间的数据的。这里就需要引入一种新的处理方案写时复制技术Copy-On-Write, COW在执行快照的同时正常处理写操作。bgsave 子进程是由主线程 fork 生成的所以是可以共享主线程的内存的bgsave子进程运行后会读取主线程中的内存数据并且写入到 RDB 文件中。写复制技术就是如果主线程在内存快照期间修改了一块内存那么这块内存会被复制一份生成该数据的副本然后 bgsave 子进程在把这段内存写入到 RDB 文件中。这样就可以在快照期间进行数据的修改了。多久做一次快照对于快照如果做的太频繁可能会出现前一次快照还没有处理完成后面的快照数据马上就进来了同时过于频繁的快照也会增加磁盘的压力。如果间隔时间过久服务器在两次快照期间宕机丢失的数据大小会随着快照间隔时间的增长而增加。是否可以选择增量式快照呢选择增量式快照我们就需要记住每个键值对的状态如果键值对很多同样也会引入很多内存空间这对于内存资源宝贵的Redis来说有些得不偿失。相较于 AOF 来对比RDB 是会在数据恢复时速度更快。但是 RDB 的内存快照同步频率不太好控制过多过少都有问题。Redis 4.0中提出了一个混合使用 AOF 日志和内存快照的方法。简单来说内存快照以一定的频率执行在两次快照之间使用AOF日志记录这期间的所有命令操作。通过混合使用AOF日志和内存快照的方法RDB 快照的频率不需要过于频繁在两次 RDB 快照期间使用 AOF 日志来记录这样也不用考虑 AOF 的文件过大问题在下一次 RDB 快照开始的时候就可以删除 AOF 文件了。过期的键如何持久化在生成 RDB 文件的过程中如果一个键已经过期那么其不会被保存到 RDB 文件中。在载入 RDB 的时候要分两种情况1、如果 Redis 以主服务器的模式运行那么会对 RDB 中的键进行时间检查过期的键不会被恢复到 Redis 中。2、如果 Redis 以从服务器的模式运行那么 RDB 中所有的键都会被载入忽略时间检查。在从服务器与主服务器进行数据同步的时候从服务器的数据会先被清空所以载入过期键不会有问题。对于 AOF 来说如果一个键过期了那么不会立刻对 AOF 文件造成影响。因为 Redis 使用的是惰性删除和定期删除只有这个键被删除了才会往 AOF 文件中追加一条 DEL 命令。在重写 AOF 的过程中程序会检查数据库中的键已经过期的键不会被保存到 AOF 文件中。在运行过程中对于主从复制的 Redis主服务器和从服务器对于过期键的处理也不相同1、对于主服务器一个过期的键被删除了后会向从服务器发送 DEL 命令通知从服务器删除对应的键2、从服务器接收到读取一个键的命令时即使这个键已经过期也不会删除而是照常处理这个命令3、从服务器接收到主服务器的 DEL 命令后才会删除对应的过期键。这样保证了数据的一致性一个键值对存在于主服务器也必然存在于从服务器。总结AOF优点AOF 中有三种策略可以进行选择AOF 的默认策略为每秒钟 fsync 一次在这种配置下Redis 仍然可以保持良好的性能并且就算发生故障停机也最多只会丢失一秒钟的数据。缺点AOF 文件体积一般情况下比 RDB 文件体积大并且数据还原速度也慢于 RDB。RDB优点可以快速恢复数据相比于 AOF 的顺序逐一执行操作命令效率更高缺点因为是内存快照频率过快过慢都会有响应的问题。过快浪费磁盘资源会给磁盘造成压力过慢会存在较多数据丢失的问题。Redis 4.0中提出了一个混合使用 AOF 日志和内存快照的方法如果想要保证数据不丢失这是一个比较好的选择如果允许分钟级别的数据丢失可以只使用RDB如果只用AOF优先使用 everysec 的配置选项因为它在可靠性和性能之间取了一个平衡。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2518477.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…

wordpress后台更新后 前端没变化的解决方法

使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…

网络编程(Modbus进阶)

思维导图 Modbus RTU(先学一点理论) 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议,由 Modicon 公司(现施耐德电气)于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…

UE5 学习系列(二)用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…

利用最小二乘法找圆心和半径

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明&#xff1a;假设每台服务器已…

XML Group端口详解

在XML数据映射过程中&#xff0c;经常需要对数据进行分组聚合操作。例如&#xff0c;当处理包含多个物料明细的XML文件时&#xff0c;可能需要将相同物料号的明细归为一组&#xff0c;或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码&#xff0c;增加了开…

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造&#xff0c;完美适配AGV和无人叉车。同时&#xff0c;集成以太网与语音合成技术&#xff0c;为各类高级系统&#xff08;如MES、调度系统、库位管理、立库等&#xff09;提供高效便捷的语音交互体验。 L…

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)

题目&#xff1a;3442. 奇偶频次间的最大差值 I 思路 &#xff1a;哈希&#xff0c;时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况&#xff0c;哈希表这里用数组即可实现。 C版本&#xff1a; class Solution { public:int maxDifference(string s) {int a[26]…

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…

【Axure高保真原型】引导弹窗

今天和大家中分享引导弹窗的原型模板&#xff0c;载入页面后&#xff0c;会显示引导弹窗&#xff0c;适用于引导用户使用页面&#xff0c;点击完成后&#xff0c;会显示下一个引导弹窗&#xff0c;直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…

接口测试中缓存处理策略

在接口测试中&#xff0c;缓存处理策略是一个关键环节&#xff0c;直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性&#xff0c;避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明&#xff1a; 一、缓存处理的核…

龙虎榜——20250610

上证指数放量收阴线&#xff0c;个股多数下跌&#xff0c;盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型&#xff0c;指数短线有调整的需求&#xff0c;大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的&#xff1a;御银股份、雄帝科技 驱动…

观成科技:隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具&#xff0c;该工具基于TUN接口实现其功能&#xff0c;利用反向TCP/TLS连接建立一条隐蔽的通信信道&#xff0c;支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式&#xff0c;适应复杂网…

铭豹扩展坞 USB转网口 突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…

未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?

编辑&#xff1a;陈萍萍的公主一点人工一点智能 未来机器人的大脑&#xff1a;如何用神经网络模拟器实现更智能的决策&#xff1f;RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战&#xff0c;在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…

Linux应用开发之网络套接字编程(实例篇)

服务端与客户端单连接 服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …

华为云AI开发平台ModelArts

华为云ModelArts&#xff1a;重塑AI开发流程的“智能引擎”与“创新加速器”&#xff01; 在人工智能浪潮席卷全球的2025年&#xff0c;企业拥抱AI的意愿空前高涨&#xff0c;但技术门槛高、流程复杂、资源投入巨大的现实&#xff0c;却让许多创新构想止步于实验室。数据科学家…

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向&#xff1a; 逆向设计 通过神经网络快速预测微纳结构的光学响应&#xff0c;替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…