Redis核心技术与实战【学习笔记】 - 13.Redis缓冲区可能引起的问题及解决套路

缓冲区的功能其实很简答,主要就是用一块内存空间来暂时存放命令数据,以免出现因为数据和命令的处理速度慢于发送速度而导致的数据丢失和性能的问题。但是因为缓冲区的内存空间有限,如果往里面写入数据的速度持续地大于从里面读取数据的速度,就会导致缓冲区需要越来越多的内存来暂存数据。当缓冲区占用的内存超出了设定的上限阈值时,就会出现缓冲区溢出。

如果发生了溢出,就会丢失数据了。那是不是不给缓冲区的大小设置上限,就可以了呢?显然不是,随着积累的数据越来越多,缓冲区占用内存空间会越来越大,一旦耗尽了 Redis 实例所在机器的可用内存,就会导致 Redis 实例崩溃。

我们知道,Redis 是典型的 client-server 架构,所有的操作命令都需要通过客户端发送给服务端。所以,缓冲区在 Redis 的一个主要场景就是在客户端和服务器之间进行通信时,用来暂存客户端发送的命令数据,或者是服务器返回给客户端的数据结果。此外,缓冲区的另一个应用场景是,在主从节点间进行数据同步时,用来暂存主节点接收的写命令和数据。


1.客户端输入和输出缓冲区

为了避免客户端和服务端的请求发送和处理速度不匹配,服务端会给每个连接的客户端都设置了一个输入和输出缓冲区,我们称之为客户端输入和输出缓冲区。

输入缓冲区会先把客户端发送过来的命令暂存起来,Redis 主线程再从输入缓冲区中读取命令,进行处理。当 Redis 主线程处理完数据后,会把结果写入到输出缓冲区,在通过输出缓冲区返回给客户端。

在这里插入图片描述

2. 输入缓冲区溢出,及应对办法

我们前面已经分析过,输入缓冲区就是用来暂存客户端发送的请求命令的,所以可能导致溢出的情况主要是下面两种:

  • 写入了 bigkey,比如一下子写入多个百万级别的集合类型数据。
  • 服务端请求处理的速度过慢,例如,Redis 主线程出现了间接性阻塞,无法及时处理正常发送的请求,导致客户端发送的请求在缓冲区越积越多。

要查看和服务器端相联的每个客户端对输入缓冲区的使用情况,我们可以使用 CLIENT LIST 命令

127.0.0.1:6379> CLIENT LIST
id=5 addr=127.0.0.1:50487 fd=9 name= age=4 idle=0 flags=N db=0 sub=0 psub=0 multi=-1 qbuf=26 qbuf-free=32742 obl=0 oll=0 omem=0 events=r cmd=client

CLIENT LIST 命令返回的信息虽然很多,但是我们只需关注两类信息即可。

一类是与服务端连接的客户端的信息。这个案例展示的是一个客户端的输入缓冲区情况。

如果有多个客户端,输出结果中的 addr 会显示不同客户端的 IP 和端口号。
在这里插入图片描述

另一类是与输入缓冲区相关的3个参数:

  • cmd,表示客户端最新执行的命令。这个例子中,执行的是 CLIENT 命令
  • qbuf,表示输入缓冲区已经使用的大小。这个例子中的 CLIENT 命令已使用了 26 字节大小的缓冲区。
  • qbuf-free,表示输入缓冲区尚未使用的大小。这个例子中的 CLIENT 命令还可以使用 32742 字节的缓冲区。qbufqbuf-free 的综合就是 Redis 服务端当前为已连接的这个客户端分配的缓冲区大小。这个例子中,总共分配了 26 + 32742 = 32768 字节,也就是 32KB 的缓冲区。

有了 CLIENT LIST 命令,我们就可以通过输出结果来判断客户端输入缓冲区的内存占用情况了。如果 qbuf 很大,而同时 qbuf-free 很小,就要引起注意了,因为这时候输入缓冲区已经占用了很多内存,而没有什么空闲空间了。此时,客户端再写入大量命令的话,就会引起客户端输入缓冲区溢出,Redis 的处理办法是关闭 客户端连接,结果就是业务程序无法进行数据存取了。

通常情况下,Redis 服务端不止服务一个客户端,当多个客户端连接占用的内存总量,超过 Redis 的 maxmemory 配置项时(例如 4GB),就会触发 Redis 进行数据淘汰。一旦数据被淘汰出 Redis,再要访问这部分数据,就需要去后端数据库读取,这就降低了应用的访问性能。此外,更糟糕的是,如果使用多个客户端,导致 Redis 内存占用过大,也会导致内存溢出(out-of-memory),进而会引起 Redis 崩溃,给业务造成严重影响。

所以,我们必须得想办法避免输入缓冲区溢出。可以从两个角度去考虑如何避免,一是把缓冲区调大,而是从数据命令的发送和处理速度入手

目前是没有办法通过参数调整输入缓冲区的大小的

Redis 客户端输入缓冲区的上限阈值,在代码中就设定为了 1GB。也就是说,Redis 服务端允许为每个客户端最多暂存 1GB 的命令和数据。1GB 大小,对于一般的生产环境已经是比较合适的了。一方面,这个大小对于处理绝大部分客户端的骑牛已经够用了;另一方面,如果再大的话,Redis 就有可能因为客户端占用过多的内存资源而崩溃。

所以,Redis 并没有提供参数让我们调节客户端输入缓冲区的大小。如果要避免输入缓冲区溢出,那我们就只能从数据命令的发送和处理速度入手,也就是前面提到的避免客户端写入 bigkey,以及避免 Redis 主线程阻塞。

3.输出缓冲区溢出,及应对办法

Redis 的输出缓冲区暂存的是 Redis 主线程返回给客户端的数据。一般来说,主线程返回给客户端的数据,有简单且大小固定的 OK 响应或报错信息,也有大小不固定的具体的执行结果。

因此,Redis 为每个客户端设置的输出缓冲区也包括两部分:

  • 大小为 16KB 的固定缓冲空间,用来暂存 OK 响应或出错信息。
  • 可以动态增加的缓冲区空间,用来暂存大小可变的响应结果。

什么情况下会发生输出缓冲区溢出

  • 服务器端返回 bigkey 的大量结果
  • 执行了 MONITOR 命令
  • 缓冲区大小设置的不合理

3.1 服务器端返回 bigkey 的大量结果

其中,bigkey 原本就会占用大量的内存空间,所以服务端返回的结果包括 bigkey,比如会影响输出缓冲区。

3.2 执行了 MONITOR 命令

MONITOR 命令是用来监测 Redis 执行的。执行这个命令后,就会持续输出监测到的各个操作命令,如下所示:

MONITOR
OK
1600617456.437129 [0 127.0.0.1:50487] "COMMAND"
1600617477.289667 [0 127.0.0.1:50487] "info" "memory"

MONITOR 的输出结果会持续占用输出缓冲区,并越占越多,最后的结果就是发生溢出。所以,给你一个建议:MONITOR 命令主要用在调试环境中,不在在生产环境中持续使用 MONITOR。当然,如果在线上环境中偶尔使用 MONITOR 检查 Redis 命令的执行情况,是没问题的。

3.3 缓冲区大小设置的不合理

和输入缓冲区不同,我们可以通过 client-output-buffer-limit 配置项,来设置缓冲区的大小。具体的设置内容包括:

  • 设置输出缓冲区大小的上限阈值:
  • 设置输出缓冲区持续写入数据的数量上限阈值,和持续写入数据的时间上线阈值。

在具体使用 client-output-buffer-limit 来设置缓冲区大小的时候,我们要先区分下客户端的类型。

对于和 Redis 实例进行交互的应用程序来说,主要使用两类客户端和 Redis 服务端交互,分别是常规和 Redis 服务器端进行写命令交互的客户端,以及订阅 Redis 频道的订阅客户端。此外,在 Redis 主从集群中,主节点上也有一类客户端(从节点客户端)用来和从节点进行数据同步,这个在下一小节介绍。

当我们给普通客户端设置缓冲区大小时,通常可以在 Redis 配置文件中进行这样的设置

client-output-buffer-limit normal 0 0 0
  • 其中 normal 表示当前设置的是普通客户端:
  • 第一个 0 表示输出缓冲区大小限制
  • 第二个 0 表示输出缓冲区持续写入数量
  • 第二个 0 表示输出缓冲区持续写入时间

对于客户端来说,每发送完一个请求,会等请求结果返回后,再发送下一个请求,这种发送方式称为阻塞式发送。在这种情况下,如果不是读取体量特别大的 bigkey,服务器端输出缓冲区一般不会阻塞的。

所以,我们通常把普通客户端的输出缓冲区大小限制、持续写入量限制、持续写入时间限制都设置为 0,也就是不做限制

对于订阅客户端来说,一旦订阅的 Redis 频道有消息了,服务器端都会通过输出缓冲区把消息发送给客户端。所以,订阅客户端和服务器间的消息发送方式,不属于阻塞式发送。不过,如果频道消息多的话,也会占用较多的输出缓冲区空间。

因此,我们会给客户端设置缓冲区大小限制、持续写入量限制、持续写入时间限制,可以在 Redis 配置文件中这样设置:

client-output-buffer-limit pubsub 8mb 2mb 60
  • 其中 pubsub 参数表示当前是对订阅客户端的设置
  • 8mb 表示输出缓冲区大小限制为 8MB,一旦实际占用的缓冲区大小要超过 8MB,服务器端就会直接关闭客户端连接。
  • 2mb60 表示,如果连续 60 秒内对输出缓冲区的写入量超过 2MB 的话,服务端也会关闭客户端连接。

4.主从集群中的缓冲区溢出,及应对办法

主从集群间的数据复制包括全量复制和增量复制两种。全量复制是同步所有数据,而增量复制只会把主从库网络断连期间主库接收到的命令,同步给从库。无论那种形式的复制中,为了保证主从节点的数据一致,都会用到缓冲区。但是这两种复制场景下的缓冲区在溢出影响和大小设置方面并不一样。

4.1.复制缓冲区的溢出问题,及应对办法

在全量复制过程中,主节点向从节点传输 RDB 文件的同时,会继续接收客户端发送的写命令。这些写命令会先保存在复制缓冲区中,等 RDB 文件传输完成后,再发送给从节点去执行。主节点上会为每个从节点都维护一个复制缓冲区,来保证主从节点间的数据同步。

在这里插入图片描述
所以,我们在全量复制时,从节点接收和加载 RDB 较慢,同时主节点接收到了大量的写命令,写命令在复制缓冲区中就会越积越多,最终导致溢出。

其实,主节点上的复制缓冲区,本质上也是一个用于和从节点连接的客户端(称为节点客户端),使用的输出缓冲区。复制缓冲区一旦发生溢出,节点也会直接关闭和从节点进行的复制操作的连接,导致全量复制失败。 那该如何避免复制缓冲区发生溢出呢?

  • 一方面,我们可以控制主节点保存的数据量大小。按通常的使用经验,我们会把主节点的数据量控制在 2~4GB,这样可以让全量同步执行地更快些,避免复制缓冲区积累过多。
  • 另一方面,我们可以使用 client-output-buffer-limit 配置项,来设置合理的复制缓冲区大小。设置的依据,就是主节点的数据量大小、主节点的写负载压力和主节点本身的内存大小。

在主节点执行如下命令:

config set client-output-buffer-limit slave 512mb 128mb 60
  • slalve 参数表明该配置项是针对复制缓冲区的。
  • 512mb 参数表明主从复制缓冲区的上线为 512MB。
  • 128mb60 代表的是,如果连续 60 秒的写入量超过 128MB 的话,也会触发缓冲区溢出。

假设一条写命令数据是 1KB,那么,复制缓冲区可以累计 512KB 条(512MB / 1KB = 512KB)写命令。同时,主节点在全量复制期间,可以收受的写命令速率上线是 2000 条/秒(128MB / 1KB / 60 约等于 2000)。

这样,我们就得到了一种方法:在实际应用中设置复制缓冲区的大小时,可以根据写命令数据的大小和应用的实际负载情况(也就是写命令的速率),来粗略估计缓冲区会累积的写命令数量;然后,再和所设置的复制缓冲去大小进行比较,判断设置的缓冲区大小是否足够支撑累积的写命令数据量。

关于复制缓冲区,还会遇到一个问题。主节点上复制缓冲区的内存开销,会是每个从节点客户端输出缓冲区占用内存的总和。如果集群中的从节点非常多的话,主节点的内存开销就会非常大。所以,我们必须得控制和主节点连接的从节点个数,不要使用大规模的主从集群

总结一下:为了避免复制缓冲区积累过多命令造成溢出,引发全量复制失败,我们可以控制主节点保存的数据量大小,并设置合理的复制缓冲区大小。同时,我们还要控制从节点数量,来避免主节点中复制缓冲区占用过多内存的问题。

4.2 复制积压缓冲区的溢出问题

接下来,我们再来看下增量复制时使用的缓冲区,这个缓冲区称为复制积压缓冲区

主节点在把接收到的写命令同步给从节点时,同时会把这些写命令写入复制积压缓冲区。一旦从节点发生网络闪断,再次和主节点恢复连接后,从节点就会从复制积压缓存区中,读取断连期间主节点接收到的写命令,进而进行增量同步,如下所示:
在这里插入图片描述
看到这里是不是有点熟悉,我们之前已经讲过复制积压缓冲区,它就是 repl_backlog_buffer

首先复制积压缓冲区是一个大小有限的环形缓冲区。当主节点把复制积压缓冲区写满后,会覆盖缓冲区中的旧命令。如果从节点还没有同步这些旧命令的数据,就会造成主从节点间开始执行全量复制。

其次,为了应对复制积压缓冲区的溢出问题,我们可以调整复制积压缓冲区的大小,也就是设置 repl_backlog_size 这个参数的值。

小结

现在,从缓冲区溢出对 Redis 的影响的角度,再把这四个缓冲区分成两类做个总结。

  • 缓冲区溢出导致网络连接关闭: 普通客户端、订阅客户端,以及从节点客户端,他们使用的缓冲区,本质上都是 Redis 客户端和服务器之间,或是主从节点之间为了传输命令数据而维护的。这些缓冲区一旦发生溢出,处理机制都是直接把客户端和服务端的连接关闭。网络连接关闭造成的直接影响就是业务程序无法读写 Redis,或者是主从节点全量同步失败,需要重新执行。
  • 缓冲区溢出导致命令数据丢失:主节点上的复制积压缓冲区属于环形缓冲区,一旦发生溢出,新写入的命令会直接覆盖旧命令,导致旧命令数据的丢失,进而导致主从节点重新进行全量复制。

从本质上看,缓冲区溢出,无非就是三个原因:命令数据发送过快过大;命令数据处理较慢;缓冲区空间太小。针对这三个原因的应对策略:

  • 针对命令数据发送过快过大的问题:对于普通缓冲区来说是避免 bigkey ;而对于复制缓冲区来说,就是避免过大的 RDB 文件
  • 针对命令数据处理较慢的问题:解决方案是减少 Redis 主线程上的阻塞操作,例如使用异步删除操作。
  • 针对缓冲区空间太小的问题:解决方案是使用 client-output-buffer-limit 配置项设置合理的输出缓冲区、复制缓冲区和复制积压缓冲区大小。当然,不要忘了,输入缓冲区的大小是固定的,无法修改,除非修改 Redis 的源码。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/362931.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

dv和ov通配符SSL证书的区别

SSL数字证书是一种数字证书,可以保护网站传输数据安全以及对服务器身份进行验证,SSL证书有很多种,而通配符证书则是其中的一种特殊类型。SSL证书旗下的通配符SSL证书随着互联网的发展,颁发量也越来越多,为了使用户选择…

多智能体强化学习--MAPPO(pytorch代码详解)

标题 代码详解Actor和Critic网络的设置 代码详解 代码链接(点击跳转) Actor和Critic网络的设置 基本设置:3个智能体、每个智能体观测空间18维。Actor网络:实例化一个actor对象,input-size是18Critic网络&#xff1…

第 10 章:在C++中使用协程进行系统编程

最后一章专门介绍了一项对系统编程非常有用的功能,但这在C标准中相对较新。协程对象迅速找到了应用,成为了一等公民的状态机对象。它们的强大之处在于隐藏了协程帧后面的逻辑。请注意,这是一个高级主题,且C的协程接口既不简单也不…

C++(9) 虚函数

文章目录 虚函数1. 虚函数1.1 虚函数案例11.2 虚函数案例21.2 纯虚函数1.3 纯虚函数语法要求总环1.4 纯虚函数应用1.4.1 生活案例1.4.2 虚函数引用代码 虚函数 1. 虚函数 1.1 虚函数案例1 #include <iostream>using namespace std;class Animal { public:// Animal 类…

神经网络与深度学习Pytorch版 Softmax回归 笔记

Softmax回归 目录 Softmax回归 1. 独热编码 2. Softmax回归的网络架构是一个单层的全连接神经网络。 3. Softmax回归模型概述及其在多分类问题中的应用 4. Softmax运算在多分类问题中的应用及其数学原理 5. 小批量样本分类的矢量计算表达式 6. 交叉熵损失函数 7. 模型预…

VMware虚拟机安装统信uos桌面专业版操作系统系统

统信uos桌面版版本对比:https://www.uniontech.com/next/product/desktop-contrast专业版只要是面向政企等单位,这里只是用虚拟机安装测试基本功能使用,对于我们个人要长期使用的话可以使用家庭版或者社区版 1镜像下载 1.1打开官网 镜像在统信生态社区下载统信生态社区官网:…

【pytest系列】- assert断言的使用

&#x1f525; 交流讨论&#xff1a;欢迎加入我们一起学习&#xff01; &#x1f525; 资源分享&#xff1a;耗时200小时精选的「软件测试」资料包 &#x1f525; 教程推荐&#xff1a;火遍全网的《软件测试》教程 &#x1f4e2;欢迎点赞 &#x1f44d; 收藏 ⭐留言 &#x1…

Vue打包后,页面样式出现混乱,刷新即可恢复正常

错误效果 本地上的样式完全正常&#xff0c;打包后的页面第一次进入出现样式错误的现象&#xff0c;刷新一次就恢复正常了 正确效果 找到问题 异常情况是右上方我圈出来的部分&#xff0c; .spContent .conTitle{} 是这个Live Video的样式类&#xff0c; 但是页面中也使用了…

Vue之状态管理的简单使用(事件总线(Event Bus),Vuex和若依前端示例)

文章目录 Vue之状态管理的简单使用&#xff08;事件总线&#xff08;Event Bus&#xff09;&#xff0c;Vuex和若依前端示例&#xff09;Vue之事件总线&#xff08;Event Bus&#xff09;的简单使用Vuex进行状态管理的简单使用若依前端代码store状态管理&#xff1a; Vue之状态…

机械师K7 87键盘拆解螺丝位置

拆键盘不需要拔掉所有键盘帽,只需要拔掉螺丝位置所在的两侧键帽就可以. 红色①-⑮是螺丝所在位置,一般在两个键帽中间下面位置就是螺丝. 拆开以后电池仓尺寸:4CM*9CM , 适合的电池型号:504080型 50:电池厚度50mm 40:电池宽度40mm 80:电池长度80mm 插头是:1.25红黑头 TB都可以买…

VR全景技术如何运用在文旅展示,VR全景技术对景区有哪些好处

引言&#xff1a; 随着科技的不断进步和社会的不断发展&#xff0c;VR全景技术越来越受到人们的关注。在文化旅游行业中&#xff0c;VR全景技术的应用为景区提供了全新的展示方式和体验内容&#xff0c;极大地丰富了游客的文化旅游体验。那么VR全景技术能给文旅展示带来哪些好…

Windows 10 系统重装太简单了,U盘、PE已经成为历史

虽时至今日&#xff0c;Windows 系统的越来越现代化&#xff0c;连安装方式越简单很多。使用微软官方的安装程序&#xff0c;几乎可以像安装软件一样安装系统。本文将推荐几种小淙比较喜欢的 Windows 10 系统重装方式&#xff0c;大家可以按照教程说明操作。 注意&#xff1a;…

Hive中left join 中的where 和 on的区别

目录 一、知识点 二、测试验证 三、引申 一、知识点 left join中关于where和on条件的知识点&#xff1a; 多表left join 是会生成一张临时表。on后面&#xff1a; 一般是对left join 的右表进行条件过滤&#xff0c;会返回左表中的所有行&#xff0c;而右表中没有匹配上的数…

Unity中开发程序打包发布

添加ESC脚本 使用Unity打包发布的过程中&#xff0c;考虑到打开的程序会处于全屏界面&#xff0c;而此时我们又会有退出全屏的需求&#xff0c;因此需要添加ESC脚本&#xff0c;当我们单击ESC脚本的过程中&#xff0c;退出全屏模式。 在Assets/Scenes下&#xff0c;创建esc.cs…

正弦波拟合

正弦波拟合是一种常见的数学方法&#xff0c;用于确定最佳匹配给定数据集的正弦波形。这可以用于各种应用&#xff0c;如信号处理、周期性数据分析等。以下举例展示如何进行正弦波拟合。 步骤与方法 收集数据&#xff1a;首先&#xff0c;你需要收集或生成一组数据&#xff0…

陪诊小程序系统专业开发:从需求分析到用户体验

随着社会老龄化程度的加深&#xff0c;以及人们对医疗服务需求的增加&#xff0c;陪诊服务逐渐成为一种重要的社会服务。为了满足这种需求&#xff0c;陪诊小程序系统应运而生。本文将探讨陪诊小程序系统的专业开发&#xff0c;包括需求分析、系统设计、技术实现和用户体验等方…

《区块链简易速速上手小册》第8章:区块链的技术挑战(2024 最新版)

文章目录 8.1 可扩展性问题8.1.1 基础知识8.1.2 主要案例&#xff1a;比特币的可扩展性挑战8.1.3 拓展案例 1&#xff1a;以太坊的可扩展性改进8.1.4 拓展案例 2&#xff1a;侧链和分层解决方案 8.2 安全性与隐私8.2.1 基础知识8.2.2 主要案例&#xff1a;比特币交易的安全性8.…

若依框架快速入门

首先看若依文档 一般情况下&#xff0c; ruoyi-system是储存后台代码的&#xff0c; ruoyi-ui是储存前端代码的 1.拉取代码 2.若依的结构 3.运行SQL脚本 sql文件夹中是有两个sql脚本的&#xff0c;这两个脚本都是若依开源项目的必须脚本&#xff0c;需要运行在你自己 的数…

Django中的模板

目录 一:基本概念 二&#xff1a;模板继承 在Django中&#xff0c;模板是用于呈现动态内容的HTML文件。它们允许你将动态数据与静态模板结合起来&#xff0c;生成最终的HTML页面。 Django模板使用特定的语法和标签来插入动态内容。你可以在模板中使用变量、过滤器和标签来控…

XVC768AE102 3BHB007211R0102

XVC768AE102 3BHB007211R0102 XVC768AE102 3BHB007211R0102 基于CAN总线接口和模块控制器实现组合机床电控通信系统的设计 "... 并联组合机床电控的数据采集模块和CAN总线组成。 本文研究的 ... 。 监控主机通过CAN总线从各模块获取现场控制数据&#xff0c;监控整个系…