【Redis】Redis 典型应用 - 缓存 (Cache) 原理与策略

目录

    • Redis 典型应⽤ - 缓存 (cache)
      • 什么是缓存
      • 使⽤ Redis 作为缓存
      • 缓存的更新策略
        • 1)定期⽣成
        • 2)实时生成
      • 缓存预热,缓存穿透,缓存雪崩 和 缓存击穿
        • 关于缓存预热 (Cache preheating)
          • 什么是缓存预热
        • 关于缓存穿透 (Cache penetration)
        • 什么是缓存穿透
          • 为何产⽣
          • 如何解决
        • 关于缓存雪崩 (Cache avalanche)
          • 什么是缓存雪崩
          • 为何产⽣
          • 如何解决
        • 关于缓存击穿 (Cache breakdown)
          • 什么是缓存击穿
          • 如何解决


Redis 典型应⽤ - 缓存 (cache)

什么是缓存

缓存 (cache) 是计算机中的⼀个经典的概念,在很多场景中都会涉及到。

核⼼思路就是把⼀些常⽤的数据放到触⼿可及(访问速度更快)的地⽅, ⽅便随时读取。

举个例⼦:

⽐如我需要去⾼铁站坐⾼铁. 我们知道坐⾼铁是需要反复刷⾝份证的 (进⼊⾼铁站, 检票, 上⻋,乘⻋过程中, 出站…)

正常来说, 我的⾝份证是放在⽪箱⾥的(⽪箱的存储空间⼤, ⾜够能装). 但是每次刷⾝份证都需要开⼀次⽪箱找⾝份证, 就⾮常不⽅便。

因此我就可以把⾝份证先放到⾐服⼝袋⾥。⼝袋虽然空间⼩, 但是访问速度⽐⽪箱快很多。

这样的话每次刷⾝份证我只需要从⼝袋⾥掏⾝份证就⾏了, 就不必开⽪箱了。

此时 “口袋” 就是 “皮箱” 的缓存. 使用缓存能够⼤ 提⾼访问效率

这⾥所说的 “触⼿可及” 是个相对的概念

我们知道, 对于硬件的访问速度来说, 通常情况下:

CPU 寄存器 > 内存 > 硬盘 > ⽹络。可以用速度快的设备作为速度慢的设备的缓存。

那么硬盘相对于⽹络是 “触⼿可及的”, 就可以使⽤硬盘作为⽹络的缓存。

内存相对于硬盘是 “触⼿可及的”, 就可以使⽤内存作为硬盘的缓存。

CPU 寄存器相对于内存是 “触⼿可及的”, 就可以使⽤ CPU 寄存器作为内存的缓存。

对于计算机硬件来说,往往访问速度越快的设备,成本越⾼,存储空间越⼩。

缓存是更快, 但是空间上往往是不⾜的. 因此⼤部分的时候, 缓存只放⼀些 热点数据 (访问频繁的数据),就⾮常有⽤了。

关于 “⼆⼋定律”

20% 的热点数据, 能够应对 80% 的访问场景。

因此只需要把这少量的热点数据缓存起来,就可以应对⼤多数场景,从⽽在整体上有明显的性能提升

使⽤ Redis 作为缓存

在⼀个⽹站中,我们经常会使⽤关系型数据库 (⽐如 MySQL) 来存储数据。

关系型数据库虽然功能强⼤,但是有⼀个很⼤的缺陷,就是性能不⾼。(换⽽⾔之, 进⾏⼀次查询操作消耗的系统资源较多)。

为什么说关系型数据库性能不⾼?

  1. 数据库把数据存储在硬盘上, 硬盘的 IO 速度并不快。尤其是随机访问。
  2. 如果查询不能命中索引, 就需要进⾏表的遍历, 这就会⼤ 增加硬盘 IO 次数。
  3. 关系型数据库对于 SQL 的执⾏会做⼀系列的解析, 校验, 优化⼯作。
  4. 如果是⼀些复杂查询, ⽐如联合查询, 需要进⾏笛卡尔积操作, 效率更是降低很多。

因此,如果访问数据库的并发量⽐较⾼,对于数据库的压⼒是很⼤的,很容易就会使数据库服务器宕机。

为什么并发量⾼了就会宕机?

服务器每次处理⼀个请求, 都是需要消耗⼀定的硬件资源的. 所谓的硬件资源包括不限于 CPU,内存, 硬盘, ⽹络带宽…

⼀个服务器的硬件资源本⾝是有限的。⼀个请求消耗⼀份资源, 请求多了, ⾃然把资源就耗尽了。 后续的请求没有资源可⽤, ⾃然就⽆法正确处理. 更严重的还会导致服务器程序的代码出现崩溃。

如何让数据库能够承担更⼤的并发量呢? 核⼼思路主要是两个:

  • 开源:引⼊更多的机器, 部署更多的数据库实例, 构成数据库集群。(主从复制, 分库分表等…)
  • 节流:引⼊缓存,使⽤其他的⽅式保存经常访问的热点数据,从⽽降低直接访问数据库的请求数量

实际开发中, 这两种⽅案往往是会搭配使⽤的

Redis 就是⼀个⽤来作为数据库缓存的常⻅⽅案

Redis 访问速度⽐ MySQL 快很多。或者说处理同⼀个访问请求, Redis 消耗的系统资源⽐ MySQL 少很多。因此 Redis 能⽀持的并发量更⼤

  • Redis 数据在内存中, 访问内存⽐硬盘快很多
  • Redis 只是⽀持简单的 key-value 存储, 不涉及复杂查询的那么多限制规则

就像⼀个 “护盾” ⼀样,把 MySQL 给罩住了

  • 客⼾端访问业务服务器, 发起查询请求
  • 业务服务器先查询 Redis, 看想要的数据是否在 Redis 中存在
    • 如果已经在 Redis 中存在了, 就直接返回。此时不必访问 MySQL 了
    • 如果在 Redis 中不存在, 再查询 MySQL

按照上述讨论的 “⼆⼋定律” , 只需要在 Redis 中放 20% 的热点数据, 就可以使 80% 的请求不再真正查询数据库了。

当然, 实践中究竟是 “⼆⼋”, 还是 “⼀九”, 还是 “三七”, 这个情况可能会根据业务场景的不同, 存在差异。但是⾄少绝⼤多数情况下, 使⽤缓存都能够⼤ 提升整体的访问效率, 降低数据库的压⼒。

注意!

缓存是⽤来加快 “读操作” 的速度的。如果是 “写操作”, 还是要⽼老实实写数据库, 缓存并不能提⾼性能。

缓存的更新策略

接下来还有⼀个重要的问题, 到底哪些数据才是 “热点数据” 呢?

1)定期⽣成

每隔⼀定的周期(⽐如⼀天/⼀周/⼀个⽉), 对于访问的数据频次进⾏统计。挑选出访问频次最⾼的前 N%的数据。

以搜索引擎为例

⽤⼾在搜索引擎中会输⼊⼀个 “查询词”, 有些词是属于⾼频的, ⼤家都爱搜(鲜花, 蛋糕, 同城交友, 不孕不育…). 有些词就属于低频的, ⼤家很少搜。

搜索引擎的服务器会把哪个⽤⼾什么时间搜了啥词, 都通过⽇志的⽅式记录的明明⽩白。然后每隔⼀段时间对这期间的搜索结果进⾏统计 (⽇志的数量可能⾮常巨⼤,这个统计的过程可能需要使⽤ hadoop 或者 spark 等⽅式完成)。从⽽就可以得到 “⾼频词表” 。

步骤:

  1. 完成统计热词的过程
  2. 根据热词,找到搜索结果的数据(广告数据)
  3. 把得到缓存数据同步到缓存服务器上
  4. 控制这些缓存服务器自动重启

优点是实现容易,过程可控。但这种做法实时性较低,对于⼀些突然情况应对的并不好。

⽐如春节期间, “春晚” 这样的词就会成为⾮常⾼频的词。⽽平时则很少会有⼈搜索 “春晚”

2)实时生成

先给缓存设定容量上限(可以通过 Redis 配置⽂件的 maxmemory 参数设定)

接下来把⽤⼾每次查询:

  • 如果在 Redis 查到了, 就直接返回
  • 如果 Redis 中不存在, 就从数据库查, 把查到的结果同时也写⼊ Redis

如果缓存已经满了(达到上限), 就触发缓存淘汰策略, 把⼀些 “相对不那么热⻔” 的数据淘汰掉。

按照上述过程,持续⼀段时间的“动态平衡”之后,Redis 内部的数据⾃然就是 “热⻔数据” 了。

通⽤的淘汰策略主要有以下⼏种:

下列策略并⾮局限于 Redis, 其他缓存也可以按这些策略展开。

FIFO (First In First Out) 先进先出

把缓存中存在时间最久的 (也就是先来的数据) 淘汰掉

LRU (Least Recently Used) 淘汰最久未使⽤的

记录每个 key 的最近访问时间。把最近访问时间最⽼的 key 淘汰掉。

LFU (Least Frequently Used) 淘汰访问次数最少的

记录每个 key 最近⼀段时间的访问次数。把访问次数最少的淘汰掉。

Random 随机淘汰

从所有的 key 中抽取幸运⼉被随机淘汰掉。

理解上述⼏种淘汰策略:

想象你是个皇帝, 有后宫佳丽三千。虽然你是 “真⻰天⼦”, 但是经常宠幸的妃⼦也就那么寥寥数⼈(精⼒有限)。

后宫佳丽三千, 相当于数据库中的全量数据。经常宠幸的妃⼦相当于热点数据, 是放在缓存中的

今年选秀的⼀批新的⼩主, 其中有⼀个被你看上了。宠信新⼈, ⾃然就需要有旧⼈被冷落。到底谁是要被冷落的⼈呢?

  • FIFO:皇后是最先受宠的,现在已经年⽼⾊衰了,皇后失宠。
  • LRU:统计最近宠幸时间。皇后(⼀周前), 熹妃(昨天), 安答应(两周前), 华妃(⼀个⽉前)。华妃失宠。
  • LFU:统计最近⼀个⽉的宠幸次数, 皇后(3次), 熹妃(15次), 安答应(1次), 华妃(10次)。安答应失宠。
  • Random:随机挑⼀个妃⼦失宠。

这⾥的淘汰策略, 我们可以⾃⼰实现。当然 Redis 也提供了内置的淘汰策略,也可以供我们直接使⽤。

Redis 内置的内存淘汰策略如下:

  • volatile-lru 当内存不⾜以容纳新写⼊数据时,从设置了过期时间的key中使⽤ LRU(least recently used 最近最少使⽤)算法进⾏淘汰
  • allkeys-lru 当内存不⾜以容纳新写⼊数据时,从所有key中使⽤ LRU(最近最少使⽤)算法进⾏淘汰
  • volatile-lfu 4.0版本新增,当内存不⾜以容纳新写⼊数据时,在过期的key中,使⽤ LFU(least frequently used 最不经常使用) 算法进⾏删除key
  • allkeys-lfu 4.0版本新增,当内存不⾜以容纳新写⼊数据时,从所有key中使⽤ LFU 算法进⾏淘汰
  • volatile-random 当内存不⾜以容纳新写⼊数据时,从设置了过期时间的key中,随机淘汰数据
  • allkeys-random 当内存不⾜以容纳新写⼊数据时,从所有key中随机淘汰数据
  • volatile-ttl 在设置了过期时间的key中,根据过期时间进⾏淘汰,越早过期的优先被淘汰(相当于 FIFO, 只不过是局限于过期的 key)
  • noeviction 默认策略,当内存不⾜以容纳新写⼊数据时,新写⼊操作会报错。(不适用于实时更新缓存)

整体来说 Redis 提供的策略和我们上述介绍的通⽤策略是基本⼀致的。只不过 Redis 这⾥会针对 “过期key” 和 “全部 key” 做分别处理

缓存预热,缓存穿透,缓存雪崩 和 缓存击穿

关于缓存预热 (Cache preheating)
什么是缓存预热

和缓存里的热点数据怎么来是密切相关的

  1. 定期生成,是不涉及“预热”的
  2. 实时生成

使⽤ Redis 作为 MySQL 的缓存的时候, 当 Redis 刚刚启动, 或者 Redis ⼤批 key 失效之后, 此时由于Redis ⾃⾝相当于是空着的, 没啥缓存数据, 那么 MySQL 就可能直接被访问到, 从⽽造成较⼤的请求压⼒。

缓存预热,就是解决上述问题

通过把定期生成和实时生成结合一下。

先通过离线的方式,通过一些统计的途径,把热点数据找到一批,导入到 redis 中。此时导入的这批热点数据,就能帮 MySQL 承担很大压力了。

因此就需要提前把热点数据准备好, 直接写⼊到 Redis 中,使 Redis 可以尽快为 MySQL 撑起保护伞。

热点数据可以基于之前介绍的统计的⽅式⽣成即可。这份热点数据不⼀定⾮得那么 “准确”, 只要能帮助MySQL 抵挡⼤部分请求即可。随着程序运⾏的推移, 缓存的热点数据会逐渐⾃动调整, 来更适应当前情况

关于缓存穿透 (Cache penetration)
什么是缓存穿透

访问的 key 在 Redis 和 数据库中都不存在。此时这样的 key 不会被放到缓存上,后续如果仍然在访问该key,依然会访问到数据库

这次查询,没有;下次查询,依然没有。

如果像这样的数据存在很多,并且还反复查询,一样会给 MySQL 造成很大压力

这就会导致数据库承担的请求太多,压⼒很⼤

这种情况称为 缓存穿透

为何产⽣

原因可能有⼏种:

  • 业务设计不合理。⽐如缺少必要的参数校验环节,导致⾮法的 key 也被进⾏查询了
  • 开发/运维误操作。不⼩⼼把部分数据从数据库上误删了
  • ⿊客恶意攻击
如何解决
  • 针对要查询的参数进⾏严格的合法性校验。⽐如要查询的 key 是⽤⼾的⼿机号,那么就需要校验当前 key 是否满⾜⼀个合法的⼿机号的格式
  • 针对数据库上也不存在的 key,也存储到 Redis 中,但是把 value 就随便设成⼀个 “”。避免后续频繁访问数据库
  • 使⽤布隆过滤器先判定 key 是否存在,再真正查询

关于布隆过滤器, 在数据结构进阶, 有具体介绍。

简单的说,布隆过滤器是结合了 hash + bitmap 的思想,能够⽤较少的空间,判定某个元素是否存在

关于缓存雪崩 (Cache avalanche)
什么是缓存雪崩

短时间内⼤量的 key 在缓存上失效,导致缓存命中率陡然下降,进而导致数据库压⼒骤增,甚⾄直接宕机

本来 Redis 是 MySQL 的⼀个护盾, 帮 MySQL 抵挡了很多外部的压⼒。⼀旦护盾突然失效了, MySQL⾃⾝承担的压⼒骤增, 就可能直接崩溃

为何产⽣

⼤规模 key 失效,可能性主要有两种

  • Redis 挂了
  • Redis 上的⼤量的 key 同时过期

为啥会出现⼤量的 key 同时过期?

这种很可能是短时间内在 Redis 上缓存了⼤量的 key, 并且设定了相同的过期时间(和 redis 内存淘汰机制是配合使用)

如何解决
  • 部署⾼可⽤的 Redis 集群,并且完善监控报警体系
  • 不给 key 设置过期时间 或者 设置过期时间的时候添加随机时间因⼦,避免同一时刻过期
关于缓存击穿 (Cache breakdown)
什么是缓存击穿

此处把 breakdown 翻译成 “击穿” ,个⼈以为并⾮是⼀个好的选择。容易和缓存穿透混淆。

翻译成 “瘫痪” 或者 “崩溃” 也许更合适⼀些

breakdown n.(汽⻋或机器的)故障,损坏;(关系的)破裂,(系统的)瘫痪;精神崩溃,(健康、体⼒等的)衰竭;细⽬,分类;分解;跺脚曳步舞

相当于缓存雪崩的特殊情况。针对热点 key,突然过期了,导致⼤量的请求直接访问到数据库上,甚⾄引起数据库宕机。

如何解决
  • 基于统计的⽅式发现热点 key,并设置永不过期
  • 进⾏必要的服务降级。例如访问数据库的时候使⽤分布式锁,限制同时请求数据库的并发数。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/875605.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Maven从入门到精通(二)

一、什么是pom.xml pom.xml是Maven项目的核心配置文件,它是 项目对象模型 - Project Object Model(POM)的缩写。POM定义了项目的所有属性,包括项目的名称、版本、依赖关系、构建配置等。使用pom.xml,我们可以轻松地管…

区间和的个数

题目链接 区间和的个数 题目描述 注意点 求数组中&#xff0c;值位于范围 [lower, upper] &#xff08;包含 lower 和 upper&#xff09;之内的 区间和的个数-2^31 < nums[i] < 2^31 - 1-10^5 < lower < upper < 10^5 解答思路 参照题解使用归并排序解决本…

游戏开发引擎___unity位置信息和unlit shader(无光照着色器)的使用,以桌子的渲染为例

unity是左手坐标系 1.位置信息 1.1 代码 using System.Collections; using System.Collections.Generic; using UnityEngine;public class positionTest : MonoBehaviour {public Camera Camera;private void OnGUI(){//世界坐标系&#xff0c;GUI里的标签GUI.Label(new Rec…

Linux 挂载磁盘与开机自动挂载操作指南

Linux 挂载磁盘与开机自动挂载操作指南 文章目录 Linux 挂载磁盘与开机自动挂载操作指南一 挂载磁盘1 查看硬盘信息2 新增数据盘执行分区3 新建分区4 创建一个主分区5 分区编号6 初始磁柱编号7 截止磁柱编号8 查看新建分区信息9 分区结果写入10 新分区同步操作系统11 设置新分区…

9.12 TFTP通信

客户端设计&#xff08;仅供参考&#xff09;&#xff1a; 下载本质&#xff1a;读取服务器发送的数据包&#xff0c;写入到本地文件 上传本质&#xff1a;读取本地文件内容&#xff0c;发送给服务器。 1、建立菜单选项&#xff0c;上传和下载。 2、上传功能函数&#xff1a; …

【程序分享】Warren Cowley Parameters 程序:表征短程有序的化学基序

分享一个 Warren Cowley Parameters 程序&#xff1a;表征短程有序的化学基序。 感谢论文的原作者&#xff01; 主要内容 “晶体材料的化学成分具有原子尺度的波动&#xff0c;可调节各种中尺度特性。建立此类材料的化学-微结构关系需要对这些化学波动进行适当的表征。然而&…

2024网安周今日开幕,亚信安全亮相30城

2024年国家网络安全宣传周今天在广州拉开帷幕。今年网安周继续以“网络安全为人民&#xff0c;网络安全靠人民”为主题。2024年国家网络安全宣传周涵盖了1场开幕式、1场高峰论坛、5个重要活动、15场分论坛/座谈会/闭门会、6个主题日活动和网络安全“六进”活动。亚信安全出席20…

yolov8-obb中存在的一个bug

yolov8支持OBB目标检测,且能提供较好的性能。 但是最近在使用yolov8-obb的过程中,发现yolov8-obb存在一个bug。即训练数据如果包含不带旋转角度的水平目标时,训练出的模型,经常会输出垂直的检测框,需要旋转90度以后才能得到最终结果。把yolov8-obb相关的源码阅读一遍才发…

【数学建模】2024数学建模国赛经验分享

文章目录 一、关于我二、我的数模历程三、经验总结&#xff1a; 一、关于我 我的CSDN主页&#xff1a;https://gxdxyl.blog.csdn.net/ 2020年7月&#xff08;大二结束的暑假&#xff09;开始在CSDN写作&#xff1a; 阿里云博客专家&#xff1a; 接触的领域挺多的&#xff…

HTML 转 PDF API 接口

HTML 转 PDF API 接口 网络工具 / 文件处理 支持网页转 PDF 高效生成 PDF / 提供永久链接。 1. 产品功能 超高性能转换效率&#xff1b;支持将传递的 HTML 转换为 PDF&#xff0c;支持转换 HTML 中的 CSS 格式&#xff1b;支持传递网站 URL&#xff0c;直接转换页面成对应的 …

Java实现生成验证码实战

文章目录 需求描述思想思路实现代码实现效果 在实际项目中&#xff0c;管理端的登录&#xff0c;会涉及验证码的校验&#xff0c;简单的数字与字母组合形式&#xff0c;在Java中要如何生成与实现&#xff0c;记录下来&#xff0c;方便备查。 需求描述 生成8位的由数字、大写字…

【零基础学习CAPL】——CRC值监控测试

🙋‍♂️【零基础学习CAPL】系列💁‍♂️点击跳转 ——————————————————————————————————–—— 从0开始学习CANoe使用 从0开始学习车载车身 相信时间的力量 星光不负赶路者,时光不负有心人。 目录 1.概述2.需求介绍3.算法4.逻辑判断5.测…

ARCGIS PRO DSK MapTool

MapTool用于自定义地图操作工具&#xff0c;使用户能够在ArcGIS Pro中执行特定的地图交互操作。添加 打开MapTool1.vb文件&#xff0c;可以看到系统已经放出MapTool1类&#xff1a; Public Sub New()将 IsSketchTool 设置为 true 以使此属性生效IsSketchTool TrueSketchTyp…

为了准确计算延迟退休时间,我做了一个退休年龄计算器

延迟退休计算方法 原本退休分为三种情况&#xff0c;男性&#xff0c;女工人&#xff0c;女干部 男性&#xff1a;退休年龄为60岁。女干部&#xff1a;退休年龄为55岁。女工人&#xff1a;退休年龄为50岁。 现在延迟以后&#xff08;根据2024年9月13日公布的规则&#xff09…

一次开发,多端部署--实例二

一、视觉风格 1、分层参数 使用了分层参数后&#xff0c;当系统切换深色模式时&#xff0c;字体和背景也可以自适应。 Row() {Column() {Text(分层参数)// 分层参数在sysResource包&#xff0c;属于系统参数&#xff0c;全局可用.fontColor($r(sys_color.ohos_id_color_text_pr…

JavaScript模块化——ES6模块化规范

作者&#xff1a;CSDN-PleaSure乐事 欢迎大家阅读我的博客 希望大家喜欢 使用环境&#xff1a;vscode Chrome浏览器 1.ES6 1.1ES6介绍 ES6的全称是ECMAScript 6&#xff0c;也称为ES2015&#xff0c;是JavaScript的一个重要版本&#xff0c;它引入了许多新特性和改进&#xf…

云计算实训43——部署k8s基础环境、配置内核模块、基本组件安装

一、前期系统环境准备 1、关闭防火墙与selinux [rootk8s-master ~]# systemctl stop firewalld[rootk8s-master ~]# systemctl disable firewalldRemoved symlink /etc/systemd/system/multi-user.target.wants/firewalld.service. Removed symlink /etc/systemd/system/dbus…

云渲染与AI渲染分别是什么?两者的优势对比

云渲染和AI渲染是两种先进的渲染技术&#xff0c;它们各自具有独特的优势和应用场景。下面针对两种情况来简单说明下。 1、云渲染&#xff1a; - 定义&#xff1a;云渲染是一种利用远程服务器(云端)来处理和生成渲染效果的技术。它允许用户将计算密集型的任务转移到云端&#…

uniapp网络延迟优化之骨架屏

文章目录 前言uniapp网络延迟优化之骨架屏 一、骨架屏是什么&#xff1f;二、使用步骤1.在微信开发者工具生成骨架屏文件2.转成vue组件3.组件中使用4.效果展示4.开发时遇到的问题&#xff1f; 总结 前言 uniapp网络延迟优化之骨架屏 一、骨架屏是什么&#xff1f; 骨架屏的主…

C++ | Leetcode C++题解之第403题青蛙过河

题目&#xff1a; 题解&#xff1a; class Solution { public:bool canCross(vector<int>& stones) {int n stones.size();vector<vector<int>> dp(n, vector<int>(n));dp[0][0] true;for (int i 1; i < n; i) {if (stones[i] - stones[i -…