MySQL缓存策略

文章目录

  • 一、MySQL缓存方案的作用
  • 二、提高MySQL访问性能的方式
    • 2.1 读写分离
      • 2.1.1 是什么?
      • 2.1.2 解决了什么?
      • 2.1.3 原理是什么?
    • 2.2 连接池
      • 2.1.1 是什么?
      • 2.1.2 解决了什么?
      • 2.1.3 原理是什么?
    • 2.3 异步连接
      • 2.1.1 是什么?
      • 2.1.2 解决了什么?
      • 2.1.3 原理是什么?
  • 三、缓存方案
    • 3.1 缓存和MySQL一致性状态分析
    • 3.2 读写策略解决数据同步问题
      • 3.2.1 读策略
      • 3.2.1 写策略
    • 3.3 同步方案
  • 四、缓存故障及解决
    • 4.1 缓存穿透
    • 4.2 缓存击穿
    • 4.3 缓存雪崩
    • 4.4 缓存方案的弊端

一、MySQL缓存方案的作用

首先。我们进行一些具体的场景分析:

1)业务场景中,读的需求远远大于写的需求,因此应当主要关注如何提高读的性能。对于写没必要优化,但必须保证让数据正确的落盘。

2)另外,内存访问速度是磁盘访问速度的10万倍,访问磁盘的速度比较慢,因此尽量使得数据是从内存中获取。

3)项目中需要存储的数据应该远大于内存的容量,同时需要进行数据统计分析,所以数据存储获取的依据应该是关系型数据库,如MySQL 数据主要存储在磁盘当中。

4)MySQL自身缓冲层跟业务无关,这是由于 MySQL的缓冲层不由用户来控制,也就是不能由用户来控制缓存具体数据。MySQL的缓冲策略主要是 LRU。因此引入缓冲层,即需要一个缓存数据库,可以存储用户自定义的热点数据。如redis、memcached。

综合以上几点,MySQL缓存方案是:所有数据存放在主数据库,缓存数据库作为辅助数据库存放自定义的热点数据。这样用户可以直接从缓存获取热点数据,降低主数据库的读压力。

接下来,我们介绍几种提高MySQL访问性能的方式。

二、提高MySQL访问性能的方式

2.1 读写分离

2.1.1 是什么?

读写分离会设置多个从数据库,写操作依然在主数据库,而读操作在从数据库。

需要注意的是,从数据库可能会在多个机器中,主数据库是提供数据的主要依据。如果读操作有强一致性要求,那么还是需要去读主数据库。
在这里插入图片描述

2.1.2 解决了什么?

读写分离提高设置多个从数据库来解决主数据库的读压力。

2.1.3 原理是什么?

读写分离主要依据MySQL的主从复制原理,因为MySQL的主从复制是异步复制的,所以读写分离只能保证数据的最终一致性,不能保证实时一致性。如果读操作有强一致性要求,那么需要读操作去读主数据库。

MySQL主从复制

主从复制流程:

  1. 主库更新事件 ( update 、 insert 、 delete ) 通过 io-thread写到 binlog;
  2. 从库请求读取 binlog,通过 io-thread 写入从库本地 relay-log(中继日志);
  3. 从库通过 sql-thread 读取 relay-log,并把更新事件在从库中重放(replay)一遍;
    在这里插入图片描述

2.2 连接池

2.1.1 是什么?

连接池是在服务端当中创建多个与数据库的连接。参考Linux组件之数据库连接池
在这里插入图片描述

2.1.2 解决了什么?

数据库连接池并发提升了数据库的访问性能。同时复用连接,避免连接建立、断开、以及安全验证带来的额外开销。

2.1.3 原理是什么?

MySQL网络模型(select + 阻塞IO模型)

特别的,如果发送一个事务(多个sql语句),那么这个事务必须在一个连接中执行。

2.3 异步连接

2.1.1 是什么?

异步连接是在服务端创建一个连接,针对这个连接采用非阻塞IO

2.1.2 解决了什么?

异步连接节省了网络传输时间。

2.1.3 原理是什么?

使用了非阻塞IO

三、缓存方案

3.1 缓存和MySQL一致性状态分析

引入缓冲层后,我们对数据的获取需要分别操作缓存数据库和MySQL;那么这个时候数据可能存在几个状态:

  1. MySQL有,缓存无
  2. MySQL无,缓存有
  3. 都有,但数据不一致
  4. 都有,数据一致
  5. 都没有

对于以上的几种情况:

  • 4 和 5显然是没问题的
  • 低于1,我们获取数据的主要依据是 mysql,只需要将mysql 的数据正确同步到缓存数据库就可以了。
  • 对于2,缓存有,mysql 没有,这比较危险,此时我们可以认为该数据为脏数据。需要在同步策略中避免该情况发生。
  • 对于3,mysql 和缓存都有数据,但是数据不一致。这是mysql 同步到 redis 是异步复制,短时间内会出现数据不一致。这种也需要在同步策略中避免。

需要注意的是:缓存不可用,整个系统依然要保持正常工作;mysql 不可用的话,系统停摆,停止对外提供服务;

3.2 读写策略解决数据同步问题

3.2.1 读策略

准确来说,是热点数据读缓存,非热点数据直接读主数据库。

先读缓存
1)若缓存存在,直接返回;
2)若缓存不存在,再访问mysql
∘ \quad \circ 若 mysql 没有,则返回没有
∘ \quad \circ 若 mysql 有,同步数据到redis

3.2.1 写策略

写策略分两种:以安全为主、以效率为主。

1、以安全为主的写策略
先删除redis当中的数据,然后再写MySQL,最后将MySQL数据同步到redis中(交由 go-
mysql-transfer 等中间件处理)。这种策略将状态 3 转化成状态 1;

为什么先删除redis数据?
先删除缓存,是为了避免其他服务读取旧的数据;也是告知系统这个数据已经不是最新,建议从 mysql 获取数据。

存在的问题:
为了安全降低效率,不断删除缓存,使得设置缓存没有了意义。

2、以效率为主的写策略
先写缓存并设置过期时间(如 200ms),再写MySQL,等待MySQL同步到redis中(交由中间件处理)。

这里设置的过期时间是预估时间,大致上是 :
与MySQL网络传输时间 + MySQL处理时间 + MySQL同步到redis的时间

存在的问题:
在过期时间内,如200ms,如果写的过程中 mysql 停止服务,或数据没写入 mysql,则200 ms 内提供了脏数据服务;但仅仅只有 200ms 的数据错乱。

3.3 同步方案

同步方案主要解决如何将 Mysql 数据同步到 redis 中。主要有两种方法:
1)伪装从数据库。比如阿里 canal,go-mysql-transfer 等。
2)触发器 + udf:把热点数据表设置触发器,在触发器中调用 udf,udf 与 redis 建立连接,进行数据同步。udf全称User-defined function,是MySQL提供的一种可扩展代码。UDF不具备事务,不能回滚。总体而言这种方法效率较低,不建议。

3.3 伪装从数据库
3.3.1 阿里canal
Canal可以实时捕获MySQL等数据库中的数据变更,并将这些变更事件传递给redis等缓存数据库,实现数据的实时同步和复制。并且canal会考虑分布式问题,如果一个canal宕机了,会有从canal顶替上来,保证服务正常提供。
在这里插入图片描述
3.3.2 go-mysql-transfer
go-mysql-transfer是一个基于Go语言开发的数据库变更数据传输工具,它可以实时捕获MySQL数据库中的数据变更,并将变更事件传输到给redis等缓存数据库。go-mysql-transfer只有一个节点,相对canal简单些,没有解决分布式问题。

缺点是需要引入etcd、zk等实现高可用。

go-mysql-transfer的项目地址、go-mysql-transfer产品手册

具体流程是:
1)安装 go-mysql-transfer

# 安装 Golang 1.14 及以上版本
wget https://golang.google.cn/dl/go1.17.8.linux-amd64.tar.gz
tar -zxvf go1.17.8.linux-amd64.tar.gz
# 配置
vim /etc/profile
export PATH=$PATH:/opt/go/bin  # 配置 go 环境变量

# 安装 go-mysql-transfer
git clone https://gitee.com/mirrors/go-mysql-transfer.git
GO111MODULE=on
go env -w GOPROXY=https://goproxy.cn,direct
go build

2)修改 mysql 配置文件为主从模式,位置:/etc/mysql/my.cnf

log-bin=mysql-bin # 开启 binlog
binlog-format=ROW # 选择 ROW 模式
server_id=1 # 配置 MySQL replaction 需要定义,不要和slave_id重复

3)修改 app.yml,配置 mysql 和 redis,配置热点数据

# mysql配置
addr: 127.0.0.1:3306
user: root
pass: 123456
charset : utf8
slave_id: 1001 #slave ID

# redis连接配置
redis_addrs: 127.0.0.1:6379 # redis地址,多个用逗号分隔
redis_pass: 123456 # redis密码

# 配置热点数据
schema: mark # 数据库名称
table: t_user # 表名称
order_by_column: id #排序字段,存量数据同步时不能为空
column_underscore_to_camel: true # 列名称下划线转驼峰,默认为false
lua_file_path: lua/t_user.lua   # lua脚本文件位置
# redis相关    
redis_structure: hash # 数据类型。

4)编写 Lua 同步逻辑

local ops = require("redisOps") --加载redis操作模块

local row = ops.rawRow()  --当前数据库的一行数据,table类型,key为列名称
local action = ops.rawAction()  --当前数据库事件,包括:insert、update、delete

-- 同步方法
if action == "insert" or action == "update" then -- 只监听insert事件
    local id = row["id"] --获取ID列的值
    local key = "user:" .. id
    local name = row["nick"] --获取USER_NAME列的值
    local sex = row["sex"]
    local height = row["height"] --获取PASSWORD列的值
    local age = row["age"]
    ops.HSET(key, "id", id) -- 对应Redis的HSET命令
    ops.HSET(key, "nick", name) -- 对应Redis的HSET命令
    ops.HSET(key, "sex", sex) -- 对应Redis的HSET命令
    ops.HSET(key, "height", height) -- 对应Redis的HSET命令
    ops.HSET(key, "age", age) -- 对应Redis的HSET命令
elseif action == "delete" then
    local id = row['id']
    local key = "user:" .. id
    ops.DEL(key)
end

5)启动 mysql, redis, go-mysql-transfer

# 全量数据同步,初次启动
./go-mysql-transfer -stock
# 启动
nohup go-mysql-transfer &

四、缓存故障及解决

4.1 缓存穿透

如果某个数据在redis缓存和MySQL中都不存在,但此时一直尝试读这个不存在的数据,最后数据压力堆积在MySQL,可能会造成MySQL崩溃。

例如恶意攻击者可以通过构造大量不存在的查询请求来压垮数据库。

解决办法:
1)缓存设置<key,nil>:当发现MySQL不存在某个数据,将redis中对应的key设置为<key,nil>并设置过期时间。通过这样的标识,使得下次访问key的时候不要再去访问MySQL,并且到期自动删除这个key。但是这种方法会造成redis缓存数据库缓存很多无效数据,浪费内存。

2)部署布隆过滤器:将 MySQL当中已经存在的 key,写入布隆过滤器,不存在的直接 pass 掉。即使发生了缓存穿透,通过布隆过滤器在缓存层拦截无效的请求,避免无效查询到达MySQL。最好在缓存数据库上部署布隆过滤器。

4.2 缓存击穿

如果某个频繁访问的热点数据在redis缓存不存在(过期或被淘汰),但在MySQL中存在。此时有大量的并发连接请求该热点数据,会直接访问数据库,导致MySQL数据库压力骤增,可能造成MySQL数据库崩溃

解决办法:
1)过热数据不过期,即不要对频繁访问的热点数据设置过期时间。

2)使用分布式锁机制,保证只有一个请求能够访问数据库,其他请求在等待时可以从缓存中获取数据。

4.3 缓存雪崩

redis缓存中的大量数据同时过期或失效,但是在MySQL中存在,导致大量请求直接访问MySQL数据库,造成系统性能下降甚至崩溃。

缓存数据库在整个系统不是必须的,也就是缓存宕机不会影响整个系统提供服务。
解决办法:
1)如果因为缓存数据库宕机,造成所有数据涌向 MySQL。采用高可用的集群方案,如哨兵模式、cluster模式。

2)如果因为设置了相同的过期时间,造成缓存集中失效。设置随机过期值或者其他机制错开失效时间。

3) 如果因为系统重启的时候,造成缓存数据消失。重启时间短,redis 开启持久化(过期信息也会持久化)就行了; 重启时间长,提前将热数据导入 redis 当中。

4.4 缓存方案的弊端

不能处理多语句事务。这是因为redis缓存数据库不支持回滚,造成redis 缓存数据库 与MySQL存储数据库数据不一致。


注:本专栏知识点是通过<零声教育>的系统学习,进行梳理总结写下文章,对c/c++linux课程感兴趣的读者,可以点击链接,详细查看详细的服务器课程链接 。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/75069.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

数据通信——VRRP

引言 之前把实验做了&#xff0c;结果发现我好像没有写过VRRP的文章&#xff0c;连笔记都没记过。可能是因为对STP的记忆&#xff0c;导致现在都没忘太多。 一&#xff0c;什么是VRRP VRRP全名是虚拟路由冗余协议&#xff0c;虚拟路由&#xff0c;看名字就知道这是运行在三层接…

谷粒商城第十一天-品牌管理中关联分类

目录 一、总述 二、前端部分 1. 调整查询调用 2. 关联分类 三、后端部分 四、总结 一、总述 之前是在商品的分类管理中直接使用的若依的逆向代码 有下面的几个问题&#xff1a; 1. 表格上面的参数填写之后&#xff0c;都是按照完全匹配进行搜索&#xff0c;没有模糊匹配…

图像像素梯度

梯度 在高数中&#xff0c;梯度是一个向量&#xff0c;是有方向有大小。假设一二元函数f(x,y)&#xff0c;在某点的梯度有&#xff1a; 结果为&#xff1a; 即方向导数。梯度的方向是函数变化最快的方向&#xff0c;沿着梯度的方向容易找到最大值。 图像梯度 在一幅模糊图…

CDH6.3.2搭建HIVE ON TEZ

参考 https://blog.csdn.net/ly8951677/article/details/124152987 ----配置hive运行引擎 在/etc/hive/conf/hive-site.xml中修改如下&#xff1a; hive.execution.engine mr–>tez hive.execution.engine 设为tez或者运行代码的时候&#xff1a; set hive.execution.eng…

无涯教程-Perl - setsockopt函数

描述 此函数将SocketoptionsOPTNAME的值设置为SOCKET上指定级别的OPTVAL值。您需要导入Socket模块,以获取Tabl中显示的OPTNAME的有效值 语法 以下是此函数的简单语法- setsockopt SOCKET, LEVEL, OPTNAME, OPTVAL返回值 如果失败,此函数返回undef&#xff1b;如果成功,则返…

私有IP地址有多重要?

私有IP地址是指在局域网中使用的IP地址&#xff0c;而不是公共互联网上可访问的IP地址。私有IP地址不唯一&#xff0c;可以在不同的局域网中重复使用。这种地址分配方式能够有效地节省IP地址资源。 近日&#xff0c;国际互联网协会&#xff08;IATA&#xff09;发布了一项关于私…

Linux Day07

一、僵死进程 1.1僵死进程产生的原因 子进程先于父进程结束, 而父进程没有获取子进程退出码&#xff0c;释放子进程占用的资源&#xff0c;此时子进程将成为一个僵死进程。 在第一个框这里时父进程子进程都没有结束&#xff0c;显示其pid 父进程是2349&#xff0c;子进程是235…

小红书运营 变现方法总结(精)

大家好&#xff0c;我是网媒智星&#xff0c;今天跟大家分享一下小红书运营方面的知识&#xff0c;怎样利用小红书变现&#xff1f;全篇倾情干货输出&#xff0c;认真学习&#xff0c;保证您收获多多。 首先&#xff0c;让我们来分析一下小红书平台的优势。关于卖东西&#xff…

SOLIDWORKS PDM—文件版本的管控

SOLIDWORKS产品数据管理 (PDM) 解决方案可帮助您控制设计数据&#xff0c;并且从本质上改进您的团队就产品开发进行管理和协作的方式。使用 SOLIDWORKS PDM Professional&#xff0c;您的团队能够&#xff1a;1. 安全地存储和索引设计数据以实现快速检索&#xff1b;2. 打消关于…

解决macOS执行fastboot找不到设备的问题

背景 最近准备给我的备用机Redmi Note 11 5G刷个类原生的三方ROM&#xff0c;MIUI实在是用腻了。搜罗了一番&#xff0c;在XDA上找到了一个基于Pixel Experience开发的ROM&#xff1a;PixelExperience Plus for Redmi Note 11T/11S 5G/11 5G/POCO M4 Pro 5G (everpal)&#xf…

Python爬虫IP代理池的建立和使用

写在前面 建立Python爬虫IP代理池可以提高爬虫的稳定性和效率&#xff0c;可以有效避免IP被封锁或限制访问等问题。 下面是建立Python爬虫IP代理池的详细步骤和代码实现&#xff1a; 1. 获取代理IP 我们可以从一些代理IP网站上获取免费或付费的代理IP&#xff0c;或者自己租…

Python中执行调用JS的多种方法汇总

1. 写在前面 做爬虫的人大家都知道&#xff0c;现在国内Web或App普遍防护都做的很好&#xff0c;且越有价值的网站这方面越强 再小再弱的网站现在或多或少都要整点反爬 JS在反爬中应用非常广泛&#xff0c;现在做爬虫工程师基本都要懂JS&#xff0c;因为各种JS加密需要逆向&…

网站SSL安全证书是什么及其重要性

网站SSL安全证书具体来说是一个数字文件&#xff0c;是由受信任的数字证书颁发机构&#xff08;CA机构&#xff09;进行审核颁发的&#xff0c;其中包含CA发布的信息&#xff0c;该信息表明该网站已使用加密连接进行了安全保护。 网站SSL安全证书也被称为SSL证书、https证书和…

数字化转型能带来哪些价值?

数字化转型可以为个人、企业和整个社会带来广泛的价值。以下是数字化转型的一些主要优势&#xff1a; 1.提高效率和生产力&#xff1a;重复任务的自动化和简化流程可以提高效率和生产力。这使员工能够专注于更具战略性和增值性的活动。 2.增强的客户体验&#xff1a;数字化转…

8.15黄金能否跌破千九?日内如何稳健布局

近期有哪些消息面影响黄金走势&#xff1f;黄金多空该如何研判&#xff1f; ​黄金消息面解析&#xff1a;周二&#xff08;8月15日&#xff09;亚洲时段&#xff0c;现货黄金延续低位徘徊&#xff0c;目前交投于1906.01美元/盎司附近&#xff0c;美国财长称耶伦称美国经济处于…

vue + less 实现动态主题换肤功能

文章目录 前言一、前提条件1. 初始化vue项目2. 安装插件 二、新建文件夹主题theme1.style.less文件2.model.js文件3.theme.js文件theme文件夹最终效果 三、修改vue.config.js文件四、页面上的具体使用1. index.vue 页面2. index.vue 页面注意点说明3. index.vue 效果 五、在js中…

空降流量危机?QQ音乐升级架构应对高并发

# 关注并星标腾讯云开发者 # 每周3 | 谈谈我在腾讯的架构设计经验 # 第2期 | 赵威&#xff1a;QQ音乐评论系统如何实现高可用&#xff1f; QQ 音乐自诞生以来&#xff0c;已有多个版本的评论业务系统。最新版本是19年再次全新迭代&#xff0c;基于 tlist 存储&#xff0c;按照发…

SpringBoot复习:(48)RedisAutoConfiguration自动配置类

RedisAutoConfiguration类代码如下&#xff1a; 可以看到在这个类中配置了2个bean: redisTemplate和stringRedisTemplate. 而它通过EnableConfigurationProperties(RedisProperties.class)注解&#xff0c;把配置文件中配置的Redis相关的信息引入进来了&#xff0c;RedisPrope…

FPGA应用学习笔记------系统复位一(同异复位)

要满足复位恢复时间才能正常复位&#xff0c;不然会产生输出准稳态&#xff0c;输出逻辑错误 复位恢复时间只会存在复位释放时刻&#xff0c;不会出现在确立时刻&#xff0c;则不推荐完全异步复位 完全同步复位&#xff0c;肯定是同步于时钟滴&#xff0c;并将总是满足时钟条件…