【MYSQL】事务隔离级别以及InnerDB底层实现

事务隔离级别

读未提交(Read Uncommitted)

允许事务读取其他事务未提交的数据,可能会导致脏读。

读已提交(Read Committed)

一个事务只能看见已经提交的事务所做的更改,可以避免脏读,但可能会遇到不可重复读。

可重复读(Repeatable Read)

在一个事务内,多次读取同一数据的结果是一致的,即使其他事务在这期间对数据进行了修改和提交。此隔离级别可以防止不可重复读,但可能遇到幻读。

串行化(Serializable)

最高隔离级别,通过完全序列化事务来避免所有并发问题,这通常通过锁定事务访问的行来实现,性能开销较大。

在这里插入图片描述

MVCC的具体实现

隐藏字段

InnoDB存储引擎在每行数据的后面添加了三个隐藏字段:

1、DB_TRX_ID(6字节):记录创建或最后一次更新该行的事务ID。

在InnoDB中,每个事务都有一个唯一的事务ID,叫做transaction
id(缩写trx_id),它是在事务开始时候向InnoDB的事务系统申请的,并且按照申请顺序严格递增。在这里DB_TRX_ID就表示最近一次对该行数据作修改(insert或update)的事务ID。至于delete操作,InnoDB认为是一个update操作,不过会更新一个另外的删除位,将行表示为deleted,并非真正删除。

2、DB_ROLL_PTR(7字节):回滚指针,指向当前记录行的undo log信息,用于回滚该行的旧版本

3、DB_ROW_ID(6字节):行标识,如果表没有显式的主键或唯一索引时使用。这个字段和MVCC关系不大,所以我们在这里不必关注。

这是随着新行插入而单调递增的行ID。理解:当表没有主键或唯一非空索引时,InnoDB就会使用这个行ID自动产生聚簇索引。如果表有主键或唯一非空索引,聚簇索引就不会包含这个行ID了。

Read View(一致性视图)

read view的真正作用是用来做可见性判断的,里面保存了“对本事务不可见的其他活跃事务”。

按照可重复读的定义,一个事务启动的时候,能够看到所有已经提交的事务结果。但是之后,这个事务执行期间,其他事务的更新对它不可见。因此,一个事务只需要在启动的时候声明说,“以我启动的时刻为准,如果一个数据版本是在我启动之前生成的,就认;如果是我启动以后才生成的,我就不认,我必须要找到它的上一个版本”。当然,如果“上一个版本”也不可见,那就得继续往前找。

Read View有4个重要的字段

1、m_ids :创建 Read View 时,当前数据库中「活跃事务(启动了但没提交)」的事务 id 列表,注意是一个列表。
2、min_trx_id :创建 Read View 时,当前数据库中「活跃事务」中事务 id 最小的事务,也就是 m_ids 的最小值。
3、max_trx_id :不是 m_ids 的最大值,而是创建 Read View 时当前数据库中应该给下一个事务的 id 值,也就是全局事务中最大的事务 id 值 + 1;
4、creator_trx_id :指的是创建该 Read View 的事务的事务 id。

在这里插入图片描述
在可见性的实现上,InnoDB为每个事务构建了一个数组,用来保存这个事务启动瞬间,当前正在”活跃“的所有事务ID。”活跃“指的是启动了但还没提交。

数组里面事务 ID 的最小值记为低水位,当前系统里面已经创建过的事务 ID 的最大值加 1 记为高水位。这个视图数组和高水位,就组成了当前事务的一致性视图(read-view)。这里需要注意:低水位到高水位之间的某些事务ID是没在数组中的,没在的原因是它们已经提交了,比如低水位为100,高水位为106,而数组中可能只有100、101、103、105这四个事务ID,104和102不在的原因是因为在当前事务启动时,这两个事务已经提交了。

![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/08fb5599b2f74ecea93f2893b603cacd.png在这里插入图片描述
这样,对于当前事务的启动瞬间来讲,一个数据的DB_TRX_ID,存在以下几种可能:

1、如果落在绿色部分,表示这个版本是已提交的事务或者是当前事务自己生成的,这个数据是可见的;
2、如果落在红色部分,表示这个版本是由将来启动的事务生成的,是肯定不可见的;(需要去undo log找可见版本)
3、如果落在黄色部分,那就包括两种情况:
a. 如果DB_TRX_ID在数组中(也就说明这个事务在当前事务启动时还活跃),那么表示这个这个版本是由还没提交的事务生成的,不可见;(需要去undo log找可见版本)
b. 若 row trx_id 不在数组中,表示这个版本是已经提交了的事务生成的,可见。

读提交和可重复读的read view产生区别:

在innodb中的可重复读级别, 只有事务在begin之后,执行第一条select(读操作)时, 才会创建一个快照(read view),将当前系统中活跃的其他事务记录起来;并且事务之后都是使用的这个快照,不会重新创建,直到事务结束。
在innodb中的读提交级别, 事务在begin之后,执行每条select(读操作)语句时,快照会被重置,即会重新创建一个快照(read view)。

undo log

undo log中存储的是老版本数据,当一个事务需要读取记录行时,如果当前记录行不可见,可以顺着undo log链找到满足其可见性条件的记录行版本,这也是InnoDB利用”所有数据都有多个版本“这个特性,来实现可见性的核心。

下图记录了一行数据被多个事务连续更新后的状态(图中的row trx_id就是上面提到的DB_TRX_ID):

在这里插入图片描述

图中虚线框内是同一行数据的四个版本,当前最新版本是 V4,k 的值是 22,它是被 事务ID 为 25 的事务更新的,因此它的 DB_TRX_ID 是 25。

在上图中,三个虚线箭头其实就代表了undo log;V1、V2、V3其实并不是物理上真实存在的,而是每次需要的时候根据当前版本和undo log计算出来的,比如,需要V2的时候,就是通过V4依次执行U3、U2计算出来。

比如,假如有一个事务的低水位是18,它要读取上面图中的数据,那么当它访问时候,获取了当前的DB_TRX_ID为25,假设这个25在数组中(说明这个25在事务启动时依然活跃),那么因为25高于低水位,所以对于当前事务来说不可见,于是这个事务就会从V4通过U3计算得出V3,V3的DB_TRX_ID=17小于18,所以这个数据是可见的,所以对于当前事务来讲,这个事务的值通过undo log就可以构造出来,为11。

大多数对数据的变更操作包含insert/update/delete,在InnoDB里,undo log分为如下两类:

insert undo log:事务insert新记录时产生的undo log,只在事务回滚时需要,并且在事务提交后就可以立即丢弃
update undo log:事务对记录进行delete和update操作时产生的undo log,不仅在事务回滚时需要,快照读也需要,只有当数据库所使用的快照不涉及该日志记录,对应的回滚日志才会被purge线程删除。

Purge线程: 为了实现InnoDB的MVCC机制,更新或者删除操作都只是设置一下旧记录的deleted_bit,并不真正将旧记录删除。
为了节省磁盘空间,InnoDB有专门的purge线程来清理deleted_bit为true的记录。purge线程自己也维护了一个read
view,如果某个记录的deleted_bit为true,并且DB_TRX_ID相对于purge线程的read
view可见,那么这条记录一定是可以被安全清除的。

在MySQL InnoDB引擎中,各隔离级别是如何实现的呢?

读未提交(Read Uncommitted)

InnoDB实际上并不直接支持此隔离级别,因为这会引发脏读、不可重复读和幻读等问题。如果要实现的话,数据库可允许事务读取其他事务尚未提交的数据,不做任何额外的并发控制即可。

读已提交(Read Committed)

InnoDB通过多版本并发控制(MVCC)机制实现。在读已提交的隔离级别下,每个事务在每次读取数据时都会生成一个自己的读视图(Read View)。这个视图是由事务开始时正在提交的事务所影响的数据项的快照构成的。

具体实现上,MySQL会在每行数据后添加3个隐藏的列来实现MVCC,这3个列分别是:
1、DB_TRX_ID:记录创建或最后一次更新该行的事务ID。
2、DB_ROLL_PTR:指向回滚段的指针,用于回滚该行的旧版本。
3、DB_ROW_ID:行标识,如果表没有显式的主键或唯一索引时使用。这个字段和MVCC关系不大,所以我们在这里不必关注。

当事务需要读取数据时,它会读取DB_TRX_ID不为当前事务ID的行,即已提交事务的数据。
在这里插入图片描述

可重复读(Repeatable Read)

这是InnoDB默认的隔离级别,InnoDB也是通过MVCC机制来实现可重复读隔离级别的。可重复读隔离级别是启动事务时生成一个 Read View,然后整个事务期间都在用这个 Read View。

MVCC机制为每个事务分配一个唯一的事务ID,并记录每行数据的创建版本号和删除版本号,确保在同一个事务内多次读取同一数据时结果一致,解决了不可重复读的问题。MVCC通过数据行的隐藏列(例如事务ID、回滚指针等)以及undo日志来管理多个事务对同一数据的并发访问,确保事务看到的数据在事务期间保持一致,即便其他事务已经修改或删除了这些数据。

MVCC通过维护数据的多个版本来实现事务的隔离性,而无需依赖传统的锁机制(虽然InnoDB也使用锁,但主要是为了解决写冲突)。每个事务看到的数据是由该事务的开始时间点决定的,这保证了在可重复读级别下,即使其他事务提交了新的数据,当前事务仍然能够看到它开始时的数据状态,避免了脏读、不可重复读的问题,但幻读仍可能在某些场景下发生,除非使用了Next-Key Locks或者将隔离级别调整为串行化。

选择该隔离级别是因为主从同步如果先后读取不一致,可能会出现主从同步问题。

串行化(Serializable)

虽然InnoDB支持串行化隔离级别,但实际应用中较少使用,因为它通过完全锁定读取的行来防止并发修改,这会严重影响系统的并发性能。在串行化级别下,InnoDB会对涉及的行加锁,“写”会加“写锁”,“读”会加“读锁”。当出现读写锁冲突的时候,后访问的事务必须等前一个事务执行完成,阻止其他事务并发修改,以此实现最高的隔离性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/777949.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【C++:默认成员函数初始化列表】

构造函数 特点 没有返回值支持函数重载对象实例化时,编译器自动调用作用不是构造,而是初始化函数名与类名相同无参函数和全缺省的函数,不用传参就能调用的函数叫做默认构造函数 构造函数是一个特殊的成员函数 注:无参构造函数在实…

星辰宇宙动态页面vue版,超好看的前端页面。附源码与应用教程(若依)

本代码的html版本,来源自“山羊の前端小窝”作者,我对此进行了vue版本转换以及相关应用。特此与大家一起分享~ 1、直接上效果图: 带文字版:文字呼吸式缩放。 纯净版: 默认展示效果: 缩放与旋转后&#xf…

简单的手动实现spring中的自动装配案例

简简单单的实现一个spring中的自动装配和容器管理的小骚操作。 1,创建AutoSetBean.java 使用injectBeans静态方法,可以扫描指定包下的所有带MyInject注解的字段,如果在beans的Map中存在这个字段的实例化类,则执行装配。 import…

【UE5.1 角色练习】13-枪械射击——拿出与收起武器

目录 效果 步骤 一、安装射击武器 二、拿武器和收武器 效果 步骤 一、安装射击武器 1. 在虚幻商城中将“FPS Weapon Bundle”添加到工程中,由于我们使用的是5.1版本,我们可以先将该资产放入UE4工程中,然后迁移到5.1版本的工程 2. 打开角…

alphazero学习

AlphaGoZero是AlphaGo算法的升级版本。不需要像训练AlphaGo那样,不需要用人类棋局这些先验知识训练,用MCTS自我博弈产生实时动态产生训练样本。用MCTS来创建训练集,然后训练nnet建模的策略网络和价值网络。就是用MCTSPlayer产生的数据来训练和…

Spring与Quartz整合

Quartz框架是一个轻量级的任务调度框架,它提供了许多内置的功能,包括:支持作业的调度、集群调度、持久化、任务持久化、任务依赖、优先级、并发控制、失败重试等。同时也支持自定义作业类型和触发器类型。与Spring整合步骤如下: …

深入解析.[datastore@cyberfear.com].mkp勒索病毒:威胁与防范

引言 在数字化时代,网络安全问题日益严峻,其中勒索病毒(Ransomware)作为一种极具破坏性的恶意软件,严重威胁着个人用户和企业机构的数据安全。.[ datastorecyberfear.com].mkp勒索病毒便是这一领域中的一颗“毒瘤”&am…

2.5 C#视觉程序开发实例1----IO_Manager实现脉冲输出控制

2.5 C#视觉程序开发实例1----IO_Manager实现脉冲输出控制 1 目标效果视频 目标效果展示 IO_Manager 2 信号输出流程说明 为了防止线程不同步导致输出信号没有被输出, 尽量使用一个输出队列来进行输出的管理 3 IO_Manager中添加内容 3.0 添加两个类 1 Out_Sta…

【课程总结】Day13(下):人脸识别和MTCNN模型

前言 在上一章课程【课程总结】Day13(上):使用YOLO进行目标检测,我们了解到目标检测有两种策略,一种是以YOLO为代表的策略:特征提取→切片→分类回归;另外一种是以MTCNN为代表的策略:先图像切片→特征提取→分类和回归。因此,本章内容将深入了解MTCNN模型,包括:MTC…

Windows 11文件资源管理器选项卡的4个高级用法,肯定有你喜欢的

作为一个每天使用文件资源管理器来管理我的工作流程的人,选项卡帮助我为处于不同完成阶段的工作创建了不同的文件夹。以下是我使用选项卡提高工作效率的最佳技巧。 打开和关闭选项卡 假设你的计算机上安装了Windows 11的最新更新,请按Ctrl+E打开文件资源管理器。在我发现“…

STM32智能家居掌上屏实战:从WiFi连接到MQTT通信,打造你的家庭物联网网关

摘要: 本文深入探讨一种基于STM32的智能家居掌上屏设计方案,详细阐述其硬件架构、软件设计以及通信协议等关键技术细节。该方案利用WiFi构建局域网,实现与各类传感器、执行器的便捷交互,并通过TFT彩屏提供直观的控制和数据展示,旨…

五、保存数据到Excel、sqlite(爬虫及数据可视化)

五、保存数据到Excel、sqlite(爬虫及数据可视化) 1,保存数据到excel1.1 保存九九乘法表到excel(1)代码testXwlt.py(2)excel保存结果 1.2 爬取电影详情并保存到excel(1)代…

大模型周报|15 篇必读的大模型论文

大家好,今日必读的大模型论文来啦! 1.谷歌推出风格感知拖放新方法 Magic Insert 来自谷歌的研究团队提出了 Magic Insert,用于以物理上可信的方式将用户提供的图像中的对象拖放到不同风格的目标图像中,同时与目标图像的风格相匹…

基于CLIP特征的多模态大模型中的视觉短板问题

【论文极速读】 基于CLIP特征的多模态大模型中的视觉短板问题 FesianXu 20240706 at Tencent WeChat search team 前言 今天读到篇CVPR 24’的论文 [1],讨论了常见的多模态大模型(大多都基于CLIP语义特征,以下简称为MLLM)中的视觉…

Git错误分析

错误案例1: 原因:TortoiseGit多次安装导致,会记录首次安装路径,若安装路径改变,需要配置最后安装的路径。

HTML5使用<details>标签:展开/收缩信息

details 标签提供了一种替代 JavaScript 的方法,它主要是提供了一个展开/收缩区域。details 标签中可以使用 summary 标签从属于 details 标签,单击 summary 标签中的内容文字时,details 标签中的其他所有从属元素将会展开或收缩。语法如下&a…

Redies基础篇(一)

Redis 是一个高性能的key-value数据库。Redies支持存储的value类型相对更多,包括string(字符串)、list(链表)、set(集合)和zset(有序集合)。这些数据类型都支持push/pop、add/remove及取交集并集和差集及更丰富的操作,而且这些操作都是原子性的&#xff…

小白必看!推荐三本高质量python书籍,让你直接原地起飞

Python是一种多功能语言。它经常用作Web应用程序的脚本语言,嵌入到软件产品中,以及人工智能和系统任务管理。它既简单又强大,非常适合初学者和专业程序员。 python的自学书籍非常多,涉及基础入门、web开发、机器学习、数据分析、…

印度第二大移动提供商 3.75 亿数据待售

一个名为“xenZen”的威胁行为者已在 BreachForums 上出售 Airtel 的数据库。 该列表包含来自 3.75 亿客户的数据。 数据详情: 手机号码 名 出生日期 父亲的名字 地址 电子邮件ID 类型 国籍 阿达尔 带照片的身份证明详细信息 地址详细信息证明等 鉴于…

003-基于Sklearn的机器学习入门:回归分析(上)

本节及后续章节将介绍机器学习中的几种经典回归算法,所选方法都在Sklearn库中聚类模块有具体实现。本节为上篇,将介绍基础的线性回归方法,包括线性回归、逻辑回归、多项式回归和岭回归等。 2.1 回归分析概述 回归(Regression&…