【MySQL进阶之路 | 高级篇】InnoDB搜索引擎行格式

1. COMPACT行格式

COMPACT行格式是MySQL5.1的默认行格式.其结构示意图如下.

f1d1fc7c0c0643c0803d555be1e43332.png

大体可以分为两部分.

  • 记录的额外信息.这里面有包括变长字段长度列表,NULL值列表和记录头信息.
  • 记录的真实数据.

(1).变长字段长度列表

MySQL支持一些变长的数据类型.比如VARCHAR(m), VARBINARY(n), TEXT类型.这些数据类型修饰的列称为变长字段.变长字段中存储多少字节的数据不是固定的,所以我们在存储数据的时候也顺便把这些数据占用的字节数也存储起来.在COMPACT行格式中,把所有变长字段的真实数据占用的字节数都存放在记录的开头部位,从而形成变长字段长度列表.

这里存储的变长字段长度和字段顺序是反过来的.比如此处应该存放为060408.

CREATE TABLE compact_demo(
c1 VARCHAR(8),
c2 VARCHAR(8),
c3 CHAR(8),
c4 VARCHAR(8)
) charset=ascii ROW_FORMAT=COMPACT;

INSERT INTO compact_demo
VALUES('zhangsan', 'lisi', 'wang5', 'ding1');

b23c63c65b0f4892947bd4d16e8b8b1a.png

(2). NULL值列表

compact格式会把可以为null值的列统一管理起来,存放在一个标记为null值的列表中.如果表中没有允许存储null值的列,则null值列表也就不存在了.

之所以要存储null值,是因为数据是需要对齐的.如果没有表明出来null值的位置,就有可能查询数据的时候发生混乱.如果使用一个特定的符号放到相应数据位表示null值的话,会很浪费空间,所以干脆直接在行数据开头开辟一处空间专门用来记录该行记录哪些是空数据,哪些是非空.

二进制位为1时,该列的值为null.为0时则该列的值为非空.

如果某字段明确了是非空的(比如NOT NULL/PRIMARY KEY),那么null值列表就不管这些字段了.

(3).记录头信息

记录头信息占有5个字节大小.用于描述记录的一些属性.

147c91ca8c9947a3a951edfc4e3fc39f.png

1. 删除标记位(Delete Flag):占1位,表示记录是否被标记为删除。在InnoDB中,记录被删除时并不是立即物理删除,而是通过设置这个标志位来标记记录为已删除,这样可以快速“删除”记录且不影响后续的插入操作。

2. 最小记录标记位(Min Record Marker):占1位,仅在页内最小记录上设置为1,表明这是页内用户记录中的最小记录。

3. 最大记录标记位(Max Record Marker):占1位,仅在页内最大记录上设置为1,表明这是页内用户记录中的最大记录。

4. heap_no:占4位,表示记录在页内的堆编号,用于标识记录在页中插入的顺序。

5. next_record:占16位或24位(取决于行格式),记录指向下一个记录的指针,用于遍历页内的记录链表。在Compact和Redundant行格式中通常是16位,在DYNAMIC和COMPRESSED行格式中可能使用24位以适应更大的页大小。

6. n_owned:占4位,在B+树的非叶节点中,表示子页的数量;在聚集索引的叶节点中,表示指向同一行的辅助索引记录数量。

7. record type:占3位,表示记录类型,常见的有:
   - 0:普通用户记录。
   - 1:目录项记录,用于B+树的内部节点。
   - 2:最小记录(Infimum)
   - 3: 最大记录(Supremum),这两个特殊的记录用来界定用户记录的边界,不存储实际用户数据。

这些字段的作用以后细谈.

(4). 记录的真实数据

记录的真实数据除了我们自己定义的列的数据外,还有三个隐藏列.

b51d6aeed5c54f9e81198bec49187a71.png

这些列的真实名称其实是 : DB_ROW_ID, DB_TRX_ID, DB_ROLL_PTR.

值得注意的是,除了第一个row_id,其他两个都是必须的.这是为什么呢?

原因我们讲过,创建聚簇索引时,我们优先选择用户自定义的主键作为主键,如果无,则会选择一个非空且唯一键作为主键,如果无,那么InnoDB会为表默认添加一个名为row_id的列作为隐藏列作为主键.

2. DYNAMIC/COMPRESSED行格式

MySQL5.7和8.0默认的行格式都是dynamic.

这两个行格式只有在行溢出这种情况下,有所区别,简单介绍一下行格式.

我们知道一个页的大小一般是16kb.也就是16384字节.而一个类型为varchar(m)的列最多可以存储65533个字节.这样就可能出现了一个页存放不下一条记录.这种情况叫行溢出.

  • 在COMPACT/REDUNTANT行格式中,对于占用存储空间非常大的列,在记录的真实数据处只会存储该列的一部分数据,把其他剩余数据分散存储在几个其他的页中进行分页存储.然后记录的真实数据用20个字节存储指向这些页的地址.从而可以找到剩余数据所在的页.
  • 在DYNAMIC/COMPRESSED行格式中,对于存放在blog中的数据采用了完全行溢出的方式.比如在数据页中只存放20个字节的地址,实际数据都放在溢出页中.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/730966.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【扫雷游戏】C语言实现

机器学习:Transformer框架理论详解和代码实现>Hi~!这里是奋斗的小羊,很荣幸您能阅读我的文章,诚请评论指点,欢迎欢迎 ~~ 💥💥个人主页:奋斗的小羊 💥💥所属…

别让破损安全鞋,成为你工作中无法预见的“隐形杀手”

在日常生活中,安全鞋是我们的“守护神”,默默守护着我们的双脚,抵御着来自工作环境的各种风险。然而,当安全鞋出现破损时,我们却常常视而不见,以为这只是微不足道的小事,很多人可能会选择“将就…

ASP.NET Core 6.0 使用 Log4Net 和 Nlog日志中间件

前言 两年前,浅浅的学过 .NET 6,为啥要记录下来,大概是为了以后搭架子留下引线,还有抛砖引玉。 1. 环境准备 下载 建议使用 Visual Studio 2022 开发版 官网的下载地址:Visual Studio 2022 IDE - 适用于软件开发人员的编程工具借助 Visual Studio 设计,具有自动完成…

SFF2004A-ASEMI无人机专用SFF2004A

编辑:ll SFF2004A-ASEMI无人机专用SFF2004A 型号:SFF1006A 品牌:ASEMI 封装:ITO-220AC 最大平均正向电流(IF):20A 最大循环峰值反向电压(VRRM):400V 最…

智能体合集

海外版coze: 前端代码助手 后端代码助手: 前端代码助手:

大数据-数据分析师利用excel绘图

你会用excel,统计数据吗?我是大数据工程师,但是我不会excel。那咋办? 用sql,统计,导出到excel,在用excel统计。本文主要讨论的是导出到excel后,画图。 图是什么? x和y…

【C++】数据类型、函数、头文件、断点调试、输入输出、条件与分支、VS项目设置

四、基本概念 这部分和C语言重复的部分就简写速过,因为我之前写过一个C语言的系列,非常详细。C和C这些都是一样的,所以这里不再一遍遍重复码字了。感兴趣的同学可以翻看我之前的C语言系列文章。 1、数据类型 编程的本质就是操作数据。 操…

山东济南比较出名的起名大师的老师,中国最厉害的改名大师颜廷利:短命的小草,年年自损;长寿的大树,万古长青。。。(升命学说)

在中国第一起名大师的老师颜廷利教授的《升命学说》中,通过“净化论”、“和合法则”、“唯悟主义”以及“镜正理念”的阐述,我们得以窥见生命的不同维度。他以自然界中短命的小草与长寿的大树为例,揭示了生命形态的对比与哲理。 小草&#…

“打造智能售货机系统,基于ruoyi微服务版本开源项目“

目录 # 开篇 售货机术语 1. 表设计说明 2. 页面展示 2.1 区域管理页面 2.2 合作商管理页面 2.3 点位管理页面 3. 建表资源 3.1 创建表的 SQL 语句(包含字段备注) 1. Region 表 2. Node 表 3. Partner 表 4. 创建 tb_vending_machine 表的 S…

2024会展行业发展趋势预测

在当今这个数字化浪潮汹涌的时代,会展行业也迎来了自己的变革时刻。 根据《2023中国会展主办机构数字化调研报告》,我们可以清晰地看到几个显著的趋势: 首先,数字化转型已经不再是一道选择题,而是必答题。 超过90%的…

伦敦银趋势线的有效性怎么验证?

怎么才能画出一根能发挥作用的趋势线呢?这是很多投资者追求的目标。其实要趋势线能发挥作用,我们在画它的时候就要进行一些验证,将通过了验证的趋势线保留下来,那些没通过的就删除,这样得到能发挥作用的趋势线的概率就…

学校校园考场电子钟,同步授时,助力考场公平公正-讯鹏科技

随着教育技术的不断发展,学校对于考场管理的需求也日益提高。传统的考场时钟往往存在时间误差、维护不便等问题,这在一定程度上影响了考试的公平性和公正性。为了解决这些问题,越来越多的学校开始引入考场电子钟,通过同步授时技术…

编译原理-各章典型题型+思路求解

第2章文法和语言习题 基础知识: 思路: 基础知识: 思路: 基础知识: 编译原理之 短语&直接短语&句柄 定义与区分_编译原理短语,直接短语,句柄-CSDN博客 思路: 题目: 基础解释&#xff1a…

路由器的Wi-Fi性能是否限制了你的网速?这里有你想要的答案

​你的无线网络速度阻碍了你吗?信不信由你,升级到超快的互联网计划可能不值得。以下是如何判断路由器的Wi-Fi速度是否阻碍了你,以及你能做些什么。 如何测试你的Wi-Fi速度 比较你的有线速度和无线速度可以表明你的路由器是否阻碍了你。虽然很多人认为“Wi-Fi”和“互联网”…

python pyautogui实现图片识别点击失败后重试

安装库 pip install Pillow pip install opencv-python confidence作用 confidence 参数是用于指定图像匹配的信度(或置信度)的,它表示图像匹配的准确程度。这个参数的值在 0 到 1 之间,数值越高表示匹配的要求越严格。 具体来…

PCB设计中的via孔和pad孔

原文出自微信公众号【小小的电子之路】 在PCB设计过程中,经常会提到via孔和pad孔,下面就简单介绍一下二者的区别。 via称为过孔,主要起到电气连接的作用,用于网络在不同层的导线之间的连接。PCB设计中一般做盖油处理。 via孔 vi…

【SkiaSharp绘图08】SKPaint方法:自动换行、是否乱码、字符偏移、边界、截距、文本轮廓、测量文本

文章目录 SKPaint方法BreakText 计算指定宽度内可绘制的字符个数ContainsGlyphs字体是否包含文本字符(是否会乱码)GetGlyphOffsets 字符偏移量GetGlyphPositions 偏移坐标GetGlyphWidths 每个字符的宽度与边界GetHorizontalTextIntercepts 轮廓截距GetPositionedTextIntercepts…

浅谈配置元件之LDAP默认请求

浅谈配置元件之LDAP默认请求 在进行LDAP(轻量级目录访问协议)相关测试时,JMeter提供了“LDAP 默认请求”配置元件来帮助用户便捷地设置LDAP查询的基本参数。本文介绍如何在JMeter中配置和使用“LDAP 默认请求”元件的指南。 1. 简介 “LDA…

海外社媒网站抓取经验总结:如何更高效实现网页抓取?

有效的网络抓取需要采取战略方法来克服挑战并确保最佳数据提取。让我们深入研究一些关键实践,这些实践将使您能够掌握复杂的网络抓取。 一、了解 Web 抓取检测 在深入探讨最佳实践之前,让我们先了解一下网站如何识别和抵御网络爬虫。了解您在这一过程中…

面试官:JavaScript执行机制中的闭包?

前言 JavaScript 中的闭包指的是一个函数以及其捆绑的周边环境状态的引用的组合。闭包可以让开发者从内部函数访问外部函数的作用域,即使外部函数已经执行完毕 今天我们通过JavaScript执行机制来聊聊闭包 正文 首先来分析这段代码的执行机制,这段代码…