1、存储结构-页
索引结构提供了高效的索引方式,索引信息以及数据记录都保存在数据文件或索引文件中(本质存储在页结构中)
1.1、磁盘与内存交互的基本单位:页
- 在InnoDB中将数据划分为若干页,页的默认大小为:
16KB
。 - 不论读多少条数据,都是将这些数据所在的页进行加载。
磁盘I/O操作最小单位是页。
1.2、页的结构
- 相关数据页可以不在物理结构上相连,通过双向链表相关联。
- 每个数据页中的数据记录会按照主键值的大小进行排序,组成一个单向链表
- 每个数据页都会为存储的数据记录生成一个目录页,通过主键值查找是可以在目录页通过二分法快速定位相关数据记录
1.3、页的大小
- 通过查找 innodb_page_size参数获取和设置
+------------------+-------+
| Variable_name | Value |
+------------------+-------+
| innodb_page_size | 16384 |
+------------------+-------+
1 row in set (2.89 sec)
1.4、页的上层结构
- 区:是比页大一级的存储结构(
默认1MB
),在InnoDB存储结构中,一个区会分配64个连续的页
。 - 段:由一个或多个区组成,区在文件系统是一个连续分配的空间,并不要求区和区之间是相邻的。段是
数据库中的分配单位,不同类型的数据库对象以不同的段形式存在
。创建表时会创建一个表段,创建索引时会创建一个索引段 - 表空间:是一个逻辑容器,存储的对象是段,在一个表空间中可以有一个或者多个段,一个段只能属于一个表空间。数据库由一个或多个表空间组成,表空间从管理上可以划分为:系统表空间,用户表空间,撤销表空间,临时表空间等
2、页的内部结构
名称 | 占用大小 | 说明 |
---|---|---|
文件头 | 38字节 | 描述页的信息 |
页面头部 | 56字节 | 页的状态信息 |
最大(小)用户 | 26字节 | 为两个虚拟的行记录 |
用户记录 | 不确定 | 存储行记录内容 |
空闲空间 | 不确定 | 页中还没有被使用的空间 |
页目录 | 不确定 | 存储用户记录的相对位置 |
文件尾 | 8字节 | 校验页是否完整 |
2.1、文件头(File Header)
- 文件头存储了一些全局性的信息,如文件版本、页大小、文件ID等。
- 文件头的大小通常是固定的,对于InnoDB的页,文件头大小是固定的38字节。
- 文件头位于每个数据文件的开头,用于标识文件的类型和属性。
- 主要划分为以下结构:
-
FIL_PAGE_SPACE_OR_CHKSUM(页的校验和):4字节,用于对页的内容进行校验,以确保数据完整性和防止损坏。
-
FIL_PAGE_OFFSET(页号):4字节,每个页都有一个唯一的页号,InnoDB通过页号可以定位到具体的页。
-
FIL_PAGE_PREV(上一个页的页号):4字节,指示上一个页的页号,保证了页之间的逻辑连续性。
-
FIL_PAGE_NEXT(下一个页的页号):4字节,指示下一个页的页号,同样保证了页之间的逻辑连续性。
-
FIL_PAGE_LSN(页面最后被修改的日志序列位置):8字节,记录了页面最后一次被修改时的日志序列位置(LSN)。
-
FIL_PAGE_TYPE(该页的类型):2字节,指示该页的类型,可能包括数据页、索引页等。
-
FIL_PAGE_FILE_FLUSH_LSN(独立表空间中都是0):8字节,用于记录独立表空间中的文件刷新LSN,对于非独立表空间该字段可能有其他用途。
-
FIL_PAGE_ARCH_LOG_NO_OR_SPACE_ID(页属于哪个表空间):4字节,用于指示页属于哪个表空间。
-
2.2、用户记录(User Records)
- 实际存储在页中的数据和索引条目。
- 这些记录按照B+树的结构组织在页中,叶子节点存储数据记录,非叶子节点存储索引记录。
- 记录可以是固定长度或变长,根据存储的数据类型和大小而定。
- 主要划分为以下结构:
- delete_mask: 1字节, 标记该记录是否被删除,
- 0 表示记录没有删除,
- 1 表示记录被删除了
- min_rec_mask :1字节, B+数的每非叶子节点中的最小纪录数都会添加该标记
- 只有最小纪录数的min_rec_mask 值为1
- 其他别的记录min_rec_mask 值为0
- n_owned: 4字节,如果当前记录是组内最大记录,则代表槽内的记录数
- heap_no :13字节 当前记录在本页中的位置信息
- 最小记录的heap_no值:0
- 最大记录的heap_no值:1
- record_type: 3字节, 表示当前记录的类型
- 0表示普通记录
- 1表示B+树非叶子节点记录
- 2表示最小记录
- 3表示最大记录
- next_record 16字节 表示从当前记录的真实数据到下一条记录的真实数据的地址偏移量。
- delete_mask: 1字节, 标记该记录是否被删除,
2.3、最大(小)记录
- 由5字节大小的记录投信息和8个字节大小的一个固定的部分组成
- 本页中主键值最小的用户记录的下一条记录就是Infimum记录(也就是最小记录)
- 本页中主键值最大的用户记录的下一条记录就是Supremum记录a(也就是最大记录)。
2.4、空闲空间(Free Space)
- 空闲空间是页中未被使用的部分,用于存储新的数据和索引。
- 当页中的自由空间不足时,InnoDB会进行页分裂操作,将页分成两个更小的页,以便腾出更多的空间。
2.5、页目录(Page Directory)
- 页目录记录了页中数据和索引的偏移量及长度信息,以便InnoDB能够快速地定位和访问这些数据和索引。
- 页目录是由多个槽(Slot)组成的数组,每个槽存储一个记录的偏移量和长度信息。
- 页目录通常位于页头之后,占据了页的一部分空间
- 所以在一个页中根据主键查找记录是很快的,步骤为两步:
- 二分法确定该记录所在的槽,并找到该槽所在分组中主键值最小的那条记录。
- 通过记录的 next_record 属性遍历该槽所在的组中的各个记录
2.6、页面头部(Page Header)
- 记录数量(Number of Records):记录了本页中已经存储的记录数量。
- 第一条记录的地址(Address of First Record):记录了本页中第一条记录的地址或偏移量,以便快速定位到第一条记录。
- 页目录中槽的数量(Number of Slots in Page Directory):记录了页目录中存储的槽的数量,即页目录中有多少个条目。
- 页目录起始地址(Address of Page Directory):记录了页目录的起始地址或偏移量,以便快速定位到页目录。
- 其他状态信息(Other Status Information):可能还包括其他与页相关的状态信息,如空闲空间大小、最大记录偏移量等。
- 通常包含以下信息:
名称 | 占用空间大小 | 描述 |
---|---|---|
PAGE_N_DIR_SLOTS | 2字节 | 页目录中的槽数量 |
PAGE_HEAP_TOP | 2字节 | 还未使用的空间最小地址,该地址之后就是 Free Space |
PAGE_N_HEAP | 2字节 | 本页中的记录的数量(包括最大最小和标记为删除的记录) |
PAGE_FREE | 2字节 | 指向可重用空间的地址 |
PAGE_GARBAGE | 2字节 | 已删除记录占用的字节数 |
PAGE_LAST_INSERT | 2字节 | 最后插入记录的位置 |
PAGE_DIRECTION | 2字节 | 最后插入的方向 |
PAGE_N_DIRECTION | 2字节 | 一个方向连续插入的记录数量 |
PAGE_N_RECS | 2字节 | 该页中记录的数量(不包括最大最小和标记为删除的记录) |
PAGE_MAX_TRX_ID | 2字节 | 修改当前页的最大事务ID,该值仅在二级索引中定义 |
PAGE_LEVEL | 2字节 | 当前页在索引树(B+树)中的层级 |
PAGE_INDEX_ID | 8字节 | 索引ID,表示当前页属于哪个索引 |
PAGE_BTR_SEG_LEAF | 10字节 | B+树叶子段的头部信息,仅在B+树的Root页定义 |
PAGE_BTR_SEG_TOP | 10字节 | B+树叶子段的头部信息,仅在B+树的Root页定义 |
2.7 文件尾(File Trailer)
- 文件尾是文件的结束部分,通常用于存储一些结束标识或校验信息。
- 文件尾的大小通常是固定的,对于InnoDB的数据文件,文件尾大小是8字节。
- 通常划分为以下结构:
- 前4个字节代表页的校验和,这个部分和 File Header 中的校验和相对应
- 后4个字节代表页面被最后修改时对应的日志序列位置(LSN),这个部分也是为了校验页的完整性的,如果首部和尾部的LSN值校验不成功的话,就说明同步传输过程出现了问题。
3、行格式(记录格式)
3.1 查询InnoDB引擎的默认行格式
- 语法如下:
mysql> show variables like 'innodb_default_row_format';
+---------------------------+---------+
| Variable_name | Value |
+---------------------------+---------+
| innodb_default_row_format | dynamic |
+---------------------------+---------+
1 row in set (0.13 sec)
- 查看已创建表的行格式:
mysql> show table status like 'rqtanc_test'\G
*************************** 1. row ***************************
Name: rqtanc_test
Engine: InnoDB
Version: 10
Row_format: Dynamic
Rows: 0
Avg_row_length: 0
Data_length: 16384
Max_data_length: 0
Index_length: 0
Data_free: 0
Auto_increment: NULL
Create_time: 2024-04-22 06:24:10
Update_time: NULL
Check_time: NULL
Collation: utf8mb4_0900_ai_ci
Checksum: NULL
Create_options:
Comment:
1 row in set (0.00 sec)
3.2、指定行格式
- 创建表时指定行格式:
mysql> create table rqtanc_one(id int not null,col int null) row_format=compact;
- 修改表时指定行格式:
mysql> alter table rqtanc_one row_format = dynamic;
Query OK, 0 rows affected (0.82 sec)
3.3、分类及相关相关详情描述
参考官方文档
4、表空间
参考 MySQL-数据目录