文章目录
- 数据库系统原理与实践 笔记 #9
- 存储管理与索引
- 文件和记录的组织
- 文件组织
- 定长记录
- 变长记录
- 分槽的页结构
- 文件中记录的组织
- 顺序文件组织
- 多表聚簇文件组织
数据库系统原理与实践 笔记 #9
存储管理与索引
文件和记录的组织
文件组织
- 数据库是以一系列文件的形式存储的。每个文件再逻辑上组织称为记录的一个序列:
- 每个文件分为定长的存储单元,称为块(block)
- 块是存储分配和数据传输的基本单元,块大小一般为4~8KB
定长记录
- 简单方案:
- 记录i从第 n × ( i − 1 ) n\times (i-1) n×(i−1)个字节开始存储,n是每个记录的大小
- 访问记录很简单,但是一个记录可能存储于不同块,假设要求:不允许记录跨过块边界,没有记录是部分包含在一个块中
- 删除第i个记录的可选方案:
- 将记录i+1,…,n移动到i,…,n-1
- 将记录n移到i
- 不移动记录,在一个空闲列表中将所有空闲记录列出
变长记录
- 变长记录以下面几种方式出现在数据库系统中:
- 多种记录类型存储在一个文件中
- 允许一个或多个字段是变长的记录类型
- 允许可重复字段的记录类型
- 属性按照顺序存储
- 以固定大小表示可变长度的属性(偏移量、长度),实际数据存储在所有固定长度的属性后
- 记录末尾加上记录终止符
分槽的页结构
- 分槽页的块头包含:
- 块中记录条目的个数
- 块中空闲空间的末尾处
- 一个由包含记录位置和大小的记录条目组成的数组
- 记录可以在页中移动,来保持它们的连续存储
- 记录相互间没有空闲的空间(若删除记录,需移动记录数据)
文件中记录的组织
- 如何在文件中组织记录:
- 堆文件组织:一个记录可以存放在文件中的任何地方,只要那个地方有空间存储这条数据
- 顺序文件组织:记录根据“搜索码”的值顺序存储
- 散列文件组织:在每条记录的某些属性上计算一个散列函数,散列函数的结果确定记录应放到文件的哪个块中
- 通常,每个关系的记录用一个单独的文件存储
- 但是多表聚簇文件组织中,几个不同关系的记录存储在同一个文件中:目的在于同一块中存储相关记录,以将I/O代价减到最小
顺序文件组织
- 使用于需要对整个文件进行顺序处理的应用
- 文件中的记录按搜索码排序
- 删除 - 使用指针链
- 插入 - 定位插入的位置:
- 如果有空闲空间,那么插入到空闲处
- 如果没有空闲空间,将新纪录插入到溢出块
- 无论哪种方式,指针链都要更新
多表聚簇文件组织
- 用多表聚簇文件组织在一个文件中存储多个关系
- 能够很好地处理对 d e p a r t m e n t ⋈ i n s t r u c t o r department\bowtie instructor department⋈instructor的查询以及涉及一个系和相应老师的查询
- 对只设计department的查询效果不好
- 可以添加指针链来链接某个关系的记录