《Linux操作系统原理分析之文件管理(1)》(22)
- 7 文件管理
- 7.1 文件与文件系统
- 7.1.1 文件
- 7.1.3 文件系统及其功能
- 7.2 文件的组织结构
- 7.2.1 文件的逻辑结构
- 7.2.2 文件的物理结构
- 一、顺序结构(顺序文件或连续文件)
- 二、链接结构(链接文件或串联文件)
- 三、索引结构(索引文件)
7 文件管理
7.1 文件与文件系统
7.1.1 文件
文件:具有文件名的一组信息组合,包括两部分:
文件体:文件本身的信息;
文件说明:文件存储和管理信息;如:文件名、文件内部标识、文件存储地址、访问权限、访问时间等;
7.1.2 文件的种类
文件系统在管理文件时还要识别和区分文件的类型,如果是文件系统所确认的文件类型,则可根据类型对文件进行合理的操作。
(1)按用途分类
系统文件、库文件和用户文件。
(2)按保护级别分类
根据限定的使用文件的权限:执行文件、只读文件和读写文件等。
(3)按信息流向分类
物理设备的特性决定了文件信息的流向:输入文件、输出文件和输入输出文件。
(4)按文件的性质分类
根据文件的性质分:普通文件、目录文件、设备文件等。
(5)按文件的组织结构分类
由用户组织的文件称逻辑文件:流式文件和记录式文件。
文件在存储介质上的组织方式称文件的物理结构(物理文件):顺序文件、链接文件和索引文件等。
7.1.3 文件系统及其功能
- 文件系统:操作系统中管理文件的机构,提供文件存储、提供文件在外存中的组织方式,以及文件访
问控制等功能。文件系统的三个部分:管理软件、被管理软件、相关的数据结构 - 文件系统的功能 :
(1)目录管理
文件目录是实现按名存取的一种手段。 建立一个新文件,应把与该文件有关的一些属性登记在文件目录中;
读一个文件,应从文件目录中查找指定文件是否存在并核对是否有权使用。
一个好的目录结构应既能方便检索,又能保证文件的安全。
(2)文件的组织
用户按信息的使用和处理方式组织文件,称为文件的逻辑结构或称为逻辑文件。把逻辑文件保存到存储介质上的工作由文件系统来做,这样可减轻用户的负担。根据用户对文件的存取方式和存储介质的特性,文件在存储介质上可以有多种组织形式。把文件在存储介质上的组织方式称为文件的物理结构或称为物理文件。因此,当用户要求保存文件时,文件系统必须把逻辑文件转换成物理文件,而当用户要求读文件时,文件系统又要把物理文件转换成逻辑文件。
(3)文件存储空间的管理
要把文件保存到存储介质上时,必须记住哪些存储空间已被占用,哪些存储空间是空闲的。文件只能保存到空闲的存储空间中,否则会破坏已保存的信息。当文件没有必要再保留而被删除时,该文件所占的存储空间应成为空闲空间。
(4)文件操作
为了保证文件系统正确地存储和检索文件,规定了在一个文件上可执行的操作,这些可执行的操作统称为“文件操作”。文件系统提供的基本文件操作有建立文件、打开文件、读文件、写文件、关闭文件和删除文件等。“文件操作”是文件系统提供给用户使用文件的一组接口,用户调用“文件操作”提出对文件的操作要求。
(5)文件的共享、保护和保密
在多道程序设计的系统中,有些文件是可以共享的,例如,编译程序、库文件等。实现文件共享既节省文件的存放空间,又可减少传送文件的时间,但必须对文件采取安全保护措施。既要防止有意或无意地破坏文件,又要避免随意地剽窃文件。
7.2 文件的组织结构
7.2.1 文件的逻辑结构
逻辑结构:它是用户所观察到的文件组织形式,是用户可以直接处理的数据及结构,它独立于物理特性,又称为文件组织(file organization)。
分类:
a. 有结构记录式文件(数据库):包含若干顺序排列的记录
👉 变长记录:数据项/字段不同;数据项本身不同。
👉 定长记录:文件长度=记录总个数×记录长。
b. 无结构字符流式文件:文件的信息不组成记录,文件的长度即为字符总个数。(源程序、文本文件)
7.2.2 文件的物理结构
- 物理结构:文件在外存上的实际的组织形式。
1) 物理块:以物理块为基本单位分配和传输信息,物理块大小由存储设备和 OS 确定。
2) 物理块大小与逻辑记录大小之间不一定一致。 - 文件物理结构的几种形式:1)顺序结构件 2)链接结构 3)索引结构
一、顺序结构(顺序文件或连续文件)
一个文件在逻辑上连续的信息被存放到磁盘上依次相邻的块上。逻辑记录顺序与磁盘块的顺序相一致。
例:
优点:存取速度快、结构简单、支持顺序存取和随机存取。
存在的问题:
(1)磁盘存储空间的利用率不高,容易产生碎片。
(2)对输出文件很难估计需多少磁盘块。
(3)影响文件的扩展。
二、链接结构(链接文件或串联文件)
基本思想:将文件存放在外存中若干个物理块中,这些物理块不必连续。每个物理块的最后一个单元用作指针,指向下一个物理块的地址。最后一块中的指针可用特殊字符(例如“-1”)表示文件到此结束, 从而将同一个文件的物理块链接起来。
优点:解决了顺序结构中的所有问题。
磁盘上所有空闲块都可以被利用;
建立文件时也不必事先考虑文件的长度,文件可继续扩展;
便于在文件的任何位置插入一个记录或删除一个记录。
缺点:采用随机存取方式是低效的。文件只能按指针链接顺序访问,故存取速度慢;
可靠性问题,如指针出错。
链接指针占用一定的空间。
读出一块信息时,应将其中的指针分离出来,保证用户使用信息的正确性。
三、索引结构(索引文件)
基本思想:为每一个文件建立一张索引表,每一表项记录文件所在的一个物理块。
优点:能方便地实现文件的扩展、记录的插入和删除。
缺点:必须增加索引表占用的空间和读写索引表的时间。索引表的查找策略对文件系统效率影响很大.
索引表的管理:当索引表非常大时,需要多个磁盘块存放,各磁盘块之间可用指针链起来。当随机存取某个记录时,可能要沿链搜索才能找到该记录的存放地址,很费时间。
解决方案:多级索引、混合索引(下例适用 Unix System V)