【Linux系统】Ext系列磁盘文件系统二:引入文件系统(续篇)




在这里插入图片描述



inodeblock 的映射


该博文中有详细解释:【Linux系统】inode 和 block 的映射原理


目录与文件名

这里有几个问题:

问题一: 我们访问文件,都是用的文件名,没用过 inode 号啊?

之前总是说可以通过一个文件的 inode 号就可以获取该磁盘文件的相关信息

但是,我们凭什么可以获得 inode

我们用户操作好像不是通过 inode 操作的,而是通过文件名操作的!

问题二:文件名存储在哪里呢?

之前说过,在 Linux下, 文件名不在 inode 结构中保存?为什么?

那 文件名存储在哪里呢?存储在目录文件!

问题三:目录是文件吗?如何理解?



目录文件

目录其实也是文件:目录文件

命令 ls -lid 目录文件名 :查看该目录文件属性信息,如该文件的 inode

在这里插入图片描述

不卖关子:目录文件的内容存储的是文件名和 inode 的映射关系

目录既然是文件,当然也就可以打开!!!!!



举例:在终端上打开一个目录文件

(1)命令 for i in {1..5}; do touch "test$i.c"; done :在当前目录创建 5 个 test1.c 、test2.c 这样命名的文件
在这里插入图片描述

(2)命令 vim . :查看当前目录文件

在这里插入图片描述

既然 目录也是文件,目录文件也要有对应的数据块的!

目录 = inode + data block = 属性 + 内容



文件名和 inode 是互为映射的


因为在 LinuxWindows 等操作系统中的文件目录下都不能存在同名文件

如何保证文件的命名唯一性呢,可以依靠 文件名 和 inode 的映射关系,inode 绝对是唯一的,相应的文件名也为唯一的。

  • 用户输入文件名,同时一般需要带上路径,系统就会在该路径下,寻找对应文件名,通过 文件名和 inode 的映射,找到该文件的唯一inode值进行文件磁盘访问的相关操作
  • 文件名单向映射唯一一个 inode 值,而 inode 值可以被多个文件名映射,这种机制是通过硬链接实现的!


为什么一个目录能有 读/写/执行 rwx 权限

到这里,你应该可以明白,为什么一个目录还能有 读、写、执行 权限

若一个目录没有读权限,你就不能访问该目录下的文件:就是因为目录文件本身内部存储着文件名和inode的映射关系,必须要读目录,才能拿到该映射关系,才能拿到 inode 才能访问该文件

若一个目录没有写权限,就无法在该目录下创建文件、删除文件、修改文件名…:就是因为目录文件本身用于存储文件名和inode的映射关系,必须要有写权限,才能将文件名和inode的映射关系写入该目录文件中,而 创建文件本质就是将新文件和inode的映射关系写入、删除文件本质就是删除文件和inode的映射关系、修改文件名本质就是修改了新文件名和inode的映射关系

若一个目录没有执行权限,就无法进入该目录:进不去该目录的本质是打不开该目录文件



问题:普通文件和目录文件在底层有区别吗?

在我们前面讲解的 磁盘文件系统中,是否会区分该文件是普通文件、还是目录文件吗?

不会,在底层一视同仁!

在底层的 磁盘文件系统中,文件的属性存储在 inode 中,文件的内容存储在 Block 中,普通文件和目录文件本质都是 属性 + 内容,因此不会区分文件类型,而是按部就班的直接存储属性和内容这样的数据

在这里插入图片描述




问题:为什么要进行文件名和 inode 的映射?


那为什么要设计 inode 和文件名进行映射呢,为什么要套这一层呢?

效率问题:若我们使用文件名表示一个文件,系统寻找文件时,则需要比对众多的文件名(字符串!),时间复杂度是 O(n)

而文件名映射的 inode ,则只需比较 数值类型的 inode 数字串,时间复杂度是 O(1)


其实系统管理用户也是通过:用户名和 User 编号的映射关系

命令 ls -l 可以看到文件的创建者

命令 ls -ln :带上一个 n ,表示能显示数字就显示数字

此时就能看到用户名在系统看来就是一串数字!

在这里插入图片描述

不只是这几个例子:还是什么 GID :组别ID…

系统会主动规避字符串,而是使用映射的数字,字符串是给人看的,数字对系统来说才是高效的!



重新理解 ls -l 命令


该命令本质上是打开当前目录的目录文件,遍历所有文件和 inode 的映射关系,通过 inode 值找到磁盘中该文件的 inode 结构体,返回该结构体中存储的文件属性信息,将这些文件信息和文件名拼接处理成字符串展示到屏幕上,下图中文件名前面的都是该文件存储在 struct inode 中的文件信息!

在这里插入图片描述

可是问题又来了!

找到文件名 -> 首先要打开当前目录 -> 当前目录,也是文件!!也有文件名的呀!!

那目录的文件名如何被找到呢?

目录的目录的文件名又如何被找到呢?套娃呢

此时就需要 逆向的路径解析!



逆向路径解析

在这里插入图片描述

我如果需要访问 /lesson21 目录文件内容(如访问 test.txt 文件),就需要拿到目录文件 lesson21inode 找到磁盘中的相关的数据块,此时就要目录文件 /code 提供/lesson21 目录文件的 inode

我如果需要访问目录文件 /code ,就需要拿到目录文件 /codeinode 找到磁盘中的相关的数据块,此时就要目录文件 /112 提供/code 目录文件的 inode

一环一环,本级目录文件的内容访问,需要拿到 inode值,只能通过上级目录文件拿到该inode值

最终逆向回到根目录,而根目录是写死的,根目录文件的 inode值可以直接被获取然后访问对应数据块,相当于递归到出口了!!



正解:其实路径是被正向解析的,逆向只是为了方便理解路径需要被解析的!

系统其实是获取一个全路径,从根目录开始一次从左向右,依次解析路径的!!!



问题:为什么任何一个文件都要有路径?

就是要一环套一环的嵌套存储数据!!!!

没有路径,就根本不能直接找到该文件,只有通过一个全路径,对全路径进行一次解析解环,最终才能找到目标!



问题:为什么每个进程都要有一个 CWD ??

每个进程都有一个当前工作目录(CWD, Current Working Directory)主要是为了方便文件路径的引用。当你在命令行中运行程序或脚本时,很多时候需要访问或操作文件系统中的文件。这些文件可能位于不同的目录中,而使用相对路径来引用它们可以极大地简化这一过程。

当你启动一个新的进程时,它会继承其父进程的当前工作目录,除非特别指定了另一个工作目录。例如,当你从Bash启动一个程序时,这个程序默认的当前工作目录就是启动它的那个Bash进程的当前工作目录。这就是为什么即使是像Bash这样的祖先进程也需要维护一个CWD——它不仅用于自身的操作,也为所有由它启动的子进程提供了一个起点。


当前工作目录 CWD 最主要作用是用于形成相对路径

如下图,一个点 的意思是当前目录,两个点 的意思是上级目录

若你在当前目录下,打开当前目录的一个 log.txt 文件,只需要用当前目录的一个点 + 文件名的形式组成的路径,这就是相对路径!

open("./log.txt");

在该程序底层,表示当前目录的这个点,就会用 CWD 替换掉,如下:

// 假如 cwd 为 /root/code/

"./log.txt"
   等于
"/root/code/log.txt" 



问题:路径需要被重复解析吗?

前面我们讲解了一个文件需要被系统做层层的路径解析,这个过程其实是不断的在访问磁盘,和磁盘进行IO交互的

/home/whb/code/code/112/code/1esson21

我们通过路径解析找到文件 lesson21,那如果我们还要查找访问当前路径下的 test1.c,难道我们还需要将该路径再次重复的解析一遍吗??

/home/whb/code/code/112/code/test1.c

并不需要,Linux系统会对路径进行缓存,解释如下:


路径缓存和缓存树 struct dentry 结构


路径缓存

在磁盘文件系统中是没有文件路径的概念的,如果有也是逻辑上的存在(路径本就是从物理层面抽象出来的一种逻辑化的概念)

磁盘中仅仅存在纯粹的 inode 和数据块,就是纯粹的存储文件及其数据内容

而我们操作系统中又是如何通过例如一个 tree 命令将整个系统的路径关系展示出来的呢?

是不是系统遍历了所有文件路径,然后不断和磁盘交互得来的,肯定不是,这样太慢了

其实,Linux系统会对路径进行缓存!,而且就是通过 多叉树这样的结构进行缓存的!!

在这里插入图片描述



缓存路径的多叉树并不会一次性将磁盘中的所有文件路径缓存下来,这个树展示的只是磁盘文件系统中的一小部分文件路径

除了一些基本文件和访问几率较大的文件会先被缓存下来,还有就是会缓存我们历史访问过的文件路径

如果下次还需使用到该路径,就直接查找文件路径缓存树即可

我们使用 find 命令查询文件时

比如在根目录下,按照名字查询目标文件:find / -name test.txt

find 命令查询文件也是要不断访问磁盘对应文件数据块内容

而我们说过,首次进行 find 命令查询时可能会比较慢,第二次之后就相对比较快了

这就是因为首次查询时,系统已经将访问过的文件路径缓存下来了,第二次之后的查询就不用过多的访问磁盘,只需查询路径树即可!!!



缓存树的 struct dentry 结构

Linux中,在内核中维护树状路径结构的内核结构体叫做: struct dentry


在这里插入图片描述




树的组成:一个 struct dentry 结构实际上算作一种树节点结构,多个 struct dentry 结构链接就形成所谓的 文件路径缓存树 !

struct dentry 结构:含有三个主要的字段

  • 父节点指针 :指向父亲 struct dentry 节点结构
  • 子节点指针 :指向孩子 struct dentry 节点结构
  • inode 值:本文件对应的 inode

每个文件都有dentry:每个文件其实都要有对应的 dentry 结构,包括普通文件。这样所有被打开的文件,就可以在内存中形成整个树形结构。

LRU 淘汰机制:整个树形节点也同时会隶属于 LRU(Least Recently Used),最近最少使用)结构中,进行节点淘汰。

整个树形节点也同时会隶属于Hash,方便快速查找。

更重要的是,这个树形结构,整体构成了Linux的路径缓存结构,打开访问任何文件,都在先在这棵树下根据路径进行查找,找到就返回属性inode和内容,没找到就从磁盘加载路径,添加dentry结构,缓存新路径。



在这里插入图片描述



例如我们需要通过该路径访问该 test 文件:/home/test
系统会在系统内存中的文件路径缓存 dentry 树中,根据给出的路径,正向解析,解析过程如下:
在这里插入图片描述

  1. 从根目录开始
    • 从根目录 /dentry 开始,根目录的 dentry 通常是内核中固定的。
    • 通过根目录的 dentry 获取根目录的 inode
  2. 查找 home 目录
    • 在根目录的 inode 中查找文件名 home 的目录项。
    • 如果找到 home 的目录项,获取 homeinode 号。
    • 系统为文件 home 创建一个 struct dentry 结构,并链接到文件缓存多叉树中。
  3. 查找 test 文件
    • home 目录的 inode 中查找文件名 test 的目录项。
    • 如果找到 test 的目录项,获取 testinode 号。
    • 系统为文件 test 创建一个 struct dentry 结构,并链接到文件缓存多叉树中。

这个过程少不了访问磁盘,因此路径解析一次通常会将文件路径缓存到文件缓存多叉树上,便于下次路径查询利用。



进程层面

这块内容记住就好:

通过查询源码,进程 task_struct 、文件 struct file 和 文件dentry 之间的关系如下

进程 struct task_struct 中存在文件描述符表 struct files_struct *file,该表中存储着文件描述符和文件 struct file 的映射关系,而每个加载到内存中的文件都会有对于的 struct file 结构,这个结构体中包含着很多和文件在内存中操作相关的字段属性,如

  • const struct file_operations *f_op 操作函数表、
  • struct address_space 内核文件缓冲区、
  • struct path *f_path 文件路径相关属性,指向一个path结构体
    • struct path 该path结构体中包含着 dentry 结构
      • dentry 结构:包含着不少的字段:
        • struct dentry *d_parent :指向父节点

        • struct list_head d_child:指向子节点

        • struct inode *d_inode:指向文件属性结构 inode

图示如下:

在这里插入图片描述




再次梳理:

目录项结构就是 struct dentry ,存储在上级目录文件的 inode 结构指向的数据块中

本目录文件目录项结构 struct dentry 中存储着本目录文件的 inode 结构指针,通过该指针找到自己的 inode 结构,进一步访问自己数据块的内容,内容中存储着自己这个目录文件存储的所有下级文件的目录项:下级文件名和其 inode 号的映射关系

路径解析核心是依次读取目录文件的 dentry ,并通过读取该 dentryinode 查找下一级目录或文件的目录项,并获取下级目录或文件的 inode 号。同时每次读取过的目录文件的 dentry 就会加载到内存中,并链接到文件缓存多叉树中,包括最终需要打开的文件,也是先要将该文件的 dentry 结构加载到内存中,然后才是通过dentry 结构访问 inode



完整流程


这是一次从路径解析到文件打开,再到文件读取的完整流程,目的是为了从具体的例子中梳理之前的学习内容,包括:文件打开需要的`struct file` 、路径解析、`inode` 结构等等综合知识点!
1. 路径解析

假设我们要访问路径 /home/test 并打开 test 文件,路径解析过程如下:

(1) 从根目录开始

  • 从根目录 /dentry 开始,根目录的 dentry 通常是内核中固定的。
  • 通过根目录的 dentry 获取根目录的 inode

(2) 查找 home 目录

  • 在根目录的 inode 中查找文件名 home 的目录项。
  • 如果找到 home 的目录项,获取 homeinode 号。
  • 为文件 home创建一个 struct dentry结构,并链接到文件缓存多叉树中。

(3) 查找 test 文件

  • whb 目录的 inode 中查找文件名 test 的目录项。
  • 如果找到 test 的目录项,获取 testinode 号。
  • 为文件 test创建一个 struct dentry结构,并链接到文件缓存多叉树中。


2. 文件打开

当文件 test 被打开时,内核会执行以下步骤:

(1) 获取 inode 结构

  • 通过 test 文件的 inode 号,从磁盘中读取 inode 结构并加载到内存中。
  • inode 结构包含文件的元数据,如权限、所有者、大小、数据块指针等。

(2) 创建 struct file 结构

  • 内核为 test 文件创建一个 struct file 结构。
  • struct file 结构包含文件描述符、文件操作指针、文件偏移量等信息。
  • struct file 结构中的 inode 指针指向 test 文件的 inode 结构。
  • struct file 结构中的 dentry 指针指向 test 文件的 dentry 结构。

到这一步,可以知道,其实文件的 struct dentry 结构,是在 struct file 结构之前创建的,当 struct file 结构创建后,内部的属性 dentry 指针才会指向本文件早已创建好的 dentry 结构!


(3) 返回文件描述符

  • 内核为 test 文件分配一个文件描述符,并将其返回给用户空间。
  • 用户空间通过文件描述符来操作文件。


3. 文件读取

当用户调用 read 系统调用读取文件内容时,内核会执行以下步骤:

(1) 查找数据块

  • 通过 test 文件的 inode 结构中的数据块指针,找到文件内容所在的数据块。
  • 数据块指针可能包括直接块指针、一级间接块指针、二级间接块指针等。

(2) 加载数据块到内存

  • 将数据块从磁盘读取到内存中,存放在内核的文件缓冲区中。

(3) 拷贝数据到用户缓冲区

  • 内核将文件缓冲区中的数据拷贝到用户提供的缓冲区中。
  • 用户可以通过 read 系统调用获取文件内容。

分区挂载

分区挂载

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/955272.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

2024年博客之星年度评选—创作影响力评审入围名单公布

2024年博客之星活动地址https://www.csdn.net/blogstar2024 TOP 300 榜单排名 用户昵称博客主页 身份 认证 评分 原创 博文 评分 平均 质量分评分 互动数据评分 总分排名三掌柜666三掌柜666-CSDN博客1001002001005001wkd_007wkd_007-CSDN博客1001002001005002栗筝ihttps:/…

基于高光谱数据的叶片水分估测方法研究 【Matlab Python Origin】

相关代码和结果在这里:基于高光谱数据的叶片水分估测方法研究 【Matlab Python Origin】文章中的代码和结果 第1章 研究内容和技术路线 1.1 研究内容 在本文研究中,我们致力于充分利用LOPEX’93数据集,并通过深入分析高光谱数据,…

windows下安装并使用node.js

一、下载Node.js 选择对应你系统的Node.js版本下载 Node.js官网下载地址 Node.js中文网下载地址??? 这里我选择的是Windows64位系统的Node.js20.18.0(LTS长期支持版本)版本的.msi安装包程序 官网下载: 中文网下载: 二、安…

西门子PLC读取梅安森风速传感器数据

西门子PLC读取梅安森风速传感器数据 读取数据前期准备:西门子PLC读取数据 设备型号为:GFY15 到货开盒的设备有:风速传感器、485线及设置遥控器 读取数据前期准备: 将设备的私有485协议改为modbus公有协议 刚上电的轮询显示时间同时…

麒麟操作系统服务架构保姆级教程(十一)https配置

如果你想拥有你从未拥有过的东西,那么你必须去做你从未做过的事情 在运维工作中,加密和安全的作用是十分重要的,如果仅仅用http协议来对外展示我们的网站,过一段时间就会发现网站首页被人奇奇怪怪的篡改了,本来好好的博…

TiDB 的高可用实践:一文了解代理组件 TiProxy 的原理与应用

导读 TiProxy 是 TiDB 官方推出的高可用代理组件,旨在替代传统的负载均衡工具如 HAProxy 和 KeepAlived,为 TiDB 提供连接迁移、故障转移、服务发现等核心能力。 本文全面解析了 TiProxy 的设计理念、主要功能及适用场景,并通过实际案例展示…

Redisson发布订阅学习

介绍 Redisson 的消息订阅功能遵循 Redis 的发布/订阅模式,该模式包括以下几个核心概念: 发布者(Publisher):发送消息到特定频道的客户端。在 Redis 中,这通过 PUBLISH 命令实现。 订阅者(Sub…

Github 2025-01-17 Java开源项目日报 Top8

根据Github Trendings的统计,今日(2025-01-17统计)共有8个项目上榜。根据开发语言中项目的数量,汇总情况如下: 开发语言项目数量Java项目8TypeScript项目1Python项目1OpenAPI 生成器:基于规范自动生成API工具 创建周期:2155 天开发语言:Java协议类型:Apache License 2.0…

基于docker微服务日志ELK+Kafka搭建

ELK 是 Elasticsearch 、 Logstash 、 Kibana 的简称 Elasticsearch 是实时全文搜索和分析引擎,提供搜集、分析、存储数据三大功能;是一套开放 REST 和 JAVA API 等结构提供高效搜索功能,可扩展的分布式系统。它构建于 Apache Lucene 搜索引…

《C++11》中的显式虚函数重载:深入理解与应用

在C编程中,虚函数是一种强大的工具,它允许我们实现多态。通过虚函数,我们可以在派生类中重写基类的函数,从而实现运行时多态。然而,当我们在派生类中重载虚函数时,可能会遇到一些问题。在C11中,…

HTML 的基础知识及其重要性

前言 HTML(超文本标记语言)是构建网页的基础,它为我们提供了结构化内容和重要信息。无论是个人博客、企业官网还是大型电子商务平台,HTML 都是不可或缺的一部分。本文将介绍 HTML 的基本概念、结构及其在网页开发中的重要性。 什…

STM32 FreeRTOS 任务创建和删除实验(动态方法)

目录 实验目标 CubeMX环境准备 SysMode配置 RCC配置 ​编辑LED1引脚配置 LED2引脚配置 KEY1引脚配置 串口USART1配置 NVIC配置 项目管理 代码生成配置 生成代码 Keil配置 打开项目: 配置使用微库 配置每次烧录后“复位并运行” FreeRTOS移植 移植配置完成后的…

【Docker】——安装Docker以及解决常见报错

🎼个人主页:【Y小夜】 😎作者简介:一位双非学校的大二学生,编程爱好者, 专注于基础和实战分享,欢迎私信咨询! 🎆入门专栏:🎇【MySQL&#xff0…

Ubuntu22.04安装paddle GPU版本

文章目录 确立版本安装CUDA与CUDNN安装paddle 确立版本 查看官网信息,确立服务版本:https://www.paddlepaddle.org.cn/documentation/docs/zh/2.6/install/pip/linux-pip.html 安装CUDA与CUDNN 通过nvidia-smi查看当前显卡驱动版本: 通过…

【MySQL 的数据目录】

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 一、MySQL 的数据目录 1、数据库文件的存放路径2、相关命令目录3、配置文件目录 二、数据库和文件系统的关系 1、查看默认数据库2、数据库在文件系统中的表示3、表…

【安卓开发】【Android】总结:安卓技能树

【持续更新】 对笔者在安卓开发的实践中认为必要的知识点和遇到的问题进行总结。 一、基础知识部分 1、Android Studio软件使用 软件界面 最新的版本是瓢虫(Ladybug),bug的确挺多。笔者更习惯使用电鳗(Electric Eel&#xff0…

openharmony电源管理子系统

电源管理子系统 简介目录使用说明相关仓 简介 电源管理子系统提供如下功能: 重启服务:系统重启和下电。系统电源管理服务:系统电源状态管理和休眠运行锁管理。显示相关的能耗调节:包括根据环境光调节背光亮度,和根…

SQL Server 导入Excel数据

1、选中指定要导入到哪个数据库,右键选择 》任务 》导入数据 2、数据源 选择Excel,点击 下一步(Next) 3、目前 选择OLE DB Provider ,点击 下一步(Next) 4、默认 ,点击 下一步(Next)…

MySQL安装-Windows

目录 官网下载地址 下载MySQL安装包或者压缩包 安装 / 添加Path环境变量 初始化mysql 无密码初始化 随机密码初始化 注册MySQL服务 / 移除已经注册过的服务 启动MySQL服务 登录mysql前修改密码 登录mysql 登录mysql后修改密码 停止MqSQL服务 企业中使用的场景 官网下…

OSPF的LSA的学习研究

OSPF常见1、2、3、4、5、7类LSA的研究 1、拓扑如图,按照地址表配置,激活OSPF划分相关区域并宣告相关网段 2、1类LSA,每台运行了OSPF的路由器都会产生,描述了路由器的直连接口状况和cost 可以看到R1产生了一条router lsa&#xff0…