零. 文件系统
1. 为什么要有文件系统
文件系统是操作系统中管理文件和目录的一种机制。它提供了组织、存储、检索和更新文件的方法,主要如下:
- 数据组织:文件系统将数据组织成文件和目录,使用户能够更方便地管理和查找文件。每个文件都有一个唯一的名称,可以包含不同类型的数据(如文本、图像、音频等)。
- 持久化:文件系统负责将数据永久存储在存储介质上(如硬盘、SSD、闪存等)。
- 数据访问:文件系统提供了一套标准的 API 和命令,使应用程序和用户能够创建、读取、写入、删除和修改文件。这些操作通常是通过文件描述符和文件路径来完成的。
- 数据保护:文件系统提供了机制来保护数据的安全性和完整性,如权限控制、加密、备份和恢复等。
- 性能优化:文件系统通过缓存、预读取、写回等技术优化数据访问性能,提高系统的整体效率。
2. 文件为什么要挂载到文件系统
挂载是指将一个文件系统附加到另一个文件系统的某个目录上的过程。主要有以下几个原因:
- 统一命名空间:通过挂载,不同的文件系统可以被整合到一个统一的命名空间中。用户可以通过根目录下的路径访问不同文件系统中的文件,而不必关心文件实际存储在哪个物理设备上。
- 资源管理:挂载点可以用来管理不同的存储资源。例如,可以将不同的硬盘分区、网络文件系统、临时文件系统等挂载到不同的目录下,便于管理和访问。
- 灵活性:挂载提供了极大的灵活性。用户可以根据需要动态地挂载和卸载文件系统,而不需要重新启动系统。这对于临时访问外部存储设备(如 USB 驱动器、网络共享)非常有用。
- 隔离和安全:通过挂载,可以将不同的文件系统隔离,限制某些用户的访问权限。例如,可以将敏感数据存储在一个单独的文件系统中,并仅允许特定用户访问。
- 性能优化:不同的文件系统可能具有不同的性能特征。通过挂载,可以选择最适合特定工作负载的文件系统。例如,可以将频繁访问的数据存储在高性能的 SSD 文件系统中,而将不经常访问的数据存储在低成本的 HDD 文件系统中。
实际例子
- 多分区挂载:在 Linux 系统中,根文件系统(/)通常是一个分区,而其他分区(如 /home、/var、/tmp)可以分别挂载到不同的目录下。这样可以更好地管理和优化存储资源。
- 网络文件系统挂载:将 NFS(Network File System)或 SMB(Server Message Block)共享挂载到本地文件系统中,使用户可以像访问本地文件一样访问网络文件。
- 临时文件系统挂载:将 tmpfs(临时文件系统)挂载到 /tmp 目录下,提供一个高性能的内存文件系统,用于存储临时文件。
一. Fuse
https://www.usenix.org/system/files/conference/fast17/fast17-vangoor.pdf
简单而言,fuse实现了一个对文件系统访问的回调。fuse分为内核态的模块和用户态的库两部分。其中用户态的库为程序开发提供接口,也是我们实际开发时用的接口,我们通过这些接口将请求处理功能注册到fuse中。内核态模块是具体的数据流程的功能实现,它截获文件的访问请求,然后调用用户态注册的函数进行处理。
1. 工作流程
如图所示,其中./fuse_user是开发的用户态的文件系统程序,该程序启动的时候会将自己开发的接口注册到FUSE(架构图中的FUSE driver)中,比如读写文件的接口,遍历目录的接口等等。
同时,通过该程序在系统某个路径挂载fuse文件系统,比如/tmp/file_on_fuse_fs。此时如果在该目录中有相关操作时,请求会经过VFS到fuse的内核模块(上图中的步骤1),fuse内核模块根据请求类型,调用用户态应用注册的函数(上图中步骤2),然后将处理结果通过VFS返回给系统调用(步骤3)。
2. 一些可参考的学习demoWriting file systems in Go with FUSE | Gopher Academy Bloghttps://blog.gopheracademy.com/advent-2014/fuse-zipfs/
奇伢云存储 的个人主页 - 文章 - 掘金https://juejin.cn/user/3544481221322237/posts