操作系统 | 学习笔记 | | 王道 | 5.3 磁盘和固态硬盘

5.3 磁盘和固态硬盘

5.3.1 磁盘

img

  1. 磁盘结构

    image-20230921170548395

    • 磁盘:磁盘的表面由一些磁性物质组成,可以用这些磁性物质来记录二进制数据

    • 磁道:磁盘的盘面被划分成一个个磁道。这样的一个“圈”就是一个磁道

    • 扇区:一个磁道又被划分成一个个扇区,每个扇区就是一个“磁盘块”各个扇区存放的数据量相同

      最内侧磁道上的扇区面积最小,因此数据密度最大

    • 盘面:磁盘有多个盘片"摞"起来,每个盘片有两个盘面。

    • 柱面:所有盘面中相对位置相同的磁道组成柱面。

  2. 如何在磁盘中读/写数据

    需要把“磁头”移动到想要读/写的扇区所在的磁道。磁盘会转起来,让目标扇区从磁头下面划过,才能完成对扇区的读/写操作。

  3. 磁盘的物理地址:磁盘地址用“柱面号•盘面号•扇区号”表示,可根据该地址读取一个“块”

    img

    • ①根据“柱面号”移动磁臂,让磁头指向指定柱面;
    • ②激活指定盘面对应的磁头;
    • ③磁盘旋转的过程中,指定的扇区会从磁头下面划过,这样就完成了对指定扇区的读/写。
  4. 磁盘的分类

    • 磁头是否移动
      • 磁头可以移动的称为活动头磁盘。磁臂可以来回伸缩来带动磁头定位磁道
      • 磁头不可移动的称为固定头磁盘。这种磁盘中每个磁道有一个磁头
      • image-20240923100926215
    • 根据盘片是否可更换
      • 固定盘磁盘
      • 可换盘磁盘
5.3.2 磁盘管理

img

  1. 磁盘初始化

    一个新的磁盘只是一个磁性记录材料的空白盘。在磁盘可以存储数据之前,必须将它分成扇区,以便磁盘控制器能够进行读写操作,这个过程称为低级格式化(或称物理格式化)。

    低级格式化为每个扇区使用特殊的数据结构,填充磁盘。每个扇区的数据结构通常由头部、数据区域(通常为512B大小)和尾部组成。头部和尾部包含了一些磁盘控制器的使用信息(包含管理扇区需要的数据结构和校验码)。

  2. 分区

    在可以使用磁盘存储文件之前,操作系统还要将自己的数据结构记录到磁盘上,分为两步:

    • 第一步是,将磁盘分为由一个或多个柱面组成的分区(即我们熟悉的C盘、D盘等形式的分区),每个分区的起始扇区和大小都记录在磁盘主引导记录的分区表中
    • 第二步是,对物理分区进行逻辑格式化创建文件系统),操作系统将初始的文件系统数据结构存储到磁盘上,这些数据结构包括空闲空间和已分配的空间以及一个初始为空的目录。

    因扇区的单位太小,为了提高效率,操作系统将多个相邻的扇区组合在一起,形成一簇(在Linux中称为块)。为了更高效地管理磁盘,一簇只能存放一个文件的内容,文件所占用的空间只能是簇的整数倍;如果文件大小小于一簇(甚至是0字节),也要占用一簇的空间。

    image-20240923103233427

  3. 引导块

    计算机启动时需要运行一个初始化程序(自举程序),它初始化CPU、寄存器、设备控制器和内存等,接着启动操作系统。为此,自举程序找到磁盘上的操作系统内核,将它加载到内存, 并转到起始地址,从而开始操作系统的运行。

    自举程序通常存放在ROM中,为了避免改变(更新)自举代码而需要改变ROM硬件的问题,通常只在ROM中保留很小的自举装入程序,而将完整功能的引导程序保存在磁盘的启动块上,启动块位于磁盘的固定位置。具有启动分区的磁盘称为启动磁盘或系统磁盘(C:盘)。

    即自举装入程序很小,复杂度低,可以保证不出错,如果需要修改自举程序的话,就只需要改引导块中的固定位置,而不需要该ROM,会让自举程序的更新变得更加简单。

    • Windows允许将磁盘分为多个分区,有一个分区为引导分区,它包含操作系统和设备驱动程序。

    • Windows系统将引导代码存储在磁盘的第0号扇区,它称为主引导记录(MBR)。

    • 引导首先运行ROM中的代码,这个代码指示系统从MBR中读取引导代码。

      除了包含引导代码,MBR还包含:一个磁盘分区表和一个标志(以指示从哪个分区引导系统)

    • 当系统找到引导分区时,读取分区的第一个扇区,称为引导扇区,并继续余下的引导过程,包括加载各种系统服务。

  4. 坏块

    由于磁盘有移动部件且容错能力弱,因此容易导致一个或多个扇区损坏。

    • 对于简单磁盘,如采用IDE控制器的磁盘,坏块可手动处理,如MS-DOS的Format命令执行逻辑格式化时会扫描磁盘以检查坏块。坏块在FAT表上会标明,因此程序不会使用它们
    • 对于复杂的磁盘,控制器维护磁盘内的坏块列表。这个列表在出厂低级格式化时就已初始化,并在磁盘的使用过程中不断更新。低级格式化将一些块保留作为备用,操作系统看不到这些块。
      控制器可以采用备用块来逻辑地替代坏块,这种方案称为扇区备用

    对坏块的处理实质上就是用某种机制使系统不去使用坏块

5.3.3 磁盘调度算法

image-20240923110705361

img

只有寻道时间是操作系统可以优化的

  1. 先来先服务(FCFS)

    根据进程请求访问磁盘的先后顺序进行调度。

    image-20230922090407192

    • 优点:公平;如果请求访问的磁道比较集中的话,算法性能还算过的去
    • 缺点:如果有大量进程竞争使用磁盘,请求访问的磁道很分散,则FCFS在性能上很差,寻道时间长。
  2. 最短寻找时间优先(SSTF)

    SSTF算法会优先处理的磁道是与当前磁头最近的磁道。可以保证每次的寻道时间最短,但是并不能保证总的寻道时间最短。(其实就是贪心算法的思想,只是选择眼前最优,但是总体未必最优)

    image-20230922090856029

    • 优点:性能较好,平均寻道时间短

    • 缺点:可能产生“饥饿”现象,磁头有可能在一个小区域内来回来去地移动。

      Eg:本例中,如果在处理18号磁道的访问请求时又来了一个38号磁道的访问请求,处理38号磁道的访问请求时又来了一个18号磁道的访问请求。如果有源源不断的18号、38号磁道的访问请求到来的话,150、160、184号磁道的访问请求就永远得不到满足,从而产生“饥饿”现象。

  3. 扫描算法(SCAN)

    又称电梯算法,只有磁头移动到最外侧磁道的时候才能往内移动,移动到最内侧磁道的时候才能往外移动。

    image-20230922091629172

    • 优点:性能较好,平均寻道时间较短,不会产生饥饿现象
    • 缺点:
      • ①只有到达最边上的磁道时才能改变磁头移动方向,事实上,处理了184号磁道的访问请求之后就不需要再往右移动磁头了。
      • ②SCAN算法对于各个位置磁道的响应频率不平均(如:假设此时磁头正在往右移动,且刚处理过90号磁道,那么下次处理90号磁道的请求就需要等磁头移动很长一段距离;而响应了184号磁道的请求之后,很快又可以再次响应184号磁道的请求了)
  4. LOOK调度算法

    如果在磁头移动方向上已经没有别的请求,就可以立即改变磁头移动方向。(边移动边观察,因此叫 LOOK)

    image-20230922092519102

    • 优点:比起SCAN算法来,不需要每次都移动到最外侧或最内侧才改变磁头方向,使寻道时间进一步缩短
  5. 循环扫描算法(C-SCAN)

    只有磁头朝某个特定方向移动时才处理磁道访问请求,而返回时直接快速移动至起始端而不处理任何请求。

    image-20230922092744277

    • 优点:比起SCAN来,对于各个位置磁道的响应频率很平均。
    • 缺点:只有到达最边上的磁道时才能改变磁头移动方向,事实上,处理了184号磁道的访问请求之后就不需要再往右移动磁头了;并且,磁头返回时其实只需要返回到18号磁道即可,不需要返回到最边缘的磁道。另外,比起SCAN算法来,平均寻道时间更长。
  6. C-LOOK 调度算法

    如果磁头移动的方向上已经没有磁道访问请求了,就可以立即让磁头返回,并且磁头只需要返回到有磁道访问请求的位置即可。

    image-20240923110535105

    • 优点:比起C-SCAN算法,不需要每次都移动到最外侧或最内侧才改变磁头方向,使寻道时间进一步缩短

减少磁盘延迟时间的方法

image-20240923114524479

  • 磁盘地址结构的设计:
    • 为什么磁盘的物理地址是(柱面号,盘面号,扇区号)而不是(盘面号,柱面号,扇区号)?
    • 答:读取地址连续的磁盘块时,采用这样的的地址结构可以减少磁头移动消耗的时间(其实是减少了磁头移动到其他磁道的次数,从而减少了时间)
    • 还有是因为高位地址不容易发生改变,一般连续存储的都是低位地址的加加减减,所以才把柱面号,也就是磁道号放在高位,一般就不动这个磁道号,也就节省了磁头移动时间
  • 方法
    • 交替编号
      • 具体做法:让编号相邻的扇区在物理上不相邻
      • 原理:磁头读入一个扇区数据后需要一小段时间处理,如果逻辑上相邻的扇区在物理上也相邻,则读入几个连续的逻辑扇区,可能需要很长的“延迟时间”(因为读完一个不能立马读连续的下一个,必须等着第二圈过来才能读)
    • 错位命名
      • 具体做法:让相邻盘面的扇区编号"错位"
      • 原理:与"交替编号"的原理相同。“错位命名法"可降低延迟时间

文件的访问速度是衡量文件系统性能最重要的因素,提高的措施:

  1. 改进文件的目录结构及检索目录的方法,以减少对目录的查找时间
  2. 选取好的文件存储结构,以提高对文件的访问速度
  3. 提高磁盘I/O速度,以实现文件中的数据在磁盘和内存之间快速传送

提高磁盘IO速度的方法

1)采用磁盘高速缓存。
2)调整磁盘请求顺序(磁盘调度算法)。
3)提前读。在读磁盘当前块时,将下一磁盘块也读入内存缓冲区。
4)延迟写。仅在缓冲区首部设置延迟写标志,然后释放此缓冲区并将其链入空闲缓冲区链表的尾部,当其他进程申请到此缓冲区时,才真正将缓冲区信息写入磁盘块。
5)优化物理块的分布。除了上面介绍的扇区编号优化,当文件采用链接方式和索引方式组织时,应尽量将同一个文件的盘块安排在一个磁道上或相邻的磁道上,以减少寻道时间。另外,将若干盘块组成簇,按簇对文件进行分配,也可减少磁头的平均移动距离。
6)虚拟盘。是指用内存空间去仿真磁盘,又叫RAM盘。常用于存放临时文件。
7)采用磁盘阵列RAID。由于可采用并行交叉存取,因此能大幅提高磁盘I/O速度。
5.3.4 固态硬盘

img

静态磨损均衡算法通常比动态磨损均衡算法的表现更优秀。

  1. 固态硬盘的特性

    • 原理:固态硬盘(SSD)是基于闪存技术Flash Memory,属于电可擦除ROM,即EEPROM

    • 组成:

      image

      • 闪存翻译层:负责翻译逻辑块号,找到对应页(Page)
      • 存储介质:多个闪存芯片(Flash Chip);每个芯片包含多个块(block);每个块包含多个页(page)。
    • 读写性能特性:

      • 数据是以页为单位读写的。相当于磁盘的“扇区”
      • 以块(bock)为单位“擦除“,擦干净的块,其中的每页都可以写一次,读无限次。
      • 支持随机访问,系统给定一个逻辑地址,闪存翻译层可通过电路迅速定位到对应的物理地址
      • 读快、写慢,但都比机械磁盘要快(因为没有机械操作)。要写的页如果有数据,则不能写入,需要将块内其他页全部复制到一个新的(擦除过的)块中,再写入新的页
    • 与机械硬盘对比

      • SSD读写速度快,随机访问性能高,用电路控制访问位置;机诚硬盘通过移动磁臂旋转磁盘控制访问位置,有寻道时间和旋转延迟
      • SSD安静无噪音、耐摔抗震、能耗低、造价更贵
      • SSD的一个"块"被擦除次数过多(重复写同一个块)可能会坏掉,而机械硬盘的扇区不会因为写的次数太多而坏掉
  2. 磨碎均衡

    思想:将“擦除”平均分布在各个块上,以提升使用寿命

    • 动态磨损均衡:写入数据时,优先选择累计擦除次数少的新闪存块。
    • 静态磨损均衡:SSD监测并自动进行数据分配、迁移,让老旧的闪存块承担以读为主的储存任务,让较新的闪存块承担更多的写任务

    静态比动态更优秀

    例:某固态硬盘采用磨损均衡技术,大小为240B=1TB,闪存块的擦写寿命只有210=1K次。某男子平均每天会对该固态硬盘写237B=128GB数据。在最理想的情况下,这个固态硬盘可以用多久?

    SSD采用磨损均衡技术,最理想情况下,SSD中每个块被擦除的次数都是完全均衡的。
    1 T / 128 G = 8 1T/128G=8 1T/128G=8
    因此,平均8天,每个闪存块需要擦除一次。

    每个闪存块可以被擦除1K次,因此经过8K天,约23年,固态使用到寿命。

以下无聊的时候看看了解一下

使用机械硬盘的设备:

  1. 台式电脑:许多台式电脑仍然使用机械硬盘作为主要的存储设备,特别是对于那些对存储容量有较高要求但对速度要求不是极高的用户。机械硬盘以其大容量和相对较低的成本成为台式电脑中的常见选择。
  2. 服务器和数据中心:在企业服务器和数据中心中,机械硬盘也得到了广泛应用。虽然固态硬盘在速度和可靠性方面具有优势,但机械硬盘的大容量和低成本使得它们在需要海量数据存储和长时间运行的服务器环境中仍然具有竞争力。特别是在进行批量读写和长时间存储数据的场合,机械硬盘的性价比更高。
  3. 安防监控系统:安防监控系统通常需要长时间连续录制视频,并存储大量的视频数据。由于这些系统对存储容量的需求远大于对速度的需求,因此机械硬盘成为了一个理想的选择。
  4. 特定用途的笔记本电脑:虽然大多数现代笔记本电脑都倾向于使用固态硬盘,但一些特定用途的机型,如某些工作站或图形设计电脑,可能会选择使用机械硬盘来提供额外的存储空间,同时结合固态硬盘来提高系统性能。

使用固态硬盘的设备:

  1. 笔记本电脑:随着固态硬盘技术的不断发展和价格的逐渐下降,越来越多的笔记本电脑开始采用固态硬盘作为主硬盘。固态硬盘能够显著提高系统的启动速度、文件传输速度和整体性能,使笔记本电脑更加轻薄、高效。
  2. 超薄本和二合一设备:这类设备对体积和重量有严格的要求,因此固态硬盘成为了首选的存储设备。固态硬盘的小巧体积和低功耗特性使得这些设备能够实现更长的续航时间和更轻薄的机身设计。
  3. 服务器和数据中心:虽然机械硬盘在服务器和数据中心中也有应用,但固态硬盘凭借其高速的读写能力和出色的稳定性,正在逐渐取代机械硬盘成为这些领域的新宠。固态硬盘能够大大提高服务器和数据中心的性能和效率,提升用户体验和运营效率。
  4. 移动设备:随着移动设备的普及和性能要求的提高,固态硬盘也逐渐被应用于智能手机、平板电脑等移动设备中。固态硬盘的快速读写速度和低功耗特性能够提高移动设备的运行效率和续航能力。
  5. 工业控制领域和航空航天领域:这些领域对设备的可靠性和稳定性要求非常高,固态硬盘能够提供更加稳定和可靠的存储服务。同时,固态硬盘具有较长的使用寿命和较低的维护成本,也更加适合这些领域的使用需求。
5.3.5 本节小结

1)在磁盘上进行一次读/写操作需要哪几部分时间?其中哪部分时间最长?

   在磁盘上进行一次读/写操作花费的时间由寻道时间、延迟时间和传输时间决定。其中寻道时间是将磁头移动到指定磁道所需要的时间,延退时间是磁头定位到某一磁道的扇区(块号)所需要的时间,传输时间是从磁盘读出或向磁盘写入数据所经历的时间。一般来说,寻道时间因为要移动磁头臂,所以占用时间最长。

2)存储一个文件时,当一个磁道存储不下时,剩下部分是存在同一个盘面的不同磁道好还是存在同一个柱面上的不同盘面好?

   上一问经说到,寻道时间对于一次磁盘访问的影响是最大的,若存在同一个盘面的不同磁道,则磁头臂势必要移动,这样会大大增加文件的访问时间,而存在同一个柱面上的不同盘面就不需要移动磁道,所以一般情况下存在同一个柱面上的不同盘面更好。
错题总结或需要注意的点

1.只能顺序:磁带

可以按任意次序读写:光盘,U盘,磁盘

2.磁盘调度中对读写时间影响最大的是寻道时间(这个是机械运动,耗时)

3.硬盘的操作系统引导扇区产生在对硬盘进行高级格式化时

4.静态磨损均衡算法比动态的算法表现更加优秀

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/882488.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

大数据毕业设计选题推荐-网络电视剧收视率分析系统-Hive-Hadoop-Spark

✨作者主页:IT毕设梦工厂✨ 个人简介:曾从事计算机专业培训教学,擅长Java、Python、PHP、.NET、Node.js、GO、微信小程序、安卓Android等项目实战。接项目定制开发、代码讲解、答辩教学、文档编写、降重等。 ☑文末获取源码☑ 精彩专栏推荐⬇…

通信工程学习:什么是NFVO网络功能虚拟化编排器

NFVO:网络功能虚拟化编排器 NFVO(Network Functions Virtualization Orchestrator),即网络功能虚拟化编排器,是网络功能虚拟化(NFV)架构中的核心组件之一。NFV是一种将传统电信网络中的网络节点…

从零开始学习Python

目录 从零开始学习Python 引言 环境搭建 安装Python解释器 选择IDE 基础语法 注释 变量和数据类型 变量命名规则 数据类型 运算符 算术运算符 比较运算符 逻辑运算符 输入和输出 控制流 条件语句 循环语句 for循环 while循环 循环控制语句 函数和模块 定…

黑马智数Day3

渲染基础Table列表 封装接口: export function getCardListAPI(params) {return request({url: /parking/card/list,params}) } 具体实现: import { getCardListAPI } from /apis/cardexport default {data() {return {// 请求参数params: {page: 1,pa…

乌克兰因安全风险首次禁用Telegram

据BleepingComputer消息,乌克兰国家网络安全协调中心 (NCCC) 以国家安全为由,已下令限制在政府机构、军事单位和关键基础设施内使用 Telegram 消息应用程序。 这一消息通过NCCC的官方 Facebook 账号对外发布,在公告中乌…

【小程序】uniapp自定义图标组件可动态更换svg颜色

组件描述 通过图标名称加载对应svg,size参数调整图标大小,color参数调整图标颜色 解决思路: 存svg获svg,对象方式正则替换svg的fill值,不改变源文件,通过base64直接加载缓存svg源文件,避免重…

上传富文本插入文件时报错:JSON parse error: Unexpected character解决办法

方式一(加密解密): 1.前端 (1)安装 crypto-js npm install crypto-js(2)util下创建asc.js asc.js import CryptoJS from crypto-js// 需要和后端一致 const KEY CryptoJS.enc.Utf8.parse(…

爬虫逆向学习(七):补环境动态生成某数四代后缀MmEwMD

声明:本篇文章内容是整理并分享在学习网上各位大佬的优秀知识后的实战与踩坑记录 前言 这篇文章主要是研究如何动态生成后缀参数MmEwMD的,它是在文章爬虫逆向学习(六):补环境过某数四代的基础上进行研究的,代码也是在它基础上增…

C++之初识STL(概念)

STL(标准模板库) STL广义分类为:容器,算法,迭代器 * **容器**和**算法**之间通过**迭代器**进行无缝连接 意义:C的**面向对象**和**泛型编程**思想,目的就是**复用性的提升** STL六大组件 1. 容…

论文阅读:Omni-Kernel Network for Image Restoration

论文地址:https://ojs.aaai.org/index.php/AAAI/article/view/27907 项目地址:https://github.com/c-yn/OKNet 发表时间:2024 图像恢复的目的是从一个退化的低质量的观测中重建一个高质量的图像。最近,Transformer模型由于其强大…

JavaScript 安装库npm报错

今天在编写JavaScript代码时,缺少了包express。 const express require(express); const app express();app.get(/, (req, res) > {res.send(Hello, world!); });app.listen(3000, () > {console.log(Server is running on port 3000); });npm install exp…

【Redis技能熟练掌握之十年内功】

Redis技能熟练掌握之十年内功 1.redis是什么?为什么要使用redis?2.redis一般应用于什么场景(四个场景)?3. Redis持久化机制是什么?各自的优缺点?一般咋么用?4. redis五个基础类型支持…

速通汇编(七)BX、SI、DI寄存器,BP寄存器,直接寻址和间接寻址

下文中出现的"idata",指的都是任意常量 一,基于BX、SI、DI等寄存器的寻址形式 在第五篇中曾介绍过DS寄存器的作用,简要复习一下->速通汇编(五)认识段地址与偏移地址,CS、IP寄存器和jmp指令&a…

百度飞浆Paddle OCR检测和识别【OCR数据收集、标注、数据集划分、检测识别模型训练、导出模型】

文章目录 前言一、OCR数据集采集二、OCR数据标注三、划分数据集四、数据训练五、导出模型 前言 1、我的电脑没有GPU,如果不使用AI Studio训练的话,第一遍我是按照CPU进行环境配置和训练的,可以参考这篇文章,我按着弄了一遍&#…

Kafka技术详解[1]:简介与基础概念

目录 1. Kafka入门 1.1 概述 1.1.1 初识Kafka 1.1.2 消息队列 1.1.3 生产者-消费者模式 1.1.4 消息中间件对比 1.1.5 ZooKeeper 1. Kafka入门 1.1 概述 1.1.1 初识Kafka Kafka是由Scala和Java语言开发的高吞吐量分布式消息发布和订阅系统,也是大数据技术领…

10月23-27日六西格玛绿带公开课即将在雄安新区开课

在金秋送爽、硕果累累的季节里,天行健管理咨询公司宣布了一项重要决定——定于10月23日至27日,在充满未来气息的河北雄安新区,举办一场旨在提升企业质量管理水平、培养精英人才的六西格玛绿带公开课。此次课程的举办,不仅是对当前…

Spring6梳理9—— 依赖注入之注入对象类型属性

目录 9.1 依赖注入之外部注入对象类型属性 9.1.1 创建dept与emp类 9.1.2 创建配置文件 9.1.3 创建测试类 9.1.4 运行结果 9.2 依赖注入之内部注入对象类型 9.3 依赖注入之级联注入对象类型 9.1 依赖注入之外部注入对象类型属性 9.1.1 创建dept与emp类 1.dept…

Python在AI中的应用--使用决策树进行文本分类

Python在AI中的应用--使用决策树进行文本分类 文本分类决策树什么是决策树 scikit算法 使用scikit的决策树进行文章分类一个文本分类的Python代码使用的scikit APIs说明装入数据集决策树算法类类构造器: 构造决策树分类器产生输出评估输出结果分类准确度分类文字评估…

达梦-华为鲲鹏ARM架构下性能测试最佳实践

一、测试综述 1.1 测试目的 本次测试的目的是验证达梦数据库,在鲲鹏服务器下,不同服务器参数基于sysbench性能压力测试的表现。本次参数是根据为华为鲲鹏arm服务器调优十板斧内建议值调整 成长地图-鲲鹏开发套件开发文档-鲲鹏社区 1.2 通用指标 指标…

跟着问题学12——GRU详解

1 GRU 1. 什么是GRU GRU(Gate Recurrent Unit)是循环神经网络(Recurrent Neural Network, RNN)的一种。和LSTM(Long-Short Term Memory)一样,也是为了解决长期记忆 和反向传播中的梯度等问题…