2024考研408-计算机组成原理第三章-存储系统

文章目录

  • 前言
  • 一、存储器概述
    • 1.1、层次结构
    • 1.2、存储器分类
      • 1.2.1、层次分类
      • 1.2.2、存储介质分类
      • 1.2.3、存取方式
      • 1.2.4、按照信息的可更改性(读写、只读区别)
    • 1.3、存储器性能指标
    • 知识回顾
  • 二、主存储器
    • 2.1、主存储器的基本组成(介绍DRAM)
      • 2.1.1、主存储器的基本元件
      • 2.1.2、存储芯片的基本原理
      • 2.1.3、完整的存储器芯片以及封装图(认识片选线以及金属引脚作用)
      • 2.1.4、存储芯片寻址
      • 知识回顾
    • 2.2、SRAM与DRAM
      • 2.2.1、存储元件不同导致的特性差异
      • 2.2.2、DRAM与SRAM的区别
      • 2.2.3、DRAM与SRAM的刷新
        • 2.2.3.1、了解刷新
        • 2.2.3.2、刷新详细深入理解
          • 1、多久刷新一次?
          • 2、每次刷新多少存储单元?介绍两种模型(含示例)
          • 3、如何刷新?
          • 4、在什么时刻刷新?(分散、集中、异步刷新)
      • 2.2.4、送行列地址(DRAM的优化,地址线复用技术)
      • 本节回顾
    • 2.3、只读存储器ROM
      • 2.3.1、ROM的发展史(MROM、PROM、EPROM、闪存、SSD)
      • 2.3.2、认识BIOS
      • 本节回顾
  • 三、主存储器与CPU的连接
    • 3.1、单块存储芯片与CPU的连接
    • 3.2、存储器芯片的输入与输出信号元件介绍
    • 3.3、多块存储芯片与CPU的连接
      • 3.3.1、位扩展
      • 3.3.2、字扩展(线选法与译码片选法,含字扩展示例)
      • 3.3.3、字位同时扩展
    • 补充:译码器(包含介绍CPU->译码器->存储芯片的过程、RAM读周期详解)
    • 总结回顾
  • 四、提升主存读取速度双端口(双端口RAM、多模块存储器策略)
    • 4.1、理解存取周期,引出问题(含知识总览)
    • 4.2、双端口RAM解决问题1:访问同一块存储空间,多个CPU如何解决等待恢复时间
    • 4.3、多体并行存储器解决问题2:单CPU多次访问主存等待恢复时间过长问题
      • 4.3.1、认识高位以及低位交叉编址(了解区别与读取速度差异)
      • 4.3.2、为什么要探讨"连续"访问的情况?
      • 4.3.3、低位交叉编址最佳需要采用多少个体呢?
      • 4.3.4、思考:给定一个地址x,如何确定它属于第几个存储体?
      • 4.3.5、多体并行存储器与单体多字存储器区别
      • 扩展介绍:双通道是什么?如何组合为双通道?
    • 本节回顾
  • 五、外部存储器
    • 5.1、磁盘存储器
      • 5.1.1、认识磁盘存储器
      • 5.1.2、磁盘存储器的组成
      • 5.1.3、磁盘的性能指标
      • 5.1.4、磁盘怎么确定要读取的扇区?认识磁盘地址
      • 5.1.5、磁盘的工作过程
      • 5.1.6、认识磁盘阵列RAID0-5(提升系统性能以及磁盘存储的可靠性)
      • 总结回顾
    • 5.2、SSD固态硬盘
      • 5.2.1、机械硬盘VS固态硬盘
      • 5.2.2、固态硬盘的组成
      • 5.2.3、读/写特性
      • 5.2.4、磨损均衡技术
      • 扩展:固态硬盘的寿命
  • 五、高速缓冲存储器
    • 5.1、Cache的基本概念和原理
      • 5.1.1、存储系统存在的问题
      • 5.1.2、Cache的工作原理
      • 5.1.3、程序的局部性原理
      • 5.1.4、性能分析(平均访问时间计算)
      • 5.1.5、空间局部性原理,如何界定"周围"
      • 知识点回顾
    • 5.2、Cache与主存的映射算法(三种)
      • 三种映射方式以及认识Cache标记号与有效位
      • 5.2.1、全相联映射(随意放)
      • 5.2.2、直接映射(只能放固定位置)
      • 5.2.3、组相联映射(可放到特定分组)
      • 知识点回顾
    • 5.3、Cache替换算法(解决Cache满的问题)
      • 5.3.1、针对三种映射方式是否使用替换算法讨论
      • 5.3.2、四种替换算法
        • 5.3.2.1、随机算法
        • 5.3.2.2、先进先出算法
        • 5.3.2.3、近期最少使用算法(LRU)
        • 5.3.2.4、最近不经常使用算法(LFU)
      • 知识点总结
    • 5.4、cache写策略(修改cache中数据副本,确保主存中数据母本的一致性)
      • 5.4.1、写命中
        • 5.4.1.1、写回法
        • 5.4.1.2、全写法(或写直通法)
      • 5.4.2、写不命中
        • 5.4.2.1、写分配法
        • 5.4.2.2、非写分配法
      • 5.4.3、多级cache
  • 六、虚拟存储器
    • 6.1、页式存储器
      • 6.1.1、认识页式存储(引出逻辑地址、物理地址、页表)
      • 6.1.2、地址变换过程(慢表、快表)
      • 6.1.3、快表与cache,快表与慢表区别
      • 知识回顾
    • 6.2、虚拟存储器
      • 6.2.1、页式虚拟存储器(含存储器的层次化结构)
      • 6.2.2、段式虚拟存储器
      • 6.2.3、段页式虚拟存储器

前言

目前正在备考24考研,现将24计算机408学习整理的知识点进行汇总整理。

博主博客文章目录索引:博客目录索引(持续更新)

一、存储器概述

image-20230529150359857

image-20230529150418828


1.1、层次结构

image-20230529151010582

寄存器包含ACC、MQ等,速度要比cache快得多。

image-20230529151027763

  • 主存与辅存之间的数据交换是由系统程序员来处理,其中操作系统中包含页面置换算法。
  • Cache与主存之间的数据交换是硬件自动完成的,软件程序员无需关心之间的数据交换,这部分是由硬件工程师实现的。

此时由于这种关系,应用程序员所看到的主存通常较大,下面是主存-辅存、Cache-主存解决的问题

image-20230529151044895

各层存储器的速度与价格:光盘->机械硬盘->固态硬盘->内存条

  • 速度由低到高,价格也是由低到高

image-20230529151537856


1.2、存储器分类

1.2.1、层次分类

image-20230529154927802

image-20230529155031978


1.2.2、存储介质分类

image-20230529155318182

①半导体存储器:如主存、Cache

image-20230529155439228

②磁表面存储器:软盘、磁带、机械硬盘(下图从左到右)

image-20230529155453999

③光存储器:光盘、DVD、VCD都是光存储器

image-20230529155458459


1.2.3、存取方式

①随机存储器,如内存条:访问指定地址的时间都是一样的

image-20230529155641494

②顺序存取存储器:复读机中放的磁带

若是需要读取磁盘中的某一块内容,则需要等待磁头转到那边

image-20230529155717872

③直接存取存储器

例如机械硬盘、磁盘都是典型的直接存取存储器,既有随机存取的特性,又有顺序存取特性。

首先磁头臂会进行前后的移动到想要读取的区域,接下来会有个磁盘,不断滑动,这个磁盘就可以相应的读和写。

存取速度(小到快):顺序存储存储器->直接存取存储器->随机存取存储器。

image-20230529160152481

④相联存储器:根据根据要找的内容,直接去寻找内容对应在哪里。

image-20230529160402414

不同:①-③根据地址访问、④根据内存访问。


1.2.4、按照信息的可更改性(读写、只读区别)

image-20230529162113593


1.3、存储器性能指标

①存储容量存储字数x字长(如1M x 8位)

  • MDR位数反应存储字长。MAR反应存储字数。

②单位成本每位价格=总成本/总成本,每个bit位付出的金钱成本。

举例:

image-20230529162517150

③存储速度数据传输率=数据的宽度/存储周期,数据的宽度即存储字长

  • 一个存储周期可以读或写一个存储字这么多的数据。
  • 存取周期则见如下:

image-20230529162907572


知识回顾

image-20230529150235646

二、主存储器

2.1、主存储器的基本组成(介绍DRAM)

image-20230529165801623

2.1.1、主存储器的基本元件

主存储器分为存储体、MAR(地址寄存器)、MDR(数据寄存器)三个部分:
image-20230529170013028

这三个部分会在时序控制逻辑电路中相互配合使用:

image-20230529170124681

  • 一个存储体由多个存储单元构成 => 每个存储单元由多个存储元构成 => 使用一个存储元件可以存放一个二进制位的0或1

image-20230529171212188

  • 给MOS管一个阈值电压(5v)就能够导电,若是不给那么就是一个绝缘体不会导电。

2.1.2、存储芯片的基本原理

基于上面的存储元来介绍下读出、写入原理:

  • 读出二进制原理:通常在电容中保存着数据0或1,那么如何去读取呢?可以给MOS管加电流,若是达到阈值5V,此时右端就会流出1,否则就会流出0。
  • 写入二进制原理:可以在MOS管的右端加一个5v的高电平,同时也给MOS管加一个5v的电平,此时MOS管就可以接通,电容中就会存储1,此时MOS管端口,电容里的电荷就跑不出去了。

**如何读取多个存储二进制值呢?**通过去读取存储单元来进行,如下,由多个存储元组成的一个存储单元,在存储单元上每个MOS管接线,若是想要读取一组单元的存储元值,直接全部上电压,就能够读取到一个存储单元的所有二进制位(每个存储元中的电容)。

  • 此时由多个存储单元组成就是一个存储体。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-hoJqQwm8-1686883020451)(C:\Users\93997\AppData\Roaming\Typora\typora-user-images\image-20230529171556838.png)]

如何根据地址来决定我们要读或者写哪个存储字呢

image-20230529172423749

  • 此时涉及到译码器的使用,译码器会根据MAR中给出的几个地址转变为指定某条线的高电平信号。
  • 每个地址都会对应译码器的一条线。
  • 一个地址信号可以被转换成译码器的某一条输出线的高电平信号,一旦这一条字选线被接通之后,我们就可以通过数据线,把每一个的二进制数据传送到MDR当中。此时CPU会通过数据总线从MDR中取走一整个数据。

计算下总容量:三位的话就有8条线。

image-20230529172522561

控制电路作用:①对于传输数据到MAR当中时可能并不稳定,所以控制电路做的一个工作就是,只有当MAR当中的数据稳定之后才会去打开译码器开关来进行读取并翻译地址来给出信号。②于此同时传输到MDR的数据也要稳定了之后才能够传输给数据总线,这也是由控制电路控制的。

image-20230529173531111

自带有两个片选信号

  • CS:chip select,芯片选择信号
  • CE:chip enable,芯片使能信号

额外有两跟读/写控制线,由两种设计方案:①读写各单独一根。②读写一根线,根据输入的高低电平来确定是什么操作。

注意:通常题目中会告知你使用几根读/写线。


2.1.3、完整的存储器芯片以及封装图(认识片选线以及金属引脚作用)

完整的一个存储器芯片如下

image-20230529173601127

此时对整块存储器芯片来进行封装

image-20230529174653062

  • 驱动器主要用来放大信号的
  • 地址线用于接受外界传来的地址信息,CPU通过地址总线传来的。
  • 数据线来进行数据的传输。
  • 片选线:来确定这块芯片是否可用。
  • 读写控制线:可能有一条,也有可能有两条。

片选线的作用

image-20230529174500508

  • 一个内存条可能包含多块存储芯片,而有时候我们若是指定要读取某块芯片数据,那么我们可以针对那一块芯片数据传输低电压,其他存储芯片传输高电压,此时就能够单独对指定的存储芯片进行读取了。

**对应每个存储芯片下都有如下图一样的金属引脚这是什么呢?**这个是就是我们上图封装好之后对应的地址线、数据线、片选线以及读/写控制线相对应的引脚,用于其他模块来传入进来数据。

image-20230529174633516

image-20230529175357436


2.1.4、存储芯片寻址

关于寻址的问题主要来看存储器中的存储矩阵,数据是存储在这里:寻址方式可按照字节、字、半字、双字来进行寻址,不同寻址对应的编号也不同,若是更大是倍数,存储单元个数可进行右移

image-20230529175725392


知识回顾

image-20230529180136202


2.2、SRAM与DRAM

image-20230529181352507


2.2.1、存储元件不同导致的特性差异

DRAM

在2.1节当中学习的就是DRAM芯片,采用的是电容存储的,对于SRAM则是采用的双稳态触发器来存储信息:

image-20230529181746513

image-20230529182844491

SRAM

双稳态触发器的读/写原理

image-20230529182801974

其中双稳态触发器有6个,在这种存储器中可以呈现出两种稳定的状态:

  • 第一种稳态A是高电平,B是低电平,此时对应着二进制1。
  • 第二种稳态A是低电平,B是高电平,此时对应着二进制0。

对于左边电容存储元读出数据的数据线只有一根,右边双稳态触发器则需要两根来读取数据,我们可以根据BL或者BLX读出的是0或1就能够确定读出的是什么信号了。

如何写入数据呢?

  • 写入0时,给BL加低电平,BLX加高电平。
  • 写入1,左高右低。

2.2.2、DRAM与SRAM的区别

两者的区别

一方面:存储元件上导致的区别,也就是读数据是否需要重写的情况,DRAM在读数据后需要有一个重写操作,而SRAM无需重写。

另一方面

  • 制造成本:DRAM只需要一个电容,SRAM需要6个MOS管,可以看出DRAM成本更低,SRAM成本高。
  • 集成度:DRAM的电容很小,对比SRAM的小了很多,同样一块位置肯定是DRAM的电容数量更多,所以DRAM的集成度高,SRAM集成度低。
  • 功耗:DRAM对比SRAM所需的功耗更低,因为其元器件对比SRAM的少。

2.2.3、DRAM与SRAM的刷新

2.2.3.1、了解刷新

image-20230529220328838

对于DRAM需要2ms刷新一次,若是不刷新原本电容中的数据就会丢失!

2.2.3.2、刷新详细深入理解

针对于DRAM刷新来进行详细介绍

1、多久刷新一次?
  • 刷新周期:一般为2ms。
2、每次刷新多少存储单元?介绍两种模型(含示例)
  • 以行为单位,每次刷新一行存储单元,但是对于每次刷新一行存储单元,这样的效率十分低,若是有20位,那么就需要220,也就是百万个内存地址,试想若是一次刷新一行存储单元,那么需要刷新百万次,这个是十分耗时的,那么就要引入行列地址
  • image-20230529221930306

简单模型:

image-20230529220646515

行列地址模型:

将一个译码器分为两个也就是行列译码器,那么此时一个译码器负责210,总共也只需要执行210次,此时只需要一千次,大大提升效率,分为拆为n/2:

image-20230529221032164

随着存储器发展,存储容量越来越大,现在一些存储器还有三维的排列,原理类似。

示例:给你一个地址00000000如何来进行访问。

第一种方案:选通的是0号存储单元

image-20230529221358500

总共需要28也就是256根选通线:

image-20230529221748163

第二种方案:各自拆成一般分别送到行地址译码器以及列地址译码器

image-20230529221529815

针对于行列地址译码器只需要32根:

image-20230529221830192

3、如何刷新?
  • 有硬件支持,读出一行的信息后重新写入,占用1个读/写周期。
4、在什么时刻刷新?(分散、集中、异步刷新)
  • 假设DRAM内部结构排列出128x128的形式,读/写周期(或称存取周期)0.5us【刷新一行的时间】。2ms共2ms/0.5us=4000个周期。

有多种刷新思路如下:

①分散刷新:这种思路针在一个2ms周期中可以进行2000次刷新,是能够满足128x128中的128次的。

image-20230529222449274

②集中刷新:集中一段时间进行读写,然后再集中一段时间去刷新,在这一段刷新时间中无法访问存储器

image-20230529222644638

③异步刷新:在这个过程中将死时间进行了分散,可以利用CPU不需要访问存储器的时间段(例如利用CPU在译码的时间段)来进行刷新

image-20230529223011404


2.2.4、送行列地址(DRAM的优化,地址线复用技术)

同时送:一个地址前面部分送到行地址译码器,而地址后一半部分送到列地址译码器当中,此时需要同时传输行与列地址,也就是需要n位地址线来进行同时传输

image-20230529223601332

在DRAM中通常采用地址线复用技术:也就是行地址与列地址通过前后两次分别进行传输,使用n/2根地址线,通过增加一个行地址缓冲器以及一个列地址缓冲器,分开传输

image-20230529225645386

通过这种策略,原本n条地址线此时就可以优化为n/2根。


本节回顾

image-20230529181442109


2.3、只读存储器ROM

2.3.1、ROM的发展史(MROM、PROM、EPROM、闪存、SSD)

image-20230530090541193

ROM的发展史如下: 基于上图的五个

①MROM:只能读而不能写的存储器。

初始化是厂家完成的,可根据需求来将指定数据写入,采用的是一种掩膜技术,对于掩膜技术只能够进行批量定制。

image-20230530093015616

②为了提高只读存储器的灵活性,此时就发明了PROM。用户可以使用专门的PROM写入器来写入信息,写一次后就无法更改。

image-20230530093030994

③接着又出现了EPROM,可以允许多次重写。可以通过一些特殊的手段往里面写数据。

image-20230530093041493

针对于EPROM分为下面两个类型:

  • UVEPROM(uv紫外线意思):可使用紫外线来照射擦除,注意是所有信息而不是部分信息。【灵活性不高】
  • EEPROM:可以采用电可擦除技术,擦除特定的字。【灵活性高】

④此时又出现了Flash Memery(闪存),保留了EEPROM的优点断电后可以保存信息,还可进行多次的快速擦除重写。

注意点:闪存需要先擦除再写入,写速度比读速度更慢。

image-20230530093124061

  • 位密度高解释:对于两块体积都相同的芯片来说,Flash Memery存储元数量比RAM的要多,可以保存更多的位。

⑤接着随着技术发展,又出现SSD(固态硬盘),也是由闪存芯片来存储二进制数据的,其中多了一个控制单元,用来控制多块闪存芯片的读和写。

实际上许多固态硬盘、U盘的介质都是闪存芯片,与U盘的区别在于控制单元不一样。

image-20230530093246068


2.3.2、认识BIOS

CPU在刚开始执行的一段程序,需要从BIOS中读取指令:

image-20230530093924257

实际上对于主存同样包含ROM,是由RAM+ROM组成,二者统一进行编址,如下:

image-20230530094059769


本节回顾

image-20230530094226212


三、主存储器与CPU的连接

image-20230530172925178

3.1、单块存储芯片与CPU的连接

image-20230530174818007

  • 字扩展:单个存储芯片是8x8位的,主存地址连接了8位,若是想要扩展主存字数可以采用该扩展。【可以连接多块存储芯片来扩展字数】
  • 位扩展:对于8x8的存储芯片,那么一个地址就只有8位,而现在的计算器一次可以处理64位数据,若是此时存储芯片字长<数据总线宽度,那么可以采用位扩展。【通过多块存储芯片的合理连接,可以让整个主存的存储字长扩展为与数据总线宽度一致】

以前的存储芯片中集成着MDR与MAR,如今在计算机中这两个元件是集成在CPU当中:

image-20230530175341205

  • CPU中三个部件的作用:MDR当中传输数据是通过数据总线;MAR传输地址是通过地址总线传输数据的;CPU还需要通过控制总线来发送一些控制信息来与主存进行一些读写操作。

目前主存中包含多块存储芯片见如下

image-20230530175600844


3.2、存储器芯片的输入与输出信号元件介绍

image-20230530180131135

  • 地址(Address)、数据(Data)、WE(write)、WR(read)

image-20230530180932971

WE:表示写使能信号,write Enable,若是高电平表示写数据,低电平表示读数据。CPU也有对应的WE线来进行发送信号,通过控制信号发送过去。

CS:片选信号,由于只有一块芯片工作,可以直接接上高电平信号,因为CS头上没有划横线,表示片选信号高电平有效。

来看整体的连接情况,可以发现数据总线仅仅只连接了一位,地址总线也只连接了一部分,并没有充分发挥CPU的性能,解决这样的问题可以给主存再加上一块相同型号的芯片


3.3、多块存储芯片与CPU的连接

3.3.1、位扩展

位扩展:此时我们总共有两块主存储器,总体来看数据读取位长有两位,此时可以同时读与同时写两位

新连接一块存储芯片,可以将新的D0连接到CPU的D1,对应的A地址线与第一块连接一致即可读取时可以都传入到各自的地址线当中。

image-20230530181246703

完成8位数据线扩展如下,我们需要增加8个8K x 1位的即可完成扩展:

image-20230530182019964


3.3.2、字扩展(线选法与译码片选法,含字扩展示例)

主要包含两种选法

image-20230530205026389

线选法:CPU上的n根线对应n个存储芯片。

  • 举例:A0-A13对应存储芯片的各个地址线,A14对应存储芯片A,A15对应存储芯片B。那么只有在01xxxxx、10xxxxx才能够分别表示一组存储芯片,那么对于00、11直接就浪费掉了(对于线选方式的00都不选、11会造成数据线读取冲突,不允许有这类情况)

译码片选法:CPU上的n根线对应2n个存储芯片,利用率更好。

  • 举例:A0-A13对应存储芯片的各个地址线,对于一个线+一个译码器,那么就可以对应两个存储芯片,0就是表示指定一个存储芯片可用,1表示另一个存储芯片可用,比线选法利用率更高。

线选法

image-20230530205932183

使用CPU的两个地址线来进行举例:

A13与A14一个为0,另一个为1时的最低地址与最高地址:分别各自表示

image-20230530210234548

A13与A14都是1则会造成冲突情况:可以看到底部出现了冲突

image-20230530205800017

若是都是0,由于CS表示的时高电平有效,此时两个存储芯片都不会选。

译码片选法

译码片选法:通过使用一个译码器来实现转换,1个地址线可转2个,2个地址线可转4个,也就是2n

此时我们只使用一个A13来对应一个译码器,当A13为1时:通过译码器转换后,对于第一个存储芯片传输的为低电平那么第一个不选用,第二个存储芯片传输的则是1也就是高电平,此时第二个存储芯片生效

image-20230530210522399

当A13为0时,此时第一个存储芯片生效:

image-20230530210752261

地址范围为:

image-20230530210806862

可以看到上面的A13仅仅只是选择一个转2个,那么对应这个译码器就是1-2译码器:可有0xxxx、1xxxx对应两个存储芯片

image-20230530210918777

3-8译码器:输入信号为000、001、010、011、100、101、110、111,可接8个存储芯片

image-20230530210930814

下面给出一个扩展4个存储芯片示例:在下面的存储芯片CS上有一个横线,表示低电平有效,此时你也可以看到对应的译码器上有一个圈表示是非的含义,也就是当这个线传输到CS横时为0才有效:

image-20230530211716435


3.3.3、字位同时扩展

字位同时扩展示例:

image-20230530212006355

CPU是64位地址线,数据宽度为8位,对应的存储芯片是16k x 4位,那么此时我们需要4块存储芯片来进行字扩展,同时2个存储芯片需要进行位扩展,由于字位同时扩展,所以需要2*4=8块,可以看到上图的左边红框可以组成一个16k x 8位,那么需要4个来进行子扩展,则能够实现了主存容量扩展。


补充:译码器(包含介绍CPU->译码器->存储芯片的过程、RAM读周期详解)

可以看到下图的左右两边是两种不同的生效情况,左边是高电平有效、右边是低电平有效:

image-20230530213031215

对应译码器中还包含使能信号:左边的是单个的,右边则有多个使能

image-20230530213952745

介绍CPU->译码器->存储芯片的过程:CPU首先会通过地址线送出地址信号,包括更低的13位与更高的3位,地址信息是通过电信号来输出的,当CPU刚开始输出电信号的时候,电信号有可能不稳定,因此CPU送出这些地址信息之后,需要等一下,等电流稳定之后再发出主存请求信号(MREQ),也就是让选通线的一个信号有效,当一块存储芯片选通之后,这块存储芯片所接收到的信号一定是稳定的。

image-20230530214111193

RAM读周期详解

image-20230530214949244

image-20230530214858982


总结回顾

image-20230530212659972

位扩展:使存储器的字长变得更长,从而更能发挥数据总线的传输能力。

字扩展:可以增加存储器的存储字数,可以更好的利用CPU的寻址能力。

可以在不同的维度扩展发挥数据总线的传输能力,增加存储器的存储字数更好的利用CPU的寻址能力。


四、提升主存读取速度双端口(双端口RAM、多模块存储器策略)

4.1、理解存取周期,引出问题(含知识总览)

存取周期如下

image-20230531112637292

对于DRAM芯片读请求是破坏性请求,读取之后需要进行恢复,上图中存取时间就是DRAM读取一个字的时间,读完之后则需要一段恢复时间,在这个恢复时间中CPU无法访问。

  • 对于SRAM恢复时间就会短很多。

此时针对于存储芯片读取一个字时需要等待恢复时间这种情况来提出问题并进行解决

1、多核CPU中一个CPU访问了一块内存之后需要恢复时间,那么由于是多核,此时另一个CPU在之前CPU的等待恢复时间也要访问该块空间,如何解决?

  • 解决方式:双口RAM。

2、单核CPU读写速度比主存快很多,对于主存恢复时间过长如何解决?

  • 解决方式:多模块存储器。

image-20230531091830228


4.2、双端口RAM解决问题1:访问同一块存储空间,多个CPU如何解决等待恢复时间

双端口RAM如下进行设计

image-20230531113225271 介绍:可以看到上图中的一个RAM左右两边都可以去联通CPU,若是要支持这种多CPU的访问模式,我们需要在一个RAM存储器中有两组完全独立的数据线、地址线、控制线,于此同时RAM中也需要更多更复杂的控制电路。

好处:对于这种设计方式可以优化多核CPU访问一根内存条的速度。

多个端口对同一主存允许操作:不同端口对不同地址单元存取数据;不同端口对同一端口可读取数据;

  • 不允许的操作如:写写、读写。

解决不允许的操作方案:采用双端口时会出现四种情况,对于写写、读写操作应该禁止,这个禁止是通过电路来进行实现的。

image-20230531113657820


4.3、多体并行存储器解决问题2:单CPU多次访问主存等待恢复时间过长问题

4.3.1、认识高位以及低位交叉编址(了解区别与读取速度差异)

针对于单CPU多次访问主存等待恢复时间过长问题,我们可以采用多体并行存储器来进行解决,也就是将一块存储器来拆为多块可供CPU访问,可分为高位以及低位交叉编址

image-20230531114406606

对于高位与低位交叉编址的区别是什么呢?每个地址是根据体号与体内地址组成,对于高位交叉编址是体号在前,体内地址在后;对于低位交叉编制是体内地址在前,体号在后。

image-20230531114517131

对于不同的地址设计,对应的地址编号顺序也会受到影响各不相同,我们可以发现高位交叉编址的内存地址顺序依次是从第一根从上至下,接着第二个往下,而对于低位交叉编址则是一个一个地址分离对应的多块相隔,对于这样的区别有什么影响呢?

下面举一个例子:访问连续的5块地址,我们分别来看采用高位交叉编址与低位交叉编址的读取时间

①高位交叉编址

由于连续的5个地址都是在分为四根的第一根存储器中,那么相当于会连续访问5次同一根,每次访问的时间都包含了存取时间1r以及等待时间3r:

image-20230531115051580

可以看到每访问一次实际需要4r,也就是1T,第二次由于访问的也是同一根需要等待时间结束后才能够访问,之后的几次同样如此,总共需要时间为5T。

②低位交叉编址

image-20230531115335010

采用低位交叉编址地址编号是一根隔着一根的,所以访问第一位时是在第一根,此时需要使用读取时间1r,在1r之后可以直接读取第二根,无需进行等待,后面3、4根同样如此,由于我们上面低位交叉编址是设置了4根,所以我们在第五次访问位的时候会访问第一根,此时可以发现,正好3r的等待时间已经结束,此时同样无需等待可直接进行访问。

采用这种方式可以十分高效速度去读取,耗时只需要T + 4r,也就是2T!

小总结:当访问一根内存条的存储器时,每次访问都必须有等待时间,对于同样顺序读地址时

  • 高位存储器:顺序读五个则是5 * 5r= 25r 1T=5r,那么就是5T
  • 低位存储器:顺序读五个(访问的是不同存储单元)则是5 * 1r = 5r,而当读取第五个也就是第一块时,之前的等待时间刚好已经结束,可以再次进行读取,此时耗时为1T+4r = 2T。| 微观层面时间开销的计算:T + (n - 1).r,宏观层面读写一个字的时间接近r。

从效率上来看,低位比高位高出很多足足有4倍。


4.3.2、为什么要探讨"连续"访问的情况?

程序指令的执行是顺着一条一条往下执行的,一般就是连续存储,除非碰到if else情况。


4.3.3、低位交叉编址最佳需要采用多少个体呢?

上述可以看出低位交叉编址的多体存储器针对于连续地址访问效率十分高,那么具体应该取几个体呢

  • 应当保证模块数m>=T/r(存取周期T,存取时间r),若是m < T/r时,那么当读取第T个时那么T / r个还在等待恢复中,无法进行读取此时就需要进行等待。

image-20230531120101451

下面给出不同模块数的情况

image-20230531120450398

总结表述:

image-20230531120125905


4.3.4、思考:给定一个地址x,如何确定它属于第几个存储体?

①直接根据末尾的体号来判断。②根据给定的m,来让x % m进行取余处理。


4.3.5、多体并行存储器与单体多字存储器区别

image-20230531120552754

前者可以任意去读取某个存储器中的字,后者每次只能去读取一行,有时候读取跨行的几个字会导致多读数据。

速度对比:前者每读取一个字接近r,读取四个就是4r;后者每次读取一行,读取一行需要1T,也是4r,所以读取速度差不多。


扩展介绍:双通道是什么?如何组合为双通道?

image-20230531121938579

我们在日常生活中所说的扩容以及双通道实际上就是我们上述所介绍的高位交叉以及低位交叉情况,采用低位交叉可以构成双通道,此时读取速度可以大大提升!

如何构成双通道?一条16GB的可以换成两条8GB的,分别插入到上面相同颜色卡槽中,此时就可以构成双通道。

那么我们为什么要挑选相同主频以及相同容量的呢

  • 相同主频:若是购买主频不同的内存条,实际高主频的内存条就会出现降频的情况
  • 相同容量:若是容量不相等并且采用双通道的时候,相同容量的两个部分组成了低位交叉编址,在读取这一块内存的时候十分流畅,而对于多出来部分的内存条容量则是单通道,此时就会在游戏运行过程中有卡顿问题。

实战:对于电脑中的双通道我们也可以在系统里查看,例如下面的两条8GB,分别在0、2号插槽,那么也就是出厂的时候就是配置的双通道。

image-20230531122248263


本节回顾

image-20230531122353861


五、外部存储器

image-20230531213854879

5.1、磁盘存储器

5.1.1、认识磁盘存储器

计组:主要考察硬件特性;操作系统:考察对磁盘的管理,调度算法。

对于主机传来的8bit数据我们需要搞一个电路将其8bit数据搞成串行的方式1bit、1bit的进行写入,读取数据也同样如此。

image-20230531214244201

磁盘读取二进制比特位的原理:磁带划过磁头下方时,磁头就可以1bit、1bit的往里面写数据,每次只能写1bit;读数据同样如此,可以通过读线圈1bit、1bit的读数据。

特性:①磁盘每次读或写都是1bit、1bit进行操作的。②读与写操作是不能够一起进行的。

磁表面存储器的优缺点
image-20230531214309542

认识磁盘存储器

image-20230531214434979


5.1.2、磁盘存储器的组成

①存储区域

image-20230531214609348

磁头:每个盘面都有一个读写磁头(一个磁盘存储器可能有多个盘面)。

磁道:每个盘面一圈一圈的就是磁道,由于磁盘内部有多个盘片,每个盘片划分多个磁道。

柱面:不同盘片相同编号位置磁道构成一个柱面。

扇区:每个盘面可以划分多个扇区

主机每次对磁盘读和写都是以扇区为单位。

②硬盘存储器

需要磁盘驱动器、磁盘控制器(IO控制器)、盘片

image-20230531214658950

可以注意到:对于磁头有上下实际上可以读取上与下的盘片,最顶部与最底部没有。

image-20230531214921394


5.1.3、磁盘的性能指标

①磁盘容量

image-20230531215316390

容量:

  • 非格式化:物理层面上来看,可以存储的bit上限。
  • 格式化容量:磁盘一些扇区会损坏,防止一些扇区的损坏,导致磁盘无法正常工作,因此很多厂商生产的磁盘需要格式化,例如可以留下一些备用的扇区可以顶替使用,若是扇区A损坏就可以用扇区B来进行顶替。

格式化容量比非格式化容量要小。

②记录密度

image-20230531215411471

  • 道密度:指定距离中有多少磁道。60道/cm
  • 位密度:单位磁道上能够记录的二进制代码尾数。600bit/cm
  • 面密度就是前两个乘积。

image-20230531215354775

磁盘上扇区从外到里每一圈存储的bit位数都相同,只是密度不同,越靠内侧密度越低

image-20230531215424263

③平均存取时间

image-20230531215506881

寻道时间+旋转时间+传输时间(让磁头划过整个区域完成读写)

  • 旋转磁盘时间若是题目没给,一般按照半圈来算

整个存取时间过程图示:

image-20230531215558842

磁盘控制器延迟:给磁盘发出读写命令也需要花费一些时间。

④数据传输率

image-20230531215746852


5.1.4、磁盘怎么确定要读取的扇区?认识磁盘地址

根据磁盘地址来进行编号:

image-20230531215907559

  • 驱动器号就是我们系统中的对应磁盘
  • 柱面:磁头选中指定的圈圈位置,进行前后移动
  • 盘面号:之前图示可以看到磁头会有上下,所以的话需要进行选中某个磁头
  • 最后就是指定的扇区位置来进行互动。

5.1.5、磁盘的工作过程

磁盘的工作过程:寻址、读盘、写盘,都是通过控制字来进行发出的。

image-20230531220314638

读取过程需要借助一个串-并变换电路:

image-20230531220334777



5.1.6、认识磁盘阵列RAID0-5(提升系统性能以及磁盘存储的可靠性)

磁盘阵列主要目的:提升系统性能以及磁盘存储的可靠性。

image-20230531220424287

磁盘冗余阵列:将逻辑上相邻的数据实际放置在不同层面中,此时就能够进行并行的访问。

  • 同样也是采用分段的存储在不同字块上的思路。

RAID0:若是有一些扇区坏了的话无法恢复数据。没有容错能力。

image-20230531220515562

image-20230531220809175

可通过软件的处理,将原本逻辑盘连续的磁盘去管理为四个物理盘,此时可以使整个磁盘系统读写速度更快。

出现的问题:

  • 无冗余:没有多余空间存储备份一份数据,若是某个位出现错误,那么就会有永久性丢失。
  • 无校验:若是连续的位上有一位出现错误有问题,无法进行校验。

RAID1:镜像磁盘阵列

方案:可以采用更安全的磁盘阵列。每个物理磁盘上都存放一份数据,此时有冗余但有校验的功能,相对的代价则是存储空间浪费一半。1:1

image-20230531221138857

RAID2:提高磁盘进一步利用率,逻辑上相邻的几个bit分散存储在四个物理磁盘中,同时增加几个磁盘用来保存4bit对应的3bit海明校验码就可以纠正一位错并恢复。4:3

image-202 30531221229889

RAID3-5:其他策略。越往后可靠性越高越安全。

为了增加可靠性与并行访问能力,商用级别经常使用这种磁盘冗余阵列提升磁盘系统性能与可靠性。

小总结如下

image-20230531221417125


总结回顾

image-20230531221511658


5.2、SSD固态硬盘

2023年出现选择题概率十分高。

image-20230611144847762


5.2.1、机械硬盘VS固态硬盘

机械硬盘存储数据都是基于小盘面上的磁性物质来记录二进制0与1;固态硬盘存储介质基于闪存技术(u盘同样也是)。

image-20230611153538957

  • 在固态硬盘中一个个黑色块就是闪存芯片。

5.2.2、固态硬盘的组成

通过IO总线来发送逻辑地址,接着通过闪存翻译层来映射到对应的物理地址,闪存翻译层做的是地址变换的工作。

image-20230611153610464

接着深挖闪存芯片内部的结构,一个闪存芯片由若干个数据块组成,一个块大小在16KB-512KB。

image-20230611153622378

每一个块可以拆解为一个个页,每个页大小为512B-4KB。

image-20230611153632294

注意:系统对于固态硬盘的读写是以页为单位的。每次读/写一个页。

  • 若是对于磁盘,那么一次读写就是对应一个块或者扇区。固态硬盘的一个页相当于磁盘的一个扇区。固态硬盘的一个块相当于一个磁道。而一个磁道包含多个扇区。

5.2.3、读/写特性

image-20230611153946746

针对其中一个特性:固态硬盘会以块的单位擦除,擦干净的块,其中的每页都可以写一次,读无限次。

若是在一个块中先写了几个页,那么再去修改那几个页是不被允许的,除非去把整一块擦除才能够重新写。

若是我只想重写一页呢,难道要把整一块来进行擦除吗?实际上固态硬盘会将指定的除了那一页的其他页写入到其他块中也就是先复制到另一块中,然后将新的一页页写到另一块中,接着将原先的那一块擦除即可。

  • 相对于此时闪存翻译层会重新针对指定的逻辑快号映射新的物理地址也就是新的那块上。

image-20230611154008828

由于这个特性导致固态硬盘读快,写慢


5.2.4、磨损均衡技术

关于机械硬盘与固态硬盘定位的区别:固态硬盘是通过电路迅速定位;机械硬盘则通过移动磁臂旋转。

  • 固态硬盘支持随机访问,访问任何一个地址都是同样时间。而若是对于机械硬盘的物理地址离磁臂比较远,则需要移动和旋转才行。

固态硬盘的缺点:若是频繁的在一个块上进行擦写重写,那么会导致坏掉。

image-20230611154044100

根据这个缺点,就有了解决方案:磨损均衡技术。也就是想办法将擦除平均的分布在各个块上,用于提升使用寿命。针对于读多写少的数据块则可以将其数据迁移到比较老的块上。主要原因是读多写少,那么对于擦除的需求就很少。

  • 会在后台监控每个块读/写多少次,根据实际的需求来进行适当迁移。

扩展:固态硬盘的寿命

image-20230611154109269


五、高速缓冲存储器

大题和小题的高频考点

5.1、Cache的基本概念和原理

5.1.1、存储系统存在的问题

存储系统存在的问题:优化后速度与CPU差距依旧很大,可以增加一个cache层来进行缓和。

image-20230611213931761


5.1.2、Cache的工作原理

cache的工作原理:在一小段时间内,会有同样的一段代码或者数据被频繁的访问与使用,此时我们可以将其读入到cache中。

  • 目前cache是直接集成到CPU内部的,并且使用SRAM实现。由于SRAM集成度低,所以也导致了容量有限。

image-20230611214017038


5.1.3、程序的局部性原理

空间局部性(与目前使用比较靠近的)、时间局部性(最近未来要使用的,很可能是现在要使用的)

  • 程序的局部性原理:使用程序A来进行举例。

举例:例如访问二维数组,若是跳着去访问隔行的空间局部性更差,若是依次是一行中的元素,那么空间局部性更好。

image-20230611214622951


5.1.4、性能分析(平均访问时间计算)

image-20230611214737002

性能分析:H表示CPU访问信息在cache的比率,1-H表示未命中率

平均访问时间

  • 方案1:首先会去找Cache中的,接着会去找主存中的数据。t = Htc + (1 - H)(tc+tm)
  • 方案2:在找Cache的同时去找主存中的数据,此时t=Htc + (1 - H)tm

实际例题

image-20230611214819240


5.1.5、空间局部性原理,如何界定"周围"

image-20230611214922349

由于主存与Cache以"块"为单位进行数据交换,而对于数组a[0][1]我们可以根据地址信息来判断其在哪一个块中,我们可以将这一块的所有信息放入到cache中。

  • cache与主存中都是以块作为单位的,此时对于cache与主存之间进行数据交换就能够十分方便了。
  • 主存的一个块也被称为一个页/页面/页框。Cache中的块也称为行。

image-20230611215055788

此时主存的地址可以分为块号、块内地址。


知识点回顾

image-20230611213820979

下面是接下来章节要学习并解决的问题:

  • cache与主存数据块对应关系:cache与主存的映射方式。
  • cache很小,主存很大,若是cache满了如何解决?采用替换算法。
  • cache修改了cache中的数据副本,如何确保主存中数据母本的一致性。

5.2、Cache与主存的映射算法(三种)

三种映射方式以及认识Cache标记号与有效位

三种映射方式:全相联映射、直接映射、组相联映射

  • 全相联映射:主存块可以放在Cache的任意位置。
  • 直接映射:每个主存块只能放到一个特定的位置。
  • 组相联映射:每个主存块可放到特定分组的任意一个位置。确定分组后,选择空闲的位置存放。

image-20230612185415085

如何区分Cache中存放的是哪个主存块

  • 给每个Cache增加一个"标记",记录对应的主存块号。若是没有存储主存数据的cache块就是用0作为标记。

此时标记号为0也是有一个问题,那就是主存地址是从0开始的,那么此时就会产生冲突!如何解决呢?

  • 设置一个有效位:1表示有存储,0表示无存储。

image-20230612185433318


5.2.1、全相联映射(随意放)

image-20230612185556824

①主存块号与块内地址分布?

给定主存地址总空间256MB,行长为64B

256MB=228B,计算主存块号数即为228B / 26B = 222,即主存块号为22,块内地址为6。

②如何进行划分?

放主存中的第一块时,可以放入到cache中的任意一个块中。放入好之后会记录标记号(主存地址)以及有效位为1(表示已占位置)

③如何访问主存地址呢?

1、首先会使用主存数据的前22个在cache中标记进行匹配对比,若是比对相同,若是有效位为1,即表示cache命中。

2、若是不能够命中,根据有效位=0情况,表示是否可访问,若是为0则直接到主存中去找数据。


5.2.2、直接映射(只能放固定位置)

image-20230612185954693

主存映射cache位置公式:主存块在cache中的位置 = 主存块号 % Cache总块数

存放流程:若是cache有0-7块,主存有0-222-1,按照规则来看,我们依次来放0、7两个主存块:

  • 首先放置主存0块,0 % 7 = 0,此时cache块空闲,直接将主存数据放入到cache的0块中。
  • 接着放置主存7块,7 % 7 = 0,此时cache已被占用,此时同样会进行放入操作,直接覆盖掉之前的主存0块数据。

通过上面流程可以很明显发现一个问题:就是在分配主存的某一个块时,对应的cache位置被占用,而此时又有其他位置空闲,但是这个主存块就是非一个块不可,若是先前被人写了还是会直接上去覆盖掉!

缺点:其他地方有空闲Cache块,但是7号主存块不能够使用,空间利用率不充分。

关于标记存储内容的优化

引出:例如主存的前22个块号是0…01000,通过 % 7此时确定cache的位置为0,此时在cache中标记位即同样为主存的前22个块号0…01000,此时我们可以对这个标记位进行优化。

优化点:我们可以看到我们是%cache的块数,那么最终前22块号的最后3位就是我们的cache编号,此时我们可以省略前22个中最后的3位(也就是cache的块数二进制位数),可以优化为0…01,此时即可完成对应主存位置的标记,此时就只需要19位即可。

image-20230612190051838

块内地址分布

以之前全相联映射的案例为主。

主存块号分为:19位标记+3位行号,块内地址为6块。

直接映射访存流程

①根据主存块号的后3位来确定cache行。

②若主存块号的前19位与Cache标记匹配且有效位=1,则Cache命中,访问001110的单元。

②若是未命中或有效位=0,则正常访问主存。


5.2.3、组相联映射(可放到特定分组)

确定主存数据在cache位置公式所属分组 = 主存块号 % 分组数

  • 块内地址分布:2路组相联映射(2块为一组,分四组),n路就是n块为一组。

主存块号分为:20位标记+2位组号,块内地址为6块。

image-20230612190622841

标记位置优化点:由于分组数为4位,可用两位表示,此时我们可以省略在标号中的末尾两位去表示主存的位置。此时标记位只需要存储20位即可。

image-20230612190709165

组相联映射访存流程

①根据主存块号后2位确定所属分组号。

②若是前20位与分组内的某个标号匹配且有效位为1,此时cache命中。

③若是未命中,则直接访问主存。


知识点回顾

image-20230612185302524


5.3、Cache替换算法(解决Cache满的问题)

5.3.1、针对三种映射方式是否使用替换算法讨论

image-20230613114327404

全相联映射:只有Cache全部满了之后,才需要进行替换。

  • 实现简单,没有考虑到局部性原理,命中率低,实际效果不稳定。

直接映射:无需考虑替换算法,可直接进行替换。

组相联映射:只有指定分组满了才需要进行替换,需要在分组内选择替换哪一块。

总结:全相联、组相联映射需要替换算法。


5.3.2、四种替换算法

5.3.2.1、随机算法

image-20230613114436181

随机算法:若是cache已满,随机选择一块替换。


5.3.2.2、先进先出算法

image-20230613114524999

先进先出算法:若是cache已满,则替换最先被调入cache中的块。

  • 实现简单,最开始按照0、1、2、3放入cache,接着轮流替换0、1、2、3。该算法没有考虑到局部性原理,最先被调用的cache块可能是被频繁访问的。
  • 抖动现象:频繁的换入换出现象。

5.3.2.3、近期最少使用算法(LRU)

image-20230613114639421

近期最少使用算法(LRU):每一个cache块设置计数器,用于记录该cache多久没有被访问了。若是cache满,那么替换计数器中最大的。

  • 当访问一个cache块没有时,从该cache块向前看分别访问了哪几个,找最晚被访问过的来进行替换。

流程

  1. 命中时,所命中的行计数器清零,比其低的计数器加1,其余不变。
  2. 未命中且还有空闲行时,新装入的行的计数器置0,其余非空闲行的计数器置0,其余非空闲行全+1。
  3. 未命中且无空闲行时,计数值最大的行的信息块被淘汰,新装入的块计数器置0,其余全加1。、

计数器优化点:cache块的总数=2n,则计算器只需n位,且Cache装满后所有计数器的值一定不重复。

image-20230613114656354

效果:LRU算法是基于局部性原理的,合理的,实际应用效果优秀。

发生抖动情况:若被频繁访问的主存块数量>Cache行的数量,则会发生抖动。


5.3.2.4、最近不经常使用算法(LFU)

image-20230613114724873

最近不经常使用算法(LFU):每一个cache块也有计数器,用于记录每个cache块被访问过几次,当Cache满后替换"计数器"最小的。

计数规则:新调入的块计数器=0,之后每被访问一次计数器+1,需要替换时,选择计数器最小的一行。

  • 若是有多个计数器最小的行,可按行号递增或FIFO策略进行选择:例如优先选择最上面的行号(最小的行号)。或者按照先进先出的规则

问题:曾经被经常访问的主存块在未来不一定用得到(例如:微信视频聊天相关的块),并没有遵循局部性原理,实际运用效果不如LRU。

  • 举例:若是一段时间频繁使用一段代码,这个代码对应的计数器累加到十分高,而后期使用的特别少,由于该计数器特别高,此时就会长时间的贮存在cache中,而不会替换掉。

知识点总结

image-20230613114800309


5.4、cache写策略(修改cache中数据副本,确保主存中数据母本的一致性)

image-20230613150944669

根据cache是否命中来进行不同的处理。

写命中:全写法、写回法。

写不命中:写分配法、非写分配法。

为什么不讨论读命中、读不命中的情况?

  • 读操作不会导致Cache和主存的数据不一致。

5.4.1、写命中

5.4.1.1、写回法

image-20230613151513572

写回法:当CPU对Cache写命中时,只修改Cache中的内容,而不立即写入主存,只有当此块被换出时才写回主存。

注意:对于指定cache块是否被修改过,我们可以使用一位脏位来表示其状态,1表示修改过,0表示没有被修改过。

好处与坏处:可以减少访存次数,但存在数据不一致的隐患。


5.4.1.2、全写法(或写直通法)

image-20230613151545922

全写法(或写直通法):当CPU对Cache写命中时,必须将数据同时写入到Cache和主存,一般使用写缓存。

好坏处:访存次数增加,速度变慢,但更能保证数据的一致性。

写缓冲:使用SRAM实现的FIFO队列(先进先出),写缓冲比较快。

详细过程:若是CPU命中cache中#2时,先会往cache指定块#2中写入,接着会向写缓冲中写入数据A,此时又命中了cache中的#1,同样会先写入到cache中的#1,接着向写缓冲中写入B。此时队列中顺序为AB,每次两步写完之后CPU就去干其他事情了,此时对于写缓冲中的数据则由专门的控制电路控制下逐一写回。

  • 由于写缓冲是由SRAM实现,CPU直接写入到SRAM中比写入到主存中快得多。

好处坏处:使用写缓冲后,CPU写的速度很快,若是写操作不频繁,则效果很好;若是写操作很频繁,可能会因为写缓冲饱和而发生阻塞。


5.4.2、写不命中

5.4.2.1、写分配法

image-20230613152122021

写分配法:当CPU对Cache写不命中时,把主存中的块调入cache,在cache中修改。通常搭配写回法使用。


5.4.2.2、非写分配法

image-20230613152155153

非写分配法:当CPU对Cache写不命中时只写入主存,不调入Cache,搭配全写法。

注意:只有读操作未命中cache时,才会将主存的这块地址调入cache。


5.4.3、多级cache

image-20230613152344069

最接近CPU的为L1,包含有Write Buffer。

举例:目前有L1、L2两级Cache,L2中保存的是主存中的一小部分数据,而L1中保存的则是L2中的一小部分数据。

对于各级cache中同样也需要保持数据的一致性,各级之间需要采用"全写法"+非写分配法来保持。


六、虚拟存储器

6.1、页式存储器

6.1.1、认识页式存储(引出逻辑地址、物理地址、页表)

cache与主存之间传输以块为单位。

image-20230614164649230

页式存储:一个程序(进程)在逻辑上被分为若干个大小相等的"页面",页的大小实际上是与我们主存块的大小是相同的,我们可以将一个4KB的程序分为4个页,可以将4个页离散的放入到主存中各个不同的位置。

  • 不会直接将整个程序的代码数据连续的放入到内存中。

image-20230614164713410

  • 页号(Page Number)指示要访问哪个虚拟页面,偏移量(Page Offset)则指示要访问页面内的哪个字节。(详细来说:页表中的页内地址存储的是虚拟页面内部的偏移量,CPU 会将该偏移量与页表项中的物理页面的起始地址相加,从而计算出物理地址。)

若是一个程序被拆分为多块后离散存储到主存中,如何执行?引入逻辑地址、物理地址概念。

逻辑地址:程序员看到的视角,逻辑地址分为逻辑页号+页内地址,逻辑页号指的是对应程序分页的页号。此时我们可以将对应的逻辑页号去映射主存中的主存块号(逻辑地址映射物理地址),最终将物理地址+页内地址来进行拼接即可。

  • 对于这种映射关系我们去存储在页表中,在页表中包含逻辑页号以及主存块号。

image-20230614164822340

页表:数据存储在主存当中,CPU在进行地址转换的时候需要去查询页表,意味着CPU需要进行一次访存操作。页表中的一行表示为页表项,一个页表项对应着逻辑页号以及主存块号。


6.1.2、地址变换过程(慢表、快表)

基于慢表的地址变换过程

image-20230614164950407

地址变换过程:页表基址寄存器中存储了页表在主存中的地址

查询主存中的页表(慢表)流程

①首先给出操作码和执行地址(000001 001000000011),拆分得到其中的逻辑地址(001000000011),逻辑地址=逻辑页号+页内地址(001000000011 = 00 + 1000000011)。

②查询主存中的页表,根据其中的逻辑页号来去匹配得到主存的物理地址 00-> 000000000010,将物理地址与页内地址拼接 = 000000000010 1000000011,即可得到物理地址。【查询页表一次访存】

③得到物理地址后我们会再先去cache中去进行查询。

基于快表的地址变换过程

image-20230614165009099

上面写出的地址变换过程可以发现其中去页表里查询00这个逻辑页号时会去主存中找到这一块数据,那么若是之后访问该逻辑地址同样都是00,那么此时就不太高效,如何解决呢?

基于这个问题,我们来引入快表(TLB),再此之前我们存储到主存中的页表在这里可以称为慢表。引入快表之后,整个过程如何?

快表:存放在高速缓冲存储器中,同样包含标记、主存块号两个部分,一开始快表是空的

查询快表流程

①在cache中查询快表指定的逻辑页号,若是有,直接获取到。【访问cache1次】

②若是没有,那么此时执行查询主存中的页表(慢表)的流程。【访存1次】

③查询得到逻辑页号+主存块号后即可存入到快表,可供之后再次使用。


6.1.3、快表与cache,快表与慢表区别

注意快表与cache区别:

  1. 快表中存储的是页表项的副本,Cache中存储的是主存块的副本。
  2. 快表是在地址变换的时候起到加速的作用,cache是在最终得到的地址(物理地址)然后访问这个地址的时候起到加速的作用。

快表、慢表区别:

  1. 快表采用SRAM;慢表采用DRAM。
  2. 电路方面,快表采用"相联存储器",可以按照内容寻址。

快表作用:加快地址变换的速度,减少一次访存。


知识回顾

image-20230614165050609


6.2、虚拟存储器

image-20230614173445392

虚拟存储系统:用户感觉到使用的容量比真实使用的物理容量要大。

例如:微信有1GB的数据,那么实际加载到内存中仅仅只是一部分,我们如何去界定这么一部分的数据呢?


6.2.1、页式虚拟存储器(含存储器的层次化结构)

image-20230614173523066

  • 主存块号、快存块号。
  • 有效位:表示对应的数据是否被调入主存,若是已经调入了则为1,并且物理页或磁盘地址指向了主存。
  • 访问位:主要用于页面替换算法,主要当对应的页表填满了之后需要进行替换才增加的一位。可以记录每个页面实际的访问次数,通过实际的访问次数可以实现相应的LFU(页面替换算法主要解决的是主存与辅存之间的替换)
  • 脏位:若是我们对主存块号中的内容进行修改后,此时我们之后需要将其写回主存,所以我们需要设置一个脏位。

image-20230614173740724

存储器的层次化结构

主存-辅存:主要由操作系统完成。

Cache-主存:主要由硬件自动完成。

image-20230614173838345


6.2.2、段式虚拟存储器

页式、段式存储器的比对

image-20230614173901903

段式存储器:按照功能模块拆分,每一段大小不一样。

虚拟地址结构:段号+段内地址

段表:在原先基础上增加段长,包含段首址、装入位、段长。

  • 段首址(Base Address):指逻辑段在物理内存中的起始地址。段首址与段号(Segment Number)一起共同确定逻辑地址的实际物理地址。
  • 装入位([Virtual] Memory Bound): 是指在逻辑段和逻辑上限之间的一段连续的虚拟地址,并表示逻辑段在内存中的大小,即它所占用的虚拟地址空间的大小。它的计算方式为逻辑首址加上段长减一(在某些系统中也称为段界限)。
  • 段长(Length):一个逻辑段在物理内存中所占的长度,即逻辑段中最后一个单元的地址减去逻辑段的起始地址。段长和装入地址一起确定了逻辑段的虚拟地址范围。

6.2.3、段页式虚拟存储器

段页式虚拟存储器:先将一个程序分段,再进行分页。也就是首先按照功能模块分段,接着将每个容量不相同的段进行分页(每页容量一致)。

image-20230614174153840

段页式虚拟存储将程序内存空间分为多个逻辑段,每个逻辑段又被进一步分为多个大小固定的页。程序访问内存时,首先生成虚地址,它被分成了两个部分:段号和页号。每个部分都表示了不同的含义。

具体来说,虚地址被分解为以下两部分:

  1. 段号(Segment Number):指明所访问的是哪个逻辑段,由段表中的段号进行解释,确定了要访问哪个逻辑段。
  2. 页号及页内偏移量(Page Number and Offset):指明要访问所选定逻辑段中的哪个页以及访问该页中的哪个单元(字节),其中页号与页表相关联,指向所要求的页表项,而页内偏移量则确定了所要访问的特定单元(字节)所在的地址偏移量。

然后,操作系统将逻辑地址转换为物理地址。在分段分页的虚拟存储管理系统中,逻辑地址中的段号和页号将被用于从段表和页表中检索对应的物理地址。最终,通过物理地址来访问实际位于物理内存中的数据。


整理者:长路 时间:2023.5.28-6.14

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/30085.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

专业是要选软工还是人工智能?

大家好&#xff0c;我是帅地。 在帅地的训练营里&#xff0c;也有不少 26 届的学员&#xff0c;不过大一即将过去&#xff0c;部分学校是到了大一后面或者大二才开始细分专业方向的&#xff0c;包括一些想要转专业的同学&#xff0c;也需要选择一个细分的方向&#xff0c;而且…

Python基础知识进阶之数据爬虫

一、爬虫概述 爬虫是指利用网络抓取模块对某个网站或者某个应用中有价值的信息进行提取。还可以模拟用户在浏览器或者APP应用上的操作行为&#xff0c;实现程序自动化。简单来说就是我们把互联网有价值的信息都比喻成大的蜘蛛网&#xff0c;而各个节点就是存放的数据&#xff0…

Vue-Element-Admin项目学习笔记(7)用Node.js写一个简单后端接口

前情回顾&#xff1a; vue-element-admin项目学习笔记&#xff08;1&#xff09;安装、配置、启动项目 vue-element-admin项目学习笔记&#xff08;2&#xff09;main.js 文件分析 vue-element-admin项目学习笔记&#xff08;3&#xff09;路由分析一:静态路由 vue-element-adm…

黑苹果 或者 Mac 因 mds资源占用过高,导致频繁死机

开机后不久&#xff0c;风扇狂转&#xff0c;温度升高&#xff0c;然后死机&#xff0c;关机。 1. 使用 “Apple 诊断”测试 Mac 先看看硬件层面是否有问题。 使用“Apple 诊断”测试 Mac。 这款 Mac 的处理器是 Intel &#xff0c;开启 Mac&#xff0c;然后在 Mac 启动时立…

状态机编程实例-嵌套switch-case法

嵌入式软件开发中&#xff0c;状态机编程是一个比较实用的代码实现方式&#xff0c;特别适用于事件驱动的系统。 本篇&#xff0c;以一个炸弹拆除的小游戏为例&#xff0c;介绍状态机编程的思路。 C/C语言实现状态机编程的方式有很多&#xff0c;本篇先来介绍最简单最容易理解…

KW 新闻 | KaiwuDB 亮相数字中国并发布离散制造场景解决方案

4月26-30日&#xff0c;以“加快数字中国建设&#xff0c;推进中国式现代化”为主题的第六届数字中国建设峰会在福州市圆满召开。KaiwuDB 受邀亮相大会参展并发布“离散制造场景解决方案”&#xff0c;旨在以数字化方案驱动生产方式、治理方式变革&#xff0c;推进离散制造业物…

45道SQL题目陆续更新

文章目录 学习视频配置环境第一天内连接 外连接sql执行顺序 第二天group by 的用法 第三天第四天order bycase when窗口函数 第五天第六天第七天limit第八天 45、查询下月过生日的学生信息 学习视频 学习视频 配置环境 四张表 配置四张表的sql语句 #创建发据库 create dat…

TOGAF10®标准中文版--(阶段A — 架构愿景)方法

3.5.1 概述 阶段 A 从收到发起组织向架构组织发出的架构工作请求开始。 在TOGAF 标准 —EA能力和治理中讨论了确保公司管理层的适当认可和确认&#xff0c;以及直线管理层的支持和承诺所涉及的问题。 A阶段还定义了架构工作的范围内和范围外的内容以及必须处理的约束条件。在…

浅析 xml 数据格式文件

浅析 xml 数据格式文件 xml ( Extensible Markup Language ) 全称 -> 可拓展的标记语言&#xff1b; xml文件的主要用途&#xff1a;xml文件主要用于数据的 传输 和 存储&#xff0c;并不是展示&#xff1b; xml标签与html的区别&#xff1a;节点的标签使用方式和 html 十分…

linuxOPS系统服务_linux高级命令

find命令 find 路径 [选项 选项的值] … 选项作用-name根据文件的名称进行-type按文件类型进行搜索&#xff0c;f代表普通文件&#xff0c;d代表文件夹 find命令查找文件 示例1 查找一个文件 案例1 ,在linux整个系统中查找 test.txt文件 find / -name test.txt -type f案例…

算法刷题-字符串-重复的子字符串

KMP算法还能干这个 459.重复的子字符串 力扣题目链接 给定一个非空的字符串&#xff0c;判断它是否可以由它的一个子串重复多次构成。给定的字符串只含有小写英文字母&#xff0c;并且长度不超过10000。 示例 1: 输入: “abab” 输出: True 解释: 可由子字符串 “ab” 重复两…

Ubuntu下载速度过慢解决

今天用Ubuntu下载Roberta文件到本地&#xff0c;速度特别慢&#xff0c;Ubuntu 系统自带的源文件&#xff0c;都是国外的源网址&#xff0c;在国内下载安装升级源或者依赖的时候&#xff0c;都比较慢&#xff0c;更换国内的源地址&#xff0c;轻松搞定此问题。 目录 一、备份…

ChatGPT的未来发展

文章目录 1.什么是ChatGPT2.ChatGPT的基础技术3.ChatGPT工作原理4.ChatGPT应用场景5.ChatGPT局限性6.ChatGPT的未来发展 ✍创作者&#xff1a;全栈弄潮儿 &#x1f3e1; 个人主页&#xff1a; 全栈弄潮儿的个人主页 &#x1f3d9;️ 个人社区&#xff0c;欢迎你的加入&#xff…

一键部署通义千问预体验丨阿里云云原生 5 月动态

云原生月度动态 云原生是企业数字创新的最短路径。 《阿里云云原生每月动态》&#xff0c;从趋势热点、产品新功能、服务客户、开源与开发者动态等方面&#xff0c;为企业提供数字化的路径与指南。 本栏目每月更新。 01 趋势热点 &#x1f947; Apache RocketMQ 入选可信开…

哨兵3号(Sentinel 3)卫星数据处理

李国春 本文介绍使用RSD处理欧空局哨兵3号&#xff08;Sentinel 3&#xff09;卫星数据的具体方法。 气象数据多用NetCDF格式交换和存储&#xff0c;气象卫星数据也是如此。气象业内认为HDF5也是NetCDF的一部分&#xff0c;虽然文件扩展名使用的是.nc&#xff0c;但是实际上就…

【AntDB数据库】AntDB数据库告警管理

告警历史 功能概述 数据库系统的主机、单节点集群的被监测指标达到告警阀值时&#xff0c;AMOPS就会产生告警并展示在告警分类页面上。 告警分类页面提供告警搜索查看功能&#xff0c;用户可以指定监控项、集群、事件级别、时间范围和告警对象对告警进行搜索。 查询的告警数…

【MySQL数据库基础】

MySQL数据库基础 1. 数据库的操作1.1 显示当前的数据库1.2 创建数据库1.3 使用数据库1.4 删除数据库 2. 常用数据类型2.1整数&#xff08;xxxint&#xff09;2.2日期时间类型2.3字符串型 3. 表的操作3.1 查看表结构3.2 创建表3.3 删除表 1. 数据库的操作 1.1 显示当前的数据库…

React学习之路-目录结构

目录结构 node_modules — 存放项目依赖包 public — 存放网站的静态资源文件 favicon.icon — 网站偏爱图标index.html — 主页面&#xff08;重要&#xff09;logo192.png — logo图logo512 — logo图manifest.json — 应用加壳的配置文件robots.txt — 爬…

Elasticsearch:实用 BM25 - 第 1 部分:分片如何影响 Elasticsearch 中的相关性评分

作者&#xff1a;Shane Connelly 背景 在 Elasticsearch 5.0 中&#xff0c;我们切换到 Okapi BM25 作为我们的默认相似度算法&#xff0c;这是用于对与查询相关的结果进行评分的算法。 在本博客中&#xff0c;我不会过多地介绍 BM25 与替代措施&#xff0c;但如果你想了解 B…

【备战秋招】每日一题:4月23日美团春招第一题:题面+题目思路 + C++/python/js/Go/java带注释

为了更好的阅读体检&#xff0c;为了更好的阅读体检&#xff0c;&#xff0c;可以查看我的算法学习博客第一题-申请奖学金 在线评测链接:P1245 题目内容 塔子哥是一个热爱学习的大学生&#xff0c;他的梦想是成为一名优秀的算法竞赛高手。为了实现自己的梦想&#xff0c;他需…