从硬件角度看Linux的内存管理

1. 分页机制

分段机制的地址映射颗粒度太大,以整个进程地址空间为单位的分配方式导致内存利用率不高。

分页机制把这个分配机制的单位继续细化为固定大小的页(Page),进程的虚拟地址空间也按照页来分割,这样常用的数据和代码就可以以页为单位驻留在内存中。而那些不常用的页可以交换到磁盘,从而节省物理内存,这比分段机制要高效很多。  

进程以页为单位的虚拟内存通过CPU的硬件单元映射到物理内存中,物理内存也是以页为单位来管理,这些物理页称为物理页面(Physical Page)或者页帧(Page Frame)。进程虚拟地址空间的页,我们称为虚拟页(Virtual Page)。操作系统为了管理这些帧需要按照物理地址顺序给每个页编号,叫作页帧号(Page Frame Number, PFN)。

分页机制的实现离不开硬件的实现,在CPU内部专门有一个硬件单元来负责这个虚拟页面到物理页面的转换,它就是一个称为内存管理单元(Memory Mangement Unit, MMU)的硬件单元。ARM处理器的内存管理单元包括TLB(translation lookaside buffer)和页表遍历单元(Table Walk Unit)两个部件。

  • TLB是一块高速缓存(Cache),用于缓存页表转换的结果,从而减少内存访问的时间。

一个完整的页表翻译和查找的过程叫作页表查询(Translation Table Walk),页表查询的过程由硬件自动完成,但是页表的维护需要软件来完成。页表查询是一个相对耗时的事情,理想的状态是TLB里面缓存有页表转换的相关信息。当TLB未命中时,才会去查询页表,并且开始读入页表的内容。ARM内存管理架构如下所示:

2. 页表

ARM32的虚拟地址VA[31:0]可以分成两部分:一部分是虚拟页面内的偏移量,以4KB页为例,VA[11:0]是虚拟页面内的偏移量;另一部分用来确定属于哪个页,我们称其为虚拟页帧号(Virtual Page Frame Number, VPN)。对于物理地址,也是类似的,PA[11:0]表示物理页帧的偏移量,剩余部分表示物理页帧号(Physical Frame Number, PFN) 。MMU的工作内容就是把VPN转换成PFN。处理器通常使用一张表来存储VPN到PFN的映射关系,这个表称为页表(Page Table, PT(进程都有自己独立的页表))。页表中每一个表项称为页表项(Page Table Entry, PTE)。 若将整张页表存放在寄存器中,则会占用很多硬件资源, 因此通常的做法是把页表放在主内存里,通过页表基地址寄存器(Translation Table Base Register, TTBR)来指向这种页表的起始地址。页表查询过程如图所示。处理器发出的地址是虚拟地址,通过MMU来查询页表,处理器得到了物理地址,最后把物理地址发送给内存控制器,从而访问物理页面。

3. 虚拟地址到物理地址的转换

下图展示了ARM32二级页表的查询过程,以4KB页为例,VA[31:20]用作一级页表的索引值,共有12位,最多可以索引4096个页表项;VA[19:12]用作二级页表的索引值,共有8位,最多可以索引256个页表项。当操作系统复制一个新进程时,首先会创建一级页表,分配16KB页面。本场景中,一级页表有4096个页表项,每个页表项占4字节,因此一级页表大小是16KB。当操作系统准备让该进程执行时,设置一级页表在物理内存中的起始地址到页表基地址寄存器中。进程执行过程中需要访问物理内存,因为一级页表的页表项是空的,这会触发缺页异常。在缺页异常里分配一个二级页表,并且把二级页表的起始地址填充到一级页表的相应页表项中。接着,分配一个物理页面,并把这个物理页面的帧号填充到二级页表的对应页表项中,从而完成页表的填充。随着进程的执行,它需要访问越来越多的物理内存,操作系统会逐步地把页表填充和建立起来。

当TLB未命中(Miss)时,处理器查询页表的过程如下图所示:

  • 处理器根据页表基地址控制寄存器TTBCR和虚拟地址来判断使用哪个页表基地址寄存器,是TTBR0和TTBR1。页表基地址寄存器中存放着一级页表的基地址。
  • 处理器根据虚拟地址的bit[31:20]作为索引值,在一级页表中找到页表项。一级页表一共有4096个页表项。
  • 一级页表的页表项中存放有二级页表的物理基地址。处理器将虚拟地址的bir[19:12]作为索引值,在二级页表中找到相应的页表项。二级页表有256个页表项。
  • 二级页表的页表项里面存放有4KB页的物理基地址,因此处理器就完成了页表的查询和翻译工作。

Note:

一级页表相当于把一本书缩小成几页的目录,通过目录来查询书的内容。但是有个问题,如果书非常厚,目录页非常多,那自然而然可以继续分,把一级目录当成一本教材,再建立一个目录,二级页表由此诞生,就是把页表当成教程,再建立页表。  

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/772049.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Angluar 实现pdf页面预览以及编辑

之前用过一个pdf预览的lib,并且还支持在线编辑,和直接下载编辑之后的pdf和直接打印,还不错,记录下 PdfShowcase 首先安装依赖 npm install ngx-extended-pdf-viewer 然后引入 import { NgxExtendedPdfViewerModule } from &q…

论文解读StyleGAN系列——StyleGANv1

论文:A Style-Based Generator Architecture for Generative Adversarial Networks(2018.12) 作者:Tero Karras, Samuli Laine, Timo Aila 链接:https://arxiv.org/abs/1812.04948 代码:https://github.com…

四、(3)补充beautifulsoup、re正则表达式、标签解析

四、(3)补充beautifulsoup、re正则表达式、标签解析 beautifulsoupre正则表达式正则提取标签解析 beautifulsoup 补充关于解析的知识 还需要看爬虫课件 如何定位文本或者标签,是整个爬虫中非常重要的能力 无论find_all(&#xff…

AI一键音频转文字工具 速度超快,支持实时转换,无需联网,本地整合包下载

这是 CapsWriter-Offline ,一个 PC 端的语音输入、字幕转录工具。可用实现简单一键将音频文件转换成文字的懒人工具。 两个功能: 1、实时转换,按下键盘上的 大写锁定键,录音开始,当松开 大写锁定键 时,就会…

企商在线出席2024全球数字经济大会城市副中心论坛

2024年7月3日,2024全球数字经济大会城市副中心论坛“数字基础设施绿色创新发展分论坛”在北京市通州区成功举办。企商在线产品及解决方案总监孙杰受邀出席本次会议,并参与圆桌对话环节,分享“绿色”发展思路与经验。 2024全球数字经济大会城市…

一篇文章说清楚Filter(过滤器)、Interceptor(拦截器)和AOP(切面儿)

文章目录 前言一、Filter(过滤器)1.说明2.实现filterChain.doFilter() 3.order优先级4.解决跨域5.拦截返回错误信息JSON 二、Interceptor(拦截器)1.说明2.实现preHandlepostHandleafterCompletion 3.执行顺序图4.排除特定路径拦截…

@react-google-maps/api实现谷歌地图中添加多边围栏,并可编辑,编辑后可获得围栏各个点的经纬度

先上一张效果图 看看是不是大家想要的效果~ ❤️ 由于该功能微微复杂一点,为了让大家精准了解 我精简了一下地图代码 大家根据自己的需求将center值和paths,用setState做活就可以了 1.第一步要加入项目package.json中或者直接yarn install它…

在Linux上查找文件的2个好用的命令

1. locate xx (查找带xx字符的所有文件或目录) 在终端输入命令 locate lua,可以看到,所有带lua字符的文件或目录都会被搜索出来。 2. find / -name xx (查找名为xx的文件或目录) 在终端输入命令 find …

揭开北斗系统和物联网的神秘面纱:探索未来技术的无限可能性

北斗系统和物联网是现代科技领域的两个重要概念。随着科学技术的快速发展和应用的深化,这两个术语逐渐进入人们的视野。本文将深入探讨北斗系统和物联网的原理、应用和未来发展前景,带您充分了解科技革命的幕后故事。北斗系统:引领全球导航新…

从零开始学习SLAM(三)

旋转向量 #include <Eigen/Geometry> #include <Eigen/Core>AngleAxisd 类有几种构造函数&#xff0c;其中最常用的是&#xff1a; Eigen::AngleAxisd(const Scalar& angle, const Axis& axis);angle 是旋转的角度&#xff0c;通常以弧度表示。axis 是旋…

数据库表导出到excel

数据库表导出到excel:前置知识1 ALL_TAB_COLS 数据库表导出到excel:前置知识2 Quartz基本使用 数据库表导出到excel:前置知识3 项目封装的Quartz实现动态定时任务 数据库表导出到excel:前置知识4 业务和效果 发起清单下载control层InventoryDownloadLogController /* * */ pa…

#### golang中【堆】的使用及底层 ####

声明&#xff0c;本文部分内容摘自&#xff1a; Go: 深入理解堆实现及应用-腾讯云开发者社区-腾讯云 数组实现堆 | WXue 堆&#xff08;Heap&#xff09;是实现优先队列的数据结构&#xff0c;Go提供了接口和方法来操作堆。 应用 package mainimport ("container/heap&q…

LVS-DR群集

LVS-DR集群 LVS-DR(Linux Virtual Server DIrector Server)工作模式&#xff0c;是生产环境中最常用的一种工作模式。 LVS-DR工作原理 LVS-DR模式&#xff0c;Director Server作为群集的访问入口&#xff0c;不作为网关使用&#xff0c;节点DirectorServer与Real Server需要…

光速入门 Tailwind CSS

文章目录 入门安装IDE 设置使用预编译器生产环境优化 基础概念分层指令tailwindlayerapplyconfig 函数theme()screen() 基础案例怎么设置属性任意值&#xff1f;hover 父元素时&#xff0c;怎么选中子元素添加样式&#xff1f;添加 animation 动画 配置主题 Tailwind CSS 中文网…

性能测试-JMeter学习

1、给不同的访问口分配访问占比&#xff1b;例&#xff1a;登录30%&#xff0c;首页&#xff1a;20%&#xff0c;新增&#xff1a;50% 不同业务放到不同线程组里&#xff0c;实现不同业务的分配 使用吞吐量控制器&#xff0c;设置不同的占比 使用if控制器&#xff0c;设置不同…

HX4004A-MFC 低噪声、稳压电荷泵DC/DC转换器芯片IC

一般描述 该HX4004A是一个低噪声开关电容电压倍。它产生一个调节输出电压从2.7V到4.5V的输入。低的外部零件数量(VIN和VOUT处一个飞行电容和两个小型旁路电容)使HX4004A非常适合小型电池供电应用。 该HX4004A具有热关断能力&#xff0c;可以生存从VOUT到GND的连续…

【pytorch13】激活函数及梯度

什么是激活函数 计算机科学家借鉴生物的神经元机制发明了计算机上的模型&#xff0c;这个模型与生物的神经元非常类似 激活的意思就是z变量要大于0&#xff0c;这一个节点才会激活&#xff0c;否则就会处于睡眠状态不会输出电平值 该激活函数在z0处不可导&#xff0c;因此不能…

地级市空气质量指数AQI、环境污染PM2.5、SO2

2015-2021年地级市月度空气质量数据&#xff08;AQI、SO2、NO2、PM2.5、PM10、O3、CO&#xff09; 目录 探究环境污染对经济增长的影响 一、引言 二、数据来源与描述性统计 三、实证模型 &#xff08;一&#xff09;模型设定 &#xff08;二&#xff09;变量说明 四、程…

混元大模型加持,微信输入法开启AI问答新体验

在人工智能技术飞速发展的今天&#xff0c;微信作为全球最大的社交平台之一&#xff0c;一直在不断地探索和创新&#xff0c;以提供更智能、更便捷的用户体验。 最近&#xff0c;微信官方宣布了一个令人兴奋的消息&#xff1a;微信输入法正式上线了“一键AI问答”功能&#xf…

【Python机器学习】算法链与管道——通用的管道接口

Pipeline类补单可以用于预处理和分类&#xff0c;实际上还可以将任意数量的估计器连接在一起。例如&#xff0c;我们可以构建一个包含特征提取、特征选择、缩放和分类的管道&#xff0c;总共有4个步骤。同样的&#xff0c;最后一步可以用聚类或回归代替。 对于管道中估计器的唯…