《深入Linux内核架构》第4章 进程虚拟内存(1)

目录

4.1 简介

4.2 进程虚拟地址空间

4.2.1 进程地址空间分布

4.2.2 建立布局


本专栏文章将有70篇左右,欢迎+关注,订阅后续文章。

第3章讲了两点:物理内存的管理,内核虚拟地址管理。

本章讲:用户进程的虚拟地址空间管理。

4.1 简介

一个进程的整个虚拟地址空间(0-3G)中只有少部分映射到物理页。其余虚拟地址在访问时通过缺页异常处理,分配物理页,并建立页表项。

MMU作用:将虚拟地址转换为物理地址。

        内部包含TLB硬件,用于缓存页表,加快转换速度。

4.2 进程虚拟地址空间

32位系统中,一个进程的虚拟地址空间范围:0 - 4G

TASK_SIZE:

        含义:用户的虚拟地址空间的大小。

        典型值:TASK_SIZE=3G。

PAGE_OFFSET:

        作用:划分内核空间和用户空间。

        典型值:0xC0000000,即3G用户空间,1G内核空间。

无论当前运行哪个进程,进程虚拟地址空间中内核部分的内容都相同。

解释:A/B两个进程的内核空间0xC0001000处会映射到相同物理内存。

        而两个进程的用户空间0xA0001000映射到不同物理内存。

4.2.1 进程地址空间分布

struct mm_struct:管理一个进程的虚拟地址空间。

struct task_struct {

        struct mm_struct         *mm;

}

虚拟内存区域:简称VMA。

一个进程空间有很多VMA,如:

        代码段,数据段,堆,栈,mmap映射区。

内核用struct vm_area_struct表示一个VMA。

struct mm_struct {         //部分成员如下

        ...

        unsigned long (*get_unmapped_area) (struct file *filp, addr, len, pgoff, flags);

                //在进程地址空间中寻找合适的mmap映射位置

        unsigned long         mmap_base;

                //mmap映射的起始位置

        

        unsigned long         task_size;

                //进程的虚拟空间长度

                //current->mm->task_size = TASK_SIZE;

        unsigned long         start_code, end_code, start_data, end_data;

                //代码段和数据段:开始和结束地址。

                //可执行文件映射到地址空间后,这些区域长度不变(只读)。

        unsigned long         start_brk, brk, start_stack;

                //start_brk:堆的起始地址。

                //brk:堆的结束地址。该值可变。(因为堆长度可变)

        unsigned long         arg_start, arg_end, env_start, env_end;

                //参数列表和环境变量。位于栈中最高位置。

        pgd_t *pgd;

                //该进程页全局目录表的起始位置。

};

task_struct中flags成员的PF_RANDOMIZE标志:

        作用:每次启动一个进程时,虚拟地址空间中mmap映射起点和栈起点进行随机偏移。

        好处:防止攻击,防止通过缓冲溢出而获得栈访问权。

        1. mmap映射起点:

                mm->mmap_base = TASK_SIZE/3 + 随机值。

        2. 栈起点:

                mm->start_stack = STACK_STOP - 随机值。

get_unmapped_area函数指针:

        作用:mmap函数以mmap_base为起始地址查找合适映射位置。

        体系架构可各自实现该函数指针。如ARM中arch_get_unmapped_area

宏CONFIG_STACK_GROWSUP:

        作用:可定义栈向上增长(默认向下增长)。

mmap增长方向也可以设置。

如何查找一个进程的虚拟地址address对应的物理地址?

        1. current -> task_struct -> mm_struct

        2. struct vm_area_struct *vma = find_vma(mm, address);

        3. 根据vma的起始地址和address,计算在vma中的偏移量。

                offset = address - vma->vm_start;

        4. 根据mm_struct的pgd成员和address得到PTE。

                三级/四级页表转换。

        5. 计算页帧号。

                pfn = pte_pfn(*pte);

        6. 加上偏移。

                物理地址 = pfn << PAGE_SHIFT | offset;

内核Linux 5.x为增加查找vma的cache hit,缓存了最近访问的vma

struct task_struct {

        struct vmacache         vmacache;

}

struct vmacache {

        struct vm_area_struct *vmas[4];

                //缓存最近访问的四个VMA

};

内核不能显式的将一个变量放入CPU cache。

访问变量后,其被硬件自动放入CPU cache中。

把VMA按访问时间先后顺序放入数组中,所以可得到最近访问的VMA,而该VMA大概率在CPU cache中。

4.2.2 建立布局

exec()调用load_elf_binary():

        作用:装载ELF二进制可执行文件,以创建进程的地址空间。

不同可执行文件有各自实现的struct linux_binfmt,如a.out。

struct linux_binfmt         elf_format = {

        .load_binary         = load_elf_binary,         //加载ELF格式的二进制文件

        .load_shlib           = load_elf_library,         //加载ELF格式的共享库

};

ELF文件启动过程:

        应用层:fork->exec,执行对应do_execve系统调用。

        内核:do_execve->do_execve_common -> search_binary_handler

                遍历所有struct linux_binfmt实例,执行load_binary函数指针,即ELF的load_elf_library。

/proc/sys/kernel/randomize_va_space:

        作用:设置地址空间随机化。默认开启,随机偏移量最大1M

load_elf_binary实现:

load_elf_binary -> setup_new_exec - > arch_pick_mmap_layout

void arch_pick_mmap_layout(struct mm_struct *mm)

{

        if ((current->flags & PF_RANDOMIZE)

                random_factor = (get_random_int() % (1 << 8)) << PAGE_SHIFT;

        mm->mmap_base = TASK_UNMAPPED_BASE + random_factor;

                //设置mmap区域起始位置

        mm->get_unmapped_area = arch_get_unmapped_area;

                //arch_get_unmapped_area为ARM中的实现

        mm->unmap_area = arch_unmap_area;

}

setup_arg_pages:

        设置mm->arg_start。

        设置mm->stack栈起始位置(加上随机偏移)。

get_unmapped_area什么时候调用?

        后续访问地址时,调用mmap来创建不同VMA,此时调用get_unmapped_area为新VMA选择合适位置。

        最终调用mm->get_unmapped_area或file->f_op->get_unmapped_area;

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/602970.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

黄金投资怎么判断走势好坏?

投资黄金&#xff0c;就是押注于这一贵金属价格的变动。判断黄金价格的走势好坏&#xff0c;对于投资者来说至关重要。这需要从宏观经济指标、技术分析指标和市场情绪等多元化角度进行综合分析。 宏观经济指标 货币政策&#xff1a;中央银行的货币政策&#xff0c;尤其是利率决…

必应bing国内广告如何开户,怎么收费?

搜索引擎广告作为直接触达潜在客户的有效途径之一&#xff0c;日益受到企业的重视&#xff0c;必应Bing作为全球第二大搜索引擎&#xff0c;在中国市场同样拥有庞大的用户群体&#xff0c;为企业提供了不可忽视的广告投放平台。 一、必应bing国内广告开户流程 1、需求分析与咨…

国产PLC海为如何与电脑通信

前言 这几天接触到了国产海为PLC&#xff0c;做一个记录&#xff01;学习一下&#xff01; 串口联机 步骤 1&#xff1a;使用 USB 转 485 线连接 A8&#xff08;RS485 通讯口&#xff09;和电脑&#xff1b; 步骤 2&#xff1a;打开 Haiwell happy PLC 编程软件&#xff0c…

vcenter7安装nsx

登录控制台 Get services

视频汇聚边缘网关EasyCVR硬件设备无法访问域名,解析失败该如何处理?

安防视频监控/视频集中存储/云存储/磁盘阵列EasyCVR平台部署轻快&#xff0c;可支持的主流标准协议有国标GB28181、RTSP/Onvif、RTMP等&#xff0c;以及支持厂家私有协议与SDK接入&#xff0c;包括海康Ehome、海大宇等设备的SDK等。视频汇聚融合管理平台EasyCVR既具备传统安防视…

YOLOv9全网最新改进系列:YOLOv9完美融合标准化的注意力模块NAM,高效且轻量级的归一化注意力机制,助力目标检测再上新台阶!

YOLOv9全网最新改进系列&#xff1a;YOLOv9完美融合标准化的注意力模块NAM&#xff0c;高效且轻量级的归一化注意力机制&#xff0c;助力目标检测再上新台阶&#xff01;&#xff01;&#xff01; YOLOv9原文链接戳这里&#xff0c;原文全文翻译请关注B站Ai学术叫叫首er B站全…

细说夜莺监控系统告警自愈机制

虽说监控系统最侧重的功能是指标采集、存储、分析、告警&#xff0c;为了能够快速恢复故障&#xff0c;告警自愈机制也是需要重点投入建设的&#xff0c;所有可以固化为脚本的应急预案都可以使用告警自愈机制来快速驱动。夜莺开源项目从 v7 版本开始内置了告警自愈模块&#xf…

千元投影仪高性价比机型又出新机?大眼橙C1D上市引领市场新潮流

近年来投影仪技术不断更新迭代&#xff0c;家用智能投影仪市场正迎来一场革新风暴。最明显的就是各家品牌都更快地推出自家的投影仪新品&#xff0c;4月底&#xff0c;极米推出了play5&#xff0c;大眼橙推出了c1d&#xff0c;小明推出了newq3pro……都是千元价位的投影仪新品&…

RabbitMQ基础入门

初识MQ 微服务间通讯有同步和异步两种方式&#xff1a; 同步通讯&#xff1a;就像打电话&#xff0c;需要实时响应。 异步通讯&#xff1a;就像发邮件&#xff0c;不需要马上回复。 两种方式各有优劣&#xff0c;打电话可以立即得到响应&#xff0c;但是你却不能跟多个人同…

Linux的目录结构

什么是路径 在Linux系统中&#xff0c;"路径"指的是文件系统中文件或目录的位置。路径可以是绝对的或相对的。 绝对路径&#xff1a;从根目录&#xff08;即 / &#xff09;开始&#xff0c;描述从根目录到目标文件或目录的完整路径。例如&#xff0c;/usr/local/bi…

SWAT模型【建模方法、实例应用、高级进阶技能】实践

第一部分&#xff1a;SWAT模型实践部分 一、SWAT模型及应用介绍 1.1 面源污染概要 1.2 SWAT模型及应用 1.3 SWAT模型原理 1.4 SWAT模型输入文件 1.5 ArcGIS与SWAT关系 二、SWAT模型中GIS必备技术 2.1 GIS软件平台 2.2 ArcGIS10.6安装和注意事项 2.3 ArcGIS入门 2.…

IT外包能在企业上云时提供什么帮助?

在云计算不断发展的背景下&#xff0c;企业对IT部门的要求日益提高&#xff0c;越来越多的企业开始考虑将IT系统迁移到云上。因此&#xff0c;IT外包也成为企业成功上云的重要支持之一。IT外包在企业上云时具体能提供什么帮助&#xff1f;本文将对此进行详细阐述。 业务重心转移…

Linux磁盘逻辑卷LVM丢失

一.原因&#xff1a;服务器异常断电&#xff0c;重启服务器之后&#xff0c;服务所在的磁盘丢失&#xff0c;逻辑卷也不存在。 二.解决方法&#xff1a; 2.1&#xff09;执行以下命令查看lvm配置文件备份内容&#xff1a; more /etc/lvm/backup/datavg01 datavg是之前使…

ubuntu20文件安装和卸载cuda11.6

搜索cuda 11.6 nvidia&#xff0c;进入官网https://developer.nvidia.com/cuda-11-6-0-download-archive 选择linux --> runfile 用安装包安装 wget https://developer.download.nvidia.com/compute/cuda/11.6.0/local_installers/cuda_11.6.0_510.39.01_linux.run sudo s…

【数据分享】2021-2024年我国主要城市逐月轨道交通运营数据

以地铁为代表的轨道交通是大城市居民的主要交通出行方式之一&#xff0c;轨道交通的建设和运营情况也是一个城市发展水平的重要体现。本次我们为大家带来的是2021-2024年我国主要城市的逐月的轨道交通运营数据&#xff01;目前最新数据到2024年2月&#xff0c;数据也会继续更新…

Java类型转换、运算符、流程控制语句你真的懂了吗?

类型转换&#xff1a; 1.数据类型转换之隐式转换&#xff08;表示数据范围从小到大&#xff09; 小的数据类型&#xff0c;和大的数据类型运算&#xff0c;小的会提升为大的之后&#xff0c;再进行运算特殊关注&#xff1a;byte short char 三种数据在运算的时候&#xff0c;不…

OceanBase学习1:分布式数据库与集中式数据库的差异

目录 1. 传统集中式数据库 2. 数据库中间件的分库分表 3. 分布式数据库的基本特点及对比分析 4. OceanBase和传统数据库的对比 5. 小结 1. 传统集中式数据库 优点 成熟稳定:经过近40年的发展&#xff0c;应用到各行各业&#xff0c;产品技术非常成熟稳定行业适配性强:适配…

ElementUI Select选择器多选获取选中对象

html <el-form-item label"账户标签&#xff1a;" prop"tags"><el-selectstyle"width: 500px"value-key"tagId"v-model"form.tags"clearablefilterablemultipleplaceholder"请搜索选择账户标签"><…

电脑连接公司打印机教程

第一步&#xff1a;连接上公司Wifi 第二步&#xff1a;打开设置 第三步&#xff1a;安装打印机驱动程序 3.1 查看打印机型号 打印机上面有个贴纸&#xff0c;上面就写有哦 3.2 进入该网页 打印机驱动,打印机驱动下载 - 打印机驱动网 (dyjqd.com) 下滑点击这里下载&#xff0…

C语言实验-数组、字符串以及指针

一&#xff1a; 求一个NN矩阵主、次对角线上所有元素之和。矩阵输入、矩阵输出、矩阵对角线求和分别用三个子函数实现。&#xff08;N的值由用户从键盘输入&#xff09; #define _CRT_SECURE_NO_WARNINGS #include<stdio.h> #include<stdlib.h>void print(int(*arr…