Malloc动态内存分配

在C语言中我们会使用malloc来动态地分配内存,这样做的一个主要理由是有些数据结构的大小只有在运行时才能确定。例如,如果你正在编写一个程序,需要用户输入一些数据,但你不知道用户会输入多少数据,那么你就需要使用动态内存分配。而是一种用于动态内存分配的数据结构,当程序员使用 malloc 或其他动态内存分配函数请求内存时,这些函数会从堆中分配内存。堆是由动态内存分配器管理的,分为:

  • 显式分配器:应用程序会分配和释放空间。例如,在C语言中,我们使用 malloc 来分配内存,然后在不再需要的时候使用 free 来释放内存。这种分配器需要程序员明确地管理内存。

  • 隐式分配器:应用程序会分配,但不会释放空间。例如,在Java语言中,我们使用 new 来分配内存,但不需要(也不能)明确地释放内存。Java 有垃圾回收机制(Garbage Collection),它会自动管理和回收不再使用的内存。

说个题外话,其实这里malloc是在虚拟内存空间中的堆区域分配内存,关于虚拟内存后面再写,这里可以就小提一下。

下图是一个简单的动态内存分配的顺序,假设每一个块大小是8 byte,这个分配顺序展示了我们在堆中分配和释放的过程。(图中的alignment意思是例如在64位系统上,必须满足16字节(x86-64)对齐,图中箭头这里如果不空那一小块,开始位置是72,并不是16的倍数,而再+8就是80,满足16字节对齐了。)

一般为了让下一个块可以满足alignment,前一个块都会计算好然后占据合适大小的空间,因此图中的那个白色块应该是属于前一个已分配块的,只不过它没有存任何东西,属于是内部碎片化。这里箭头处画成白色的意思就是它没有存数据,但它是已经被分配了的,下面的内容会再次讲到这一点。

 上面的例子看似很简单,但其实也很低效,因为我们无法控制和预测malloc每次请求的大小,分配器必须在第一时间从现有的free块中找到合适的(包括大小足够、满足alignment条件等),这样就会导致整个堆的利用率不高,比如有很多小的free块(也叫碎片Fragmentation)被分割出来,却没法被使用。提到利用率,一般来说我们使用吞吐量(Throughput)以及利用率(Utilization)来描述动态内存分配器的性能。这两个目标往往是相互冲突的。

  • 吞吐量是每单位时间内完成的请求数量。例如,如果在10秒内完成了5000次 malloc 调用和5000次 free 调用,那么吞吐量就是1000次操作/秒。
  • 利用率是另一个关键的性能目标,它衡量了分配内存(即正在使用的内存)占总内存的比例。

刚刚提到了碎片,碎片化其实就是导致利用率utilization不高的原因,内存碎片化的两种主要形式有内部碎片化外部碎片化。这两种碎片化都会导致内存利用率低下。

  • 内部碎片化(Internal Fragmentation)

    当给定的内存块的有效负载(payload)小于块的大小时,就会发生内部碎片化。这种碎片化发生在内存块的内部。当我们为一个小的内存请求分配一个大块的内存时,分配出的内存块中的剩余部分就会形成内部碎片化。这些未使用的内存位于已分配的内存块内部,因此称为"内部"碎片化。为什么分配的内存大小会比请求的大小大呢?因为许多内存管理系统采用固定大小的块来分配内存。举个例子,假设你有一个内存管理系统,它总是分配4KB的内存块。如果一个程序请求1KB的内存,系统会分配一个4KB的块,但只有1KB被使用,剩下的3KB就成了内部碎片。后面要讲的header和footer其实就会导致内部碎片化。

  • 外部碎片化(External Fragmentation)

    当存在足够的总体堆内存,但没有单个空闲块足够大时,就会发生外部碎片化。这种碎片化发生在内存块的外部。当内存中的空闲空间被分割成小块时,这些小块可能无法满足大的内存请求,即使它们的总和足够大。这些未使用的内存块位于已分配的内存块之间(也就是外部),因此称为"外部"碎片化。当然,如果有一个足够小的内存请求,那么之前形成的外部碎片(也就是一些小的、分散的空闲内存块)也是有可能被利用起来的。

内存管理器都要考虑的基本问题

上面讲了衡量内存管理器效率的指标,除了这些外,内存管理器还有很多最基本的功能和细节要考虑。比如给出一个地址要free掉,怎么知道这个块的大小;在分配和释放的过程中如何跟踪和维护空闲块们;假如有多个合适的空闲块,选择哪一个等。

使用header来存储内存块的大小

要知道各个块的大小,可以为每个分配的块额外使用一个单词word,也叫做header。这个header里存储记录块的大小,以及一些其他信息,比如当前块是否是已分配或者free等。这种方法的优点是简单、易于实现。但是,缺点是因为每个分配的块都包含了一个固定大小的头部,会额外占用空间,导致内部碎片化。

在上图中,每个块大小是8 byte。可以看到虽然我们malloc需要分配32byte,但是由于有一个header以及alignment,实际整个块的大小来到了48 byte。(这里的alignment是为了让下一个块的地址符合要求,要想让每个块都符合16 byte的alignment,只需要让每个块的整体大小都是16的倍数即可。这里需要32+header的8=40 byte,所以需要再补个8来到48才是16的倍数,这就是为什么有那一个大小为8的alignment块。)这里的alignment依然属于内部碎片,因为它属于这个被分配的块。

跟踪空闲块的三种方法(重点)

方法一:隐式空闲列表 Implicit list

隐式空闲链表其实就是把heap分成一个个线性相连的块。上图中灰色部分就是已分配的,白色部分是未分配的。每一个块都有一个header用来存放着个块的大小以及是否被分配。由于我们的块都是align对齐的特性(一般来说是以16 bytes 来align,那么16的倍数,二进制的后四位一定都是0),所以地址的低4位一定是0,我们就可以用低位存储“是否被分配”这一信息。当读取header中的大小时,把低位屏蔽掉就好。

Implicit list 中的 split

当我们准备分配内存空间时,我们只能是从前向后按顺序遍历查找,如果找到了一个空闲块的大小大于我们需要的内存大小,为了避免浪费空间,往往会进行split,比如下面将64 bytes到分割成两个32 bytes大小的块。

Implicit list 中的 coalesce

接着上面的步骤,如果我们马上又把刚刚分配的32 bytes 释放了,那么我们就会有两个连续的32 bytes 大小的free block,这不是我们想得到的,我们还需要把它变成一个大小的64 bytes的块,这种合二为一的过程就是coalesce。

上图就是一个部分正确coalesce的示例,这种情况下,我们free了中间的块,然后因为它后面还跟着一个free块,所以我们可以加上它后面块的大小得到32+16=48。可是,前面还有一个空闲块,我们似乎就没法合并了,因为我们很难知道前面块的大小,无法定位到前面块的header。因此,我们需要引入footer

footer和header的内容完全一样,这样我们通过一个header往前一位,就能得到前面块的footer,从而知道前面块的大小,然后进行相关的coalesce。footer和header一般是必须的,因此上面的这幅图其实才是一个最标准的implicit list。

方法二:显式空闲列表 Explicit list

隐士空闲链表其实就是整个heap,我们要找空闲块还得遍历一些已分配的块,实在是太慢了。显式空闲列表则只管理空闲块,用指针将空闲块们连起来,做成一个双向链表。

我们直接在原来payload的部分放prev和next指针,因为空闲块的payload必然都是空的,所以在它空闲的时候用来存储指针没什么毛病。因此,一个标准的显式空闲列表中,一个free block的最小大小是32 bytes(header+prev+next+footer 各 8 bytes)。

Explicit list 因为只管理空闲块所以效率大大提升了,但是每次分配和释放内存包括coalesce时都要管理好这个双向链表(涉及到链表的插入删除操作等),实现起来是复杂一些,但总体值得!

当然,这里我们使用了两个指针,如果空闲块的最小大小(这个由设计者决定)足够我们在payload里放指针,那么其实对空间没啥影响;但如果payload大小都不够两个指针也就是16 bytes的话,双指针就不能使用了,可以考虑只保留一个指针做单向链表。

上面是explicit list 进行分配的例子,当我们找到一个大小比所分配大小大的块后,能split还是得split,然后插入到列表当中。所以对于我们的双向链表来说,这里实际上是“先删除了一个大的块,然后又插入回了一个小的块”。

方法三:分隔空闲列表 Segregated List (Seglist)

看图你就明白啦,其实就是在 explicit list 基础上,多弄了几个列表,划分依据就是根据大小,这样一来,对于需要分配/释放的块,我们只需要从相关大小的列表里找,再一次加快了搜索的效率。

选择空闲块的四种策略

不管我们使用上面哪种空闲块管理方式,在我们试图搜寻和分配空闲块时,面对多个不同的满足条件的空闲块,总会面临一些通用的选择困境。下面是一些通用的参考思想和选择方案。

  • 首次适应(First Fit)  这个很简单,就从内存的开始处搜索,选择第一个足够大的空闲块进行分配。这种策略的优点是简单且速度较快,但因为太无脑了,可能会在内存的前部产生很多小的碎片。
  • 下一次适应(Next Fit)  类似于首次适应,但是从上次搜索结束的地方开始搜索,而非每次都从头开始。这种策略可以避免重新扫描无用的块,通常会比首次适应稍快。举例来说,假设我们有一个内存块列表,大部分块的大小都接近,只有一小部分块的大小远大于其他块。如果我们有一系列的大请求,那在 Next Fit 中,我们在找到大块并分配之后就可以记住这个位置,那么下一次又有一个大请求时,我们可以直接从这个位置开始扫描,避免了重新扫描前面那些小块。但是这种场景也太苛刻了,你又不知道下一个请求是多大的,所以这个next fit看看了解就好。某些研究表明,使用下一次适应可能会导致更严重的内存碎片化。
  • 最佳适应(Best Fit)  顾名思义,遍历所有的空闲块,然后在所有的空闲块中,选择一个能够满足需求且剩余空间最小的块进行分配。这种策略可以最小化每次分配后的剩余空间,从而减少内存碎片,但是搜索的过程可能会比首次适应和下一次适应更慢。在极端情况下,如果我们在分隔空闲列表 Segregated List (Seglist) 中为每个块都设立一个自己的大小类别,那么这就等同于最佳适应(Best Fit )。因为我们总是能找到和需求完全匹配的块,不会有内存浪费。
  • 更好适应(Better Fit)  "Better Fit"算法是"First Fit"和"Best Fit"的折中方案。在找到第一个足够大的空闲块后,不立即进行分配,而是继续向后搜索一定数量的空闲块。然后从这些块中选择最小的足够大的块进行分配。这种策略旨在在快速分配和减少空间浪费之间找到一种平衡,但可能会略微增加搜索的时间和复杂度。

  选择哪种策略取决于特定应用的需求。例如,如果内存分配请求不频繁,可以选择最佳适应以最小化碎片;如果内存分配请求非常频繁,那么首次适应或下一次适应可能更合适,因为这两种策略的查找速度较快。

小结

以上大概是动态内存分配这块的重点内容,要想更加深入的理解推荐去做大名鼎鼎的 malloc lab,我做到满分还是花了很多时间,要想提高分配器的utilization以及throughput,需要使用segregate list,去掉footer(此时可以用header后面的倒数第二位来存储前一个块的是否被分配信息)以及减少minimum block size(再去掉prev指针)等技巧,还是比较有趣的~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/68163.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

vue3使用pinia和pinia-plugin-persist做持久化存储

1、安装依赖 pnpm i pinia // 安装 pinia pnpm i pinia-plugin-persist // 安装持久化存储插件2、main.js引入 import App from ./App.vue const app createApp(App)//pinia import { createPinia } from pinia import piniaPersist from pinia-plugin-persist //持久化插件 …

Python中enumerate用法详解

目录 1.简介 2.语法 3.参数 4.返回值 5.详解 6.实例 7.补充 1.简介 enumerate() 函数用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列,同时列出数据和数据下标,一般用在 for 循环当中。 2.语法 以下是 enumerate() 方法的语…

Qt应用开发(基础篇)——堆栈窗口 QStackedWidget

一、前言 QStackedWidget继承于QFrame,QFrame继承于QWidget,是Qt常用的堆栈窗口部件。 框架类QFrame介绍 QStackedWidget堆栈窗口,根据下标切换,一次显示一个小部件,常用于应用界面切换、图片轮询播放等场景。 二、QSt…

通义千问开源模型部署使用

首先可以参考modelScope社区给出的使用文档,已经足够全面 通义千问-7B-Chat 但在按照文档中步骤部署时,还是有些错误问题发生,可以搜索参考的解决方式不多,所以记录下来 个人电脑部署 这里不太建议使用自己的笔记本部署通义千…

exchange partition global index

EXCHANGE PARTITION with a Table having a UNIQUE INDEX and PK Constraint. (Doc ID 1620636.1)​编辑To Bottom In this Document Symptoms Changes Cause Solution References APPLIES TO: Oracle Database - Enterprise Edition - Version 11.2.0.3 and later Oracle Da…

Spring整合MyBatis(详细步骤)

Spring与Mybatis的整合&#xff0c;大体需要做两件事&#xff0c; 第一件事是:Spring要管理MyBatis中的SqlSessionFactory 第二件事是:Spring要管理Mapper接口的扫描 具体的步骤为: 步骤1:项目中导入整合需要的jar包 <dependency><!--Spring操作数据库需要该jar包…

gazebo 导入从blender导出的dae等文件

背景&#xff1a; gazebo 模型库里的模型在我需要完成的任务中不够用&#xff0c;还是得从 solidworks、3DMax, blender这种建模软件里面在手动画一些&#xff0c;或者去他们的库里面在挖一挖。 目录 1 blender 1-1 blender 相关links 1-2 install 2 gazebo导入模型 2-1 g…

湘大 XTU OJ 1308 比赛 题解:循环结束的临界点+朴素模拟

一、链接 比赛 二、题目 题目描述 有n个人要进行比赛&#xff0c;比赛规则如下&#xff1a; 假设每轮比赛的人是m&#xff0c;取最大的k&#xff0c;k2^t且k≤m。这k个人每2人举行一场比赛&#xff0c;胜利者进入一下轮&#xff0c;失败者被淘汰。余下的m-k个人&#xff0…

从Spring源码看创建对象的过程

从Spring源码看创建对象的过程 Spring对于程序员set注入的属性叫做属性的填充、对于set注入之后的处理&#xff08;包括BeanPostProcessor的处理、初始化方法的处理&#xff09;叫做初始化。 研读AbstractBeanFactory类中的doGetBean()方法 doGetBean()方法首先完成的工作是…

mysql基础之触发器的简单使用

1.建立学生信息表 -- 触发器 -- 建立学生信息表 create table s1(id int unsigned auto_increment,name varchar(30),score tinyint unsigned,dept varchar(50),primary key(id) );2.建立学生补考信息表 -- 建立学生补考信息表 create table s2 like s1;3.建立触发器&#xf…

Grafana技术文档-概念-《十分钟扫盲》

Grafana官网链接 Grafana: The open observability platform | Grafana Labs 基本概念 Grafana是一个开源的度量分析和可视化套件&#xff0c;常用于对大量数据进行实时分析和可视化。以下是Grafana的基本概念&#xff1a; 数据源&#xff08;Data Source&#xff09;&#…

【大数据】Flink 详解(一):基础篇

Flink 详解&#xff08;一&#xff09;&#xff1a;基础篇 1、什么是 Flink &#xff1f; Flink 是一个以 流 为核心的高可用、高性能的分布式计算引擎。具备 流批一体&#xff0c;高吞吐、低延迟&#xff0c;容错能力&#xff0c;大规模复杂计算等特点&#xff0c;在数据流上提…

模板的进阶

目录 1.非类型模板参数 2.模板特化 2.1概念 2.2函数模板特化 2.3类模板特化 2.3.1全特化 2.3.2偏特化 3.模板分离编译 3.1什么是分离编译 3.2 模板的分离编译 3.3解决方法 4. 模板总结 1.非类型模板参数 模板参数分类类型形参与非类型形参。 类型形参即&#xff1a…

Python(七十五--总结)列表、字典、元组、集合总结

❤️ 专栏简介&#xff1a;本专栏记录了我个人从零开始学习Python编程的过程。在这个专栏中&#xff0c;我将分享我在学习Python的过程中的学习笔记、学习路线以及各个知识点。 ☀️ 专栏适用人群 &#xff1a;本专栏适用于希望学习Python编程的初学者和有一定编程基础的人。无…

关于Object 0 = new Object() 的追魂九连问

文章目录 对象的创建过程对象的组成解析普通对象**结果分析&#xff1a;**给对象添加属性注意事项 补充jvm压缩指针栗子&#xff1a; 对象头包含什么对象怎么定位&#xff1f;**句柄方式和直接引用的优缺点&#xff1a;** 对象怎么分配&#xff1f;为什么hotspot不使用c对象来代…

QT的信号槽的四种写法和五种链接方式

目录 四种信号槽写法&#xff1a; 五种连接方式&#xff1a; 实例&#xff1a; 常见错误及改正&#xff1a; 错误1: 未连接信号与槽 错误2: 信号和槽参数不匹配 错误3: 未使用Q_OBJECT宏 错误4: 跨线程连接未处理 在Qt中&#xff0c;信号&#xff08;Signal&#xff09…

Stephen Wolfram:让 ChatGPT 真正起作用的是什么?

What Really Lets ChatGPT Work? 让 ChatGPT 真正起作用的是什么&#xff1f; Human language—and the processes of thinking involved in generating it—have always seemed to represent a kind of pinnacle of complexity. And indeed it’s seemed somewhat remarkabl…

go-admin 使用开发

在项目中使用redis 作为数据缓存&#xff1a;首先引入该包 “github.com/go-redis/redis/v8” client : redis.NewClient(&redis.Options{Addr: config.QueueConfig.Redis.Addr, // Redis 服务器地址Password: config.QueueConfig.Redis.Password, // Redis 密码&…

Vue自定义指令使用

本篇文章讲述使用Vue自定义指令&#xff0c;并在项目中完成相应功能。 在平常Vue脚手架项目中&#xff0c;使用到 自定义指令较少&#xff0c;一般都是使用的自带指令&#xff0c;比如 v-show 、v-if 、 v-for 、 v-bind 之类的。这些已经能够满足大多数项目使用。更多的可能也…

springboot+mybatis实现简单的增、删、查、改

这篇文章主要针对java初学者&#xff0c;详细介绍怎么创建一个基本的springboot项目来对数据库进行crud操作。 目录 第一步&#xff1a;准备数据库 第二步&#xff1a;创建springboot项目 方法1&#xff1a;通过spring官网的spring initilizer创建springboot项目 方法2&am…