实时操作系统内存管理-TLSF算法

hhhtsdyzx

内存管理-TLSF算法

  • 前言
    • TLSF算法:
      • 为什么内存又叫内存“块”:
      • O(1)查找空闲块:
        • 确定fl:
        • 确定sl:
        • 提级申请:
        • 分割块:
      • 空闲块如何串成链表?
      • 减少外部碎片:
        • 查找上下块:
      • 合并块:
    • 疑问:

前言

Vue框架:从项目学Vue
OJ算法系列:神机百炼 - 算法详解
Linux操作系统:风后奇门 - linux
C++11:通天箓 - C++11
Python常用模块:通天箓 - Python

TLSF算法:

  • 实时操作系统的内存管理算法
  • TLSF的分配速度快,但是相对内存利用率低,容易出现内部碎片,比较常用于嵌入式场景。

为什么内存又叫内存“块”:

  • 假设我们现在新买了一个16G内存条,在我们没安装到主板前,其实使用内存就不足16G:

    • 初始内存中有两个指针,一个指向首个可用空间首地址,一个指向内存条“末尾”
    • 首个可用空间大小为16G-2*sizeof(pointer),而内存条末位的这个“哨兵块”大小为0
      在这里插入图片描述
  • 由此有了内存“块”称呼来源1:初始内存只有两块,“空闲块”&“哨兵块”

  • 在16G内存中找空闲块指针很简单,直接111…111111,但是找哨兵块指针就需要技巧了

    • 看图中哨兵块指针近邻内存块指针,所以只需要111…111111 - sizeof(pointer)就找到了
    • 这里sizeof(pointer)是指以111…111111作为首地址的单元的size
    • 也就是说我们需要知道当前指针所在“单元”的size,而这个size可不always等于sizeof()的结果,如分配拿到了64字节,但是我们没用完64字节,只存了一个int,此时sizeof()=4
    • 所以除了这两个指针之外,其他内存块都需要一个size字段,表明自己大小
    • 到这,我们可画出内存的物理“块”的结构初稿(哨兵块size不准确):
      size
  • 由此有了内存“块”称呼来源2:每个内存块都有size字段规定本块大小

  • 我们借助一个物理块的size字段可以轻松找到其物理地址的下一块,那么上一块还需要借助其他信息吗?

    • 如果只要求到达上一块,则当前块块首指针-1就到了上一块的最后一个字节
    • 但是要求到达上一块的块首地址,我们还是需要借助指针,这个指针就在上一块的最后sizeof(Pointer)个字节
    • 由此我们可以画出物理空间上的内存块定稿:
      在这里插入图片描述
  • 为了防止用户直接操作物理内存,OS给用户可操控的地址/指针,其实是size邻接的下一地址:
    在这里插入图片描述

  • 当用户用满了这个Busy Block区域,prev_phys_block字段被用作用户数据,就不再指向物理块首地址了,

  • 这个时候我们需要通知下一个物理块,prev_phys_block指针失效

  • 通知的方法很简单,由于每个物理块大小size+sizeof(size字段)都是8Bytes或者4Bytes的倍数,所以每个物理块的size最后两位必定是0。

  • 用size字段第0位标识当前物理块是不是空闲,第1位标识上一物理块是不是空闲。1是空闲,0是被用户使用。这就是为什么要求申请到的内存必须是4或者8的整数倍。

  • 当上一个物理块被malloc()给用户使用,走之前需要把自己的size第0位置为0,把下一个物理块的size第1位置为0

  • 每个物理块在查找上一个物理块块首时,必须先看size第1位是不是1,是1的话pre_phy_block才有效

  • 由此有了内存“块”称呼来源3:每个内存块都要知道上一个块是不是被用户使用

  • 最后,就像我们写链表时候的逻辑地址和物理地址一样,在控制物理块的时候,我们要借助struct做一些逻辑上的改变:

    • 每个物理块开头是size,结尾是pre_phys_blocks
    • 逻辑Block struct在物理块基础上多加了上一块的结尾,prev_phys_blocks,用于找到上一块的struct起始地址
    • struct的起始地址始终在物理块的起始地址前一个指针大小
      在这里插入图片描述
  • 由此有了内存“块”称呼来源4:os通过struct来管理每个内存块

O(1)查找空闲块:

  • 根据牺牲空间才能换取时间的原则,TLSF有着设计优越的管理结构便于查找空闲块

    • 空闲内存(上图size字段)相近的空闲块串成链表,最终有许多条空闲链表
    • blocks[][]:二维数组,一级索引成为fl,二级索引称为sl,每个一级索引fl下都有同样个sl,一般是2^5个,blocks[fl][sl]存储空闲链表头
    • fl_bitmap:位图,为1的位说明blocks[fl]下有空闲链表,0则无。
    • sl_bitmap[]:位图数组,当确定fl后,sl_bitmap[fl]是位图,为1的位说明blocks[fl][sl]下有空闲链表
    • 当blocks[fl][sl]不为None,则sl_bitmap[fl]第sl位必须1,则fl_bitmap第fl位必须1。
    • 位图和blocks[][]必须时刻相符合,不然说明OS已经奔溃,内存条也受伤。
        pub fn init_on_heap(mut tmp : Box<TLSFControl,Global>) -> Box<Self,Global>{
            // TODO: YOUR CODE HERE
            tmp.fl_bitmap = 0;
            tmp.sl_bitmap = [0; FL_INDEX_COUNT];
            for i in 0..FL_INDEX_COUNT {
                for j in 0..SL_INDEX_COUNT {
                    tmp.blocks[i][j] = RawList::new();
                }
            }
            tmp
            // END OF YOUR CODE
        }
    
  • TLSF规定,空闲内存不同块按照下面的原则链接到不同的Blocks[fl][sl]中:

    1. fl = 0层存放空闲内存不超过256Bytes的空闲块

      fl = 0,sl 有32个索引,256 / 32 = 8,则不同空闲范围对应sl如下:

      /*fl = 0
      sl[0]: 0  ~  7
      sl[1]: 8  ~  15
      sl[2]: 16  ~  23
      ...
      sl[30]: 240 ~ 247
      sl[31]: 248 ~ 255
      */
      
    2. fl = 1层存放空闲内存介于256到511Bytes(256和511二进制最高位1占位同)的空闲块

      511 - 256 + 1 = 256,256 / 32 = 8,则不同空闲范围对应sl如下:

      /*fl = 1
      sl[0]: 256  ~  263
      sl[1]: 264  ~  271
      sl[2]: 272  ~  279
      ...
      sl[30]: 596 ~ 403
      sl[31]: 404 ~ 511
      */
      
    3. fl = 2层存放空闲内存介于512到1023Bytes(512和1023二进制最高位1占位同)的空闲块

      1023 - 512 + 1 = 512,512 / 32 = 16,则不同空闲范围对应sl如下:

      /*fl = 2
      sl[0]: 512  ~  527
      sl[1]: 528  ~  543
      sl[2]: 544  ~  559
      ...
      sl[30]: 992 ~ 1007
      sl[31]: 1008 ~ 1023
      */
      
    4. 其余fl层分配相同

确定fl:

  • 提出需求size大小空间,如何确定fl & sl:

    • 首先要对size进行8字节对齐:

          pub fn malloc<T>(&mut self, size: usize) -> *mut T {
              let adjust = if size > 0 {
                  align_up(size, ALIGN_SIZE)
              } else {
                  panic!("size must be greater than 0");
              };
              //size = adjust 或之后直接以adjust传参...
      
  • 当size < 256Bytes时,先到fl = 0查找空闲块。

  • 当size > 256Bytes时,根据公式查找空闲块:[ ]表示向下取整
    f l = [ l o g x s i z e ] fl = [log_{x}^{size}] fl=[logxsize]

  • 上述公式从值相等角度可用取二进制最高位1所在位代替:

    #[inline]
    fn ffs(word: usize) -> u32 {
        (word as u32).trailing_zeros() as u32
    }
    

确定sl:

  • 当size < 256Bytes时,sl = (size - 0) / 8

  • 当size > 256Bytes时,根据公式查找空闲块:SLI就是每个fl对应sl数目取log2
    s l = ( s i z e − 2 f l ) 2 f / 2 S L I sl = \frac{(size - 2^{fl})}{2^{f}/2^{SLI}} sl=2f/2SLI(size2fl)

  • 也就是特殊在size<256时候,2^fl = 2^0 = 1 != 0

提级申请:

  • 若此时申请大小为519的空闲内存:
    1. 519对8向上取整得到520
    2. 520二进制最高位是第9位,因为fl=0对应的256最高位是第8位,所以fl = 9-8+1=2
    3. sl = (520 - 512)/16 = 0
    4. 看上面表:sl[0]: 512 ~ 527,仿佛可用blocks[2][0]
    5. 但是由于不确定blocks[2][0]内空闲大小是512还是527,就有可能容不下520Bytes内容
    6. 确保每次申请的空闲块都能存储下size,我们向空闲更大的blocks发起申请
  • 寻找空闲更大且最靠近size的空闲块:
    1. 从低到高查询sl_bitmap[fl]中第x位,要求x>sl,且x位上是1
    2. 如果在sl_bitmap[fl]中没有查到x,则要到fl_bitmap中查询
    3. 从低到高查询fl_bitmap中第x位,要求x>fl,且x位上是1

分割块:

  • 假设现在内存条1024字节,初始两个指针占用8字节,则可用1008字节

    1008字节分为大小是1008的可用块和大小是0的哨兵块

    现在只申请8字节,根据上面查找fl和sl方法,肯定查到的空闲块是1008

  • 我们不可能把远大于用于申请大小的空闲块直接给用户使用,这样内部碎片很多,所以需要分割块,将一个且不能分割出size是0的块。

  • 给定Block struct A,分割为大小为a的B块 & 和大小不为0的C块:

    1. B块直接改改使用原A的size字段,分割后我们在物理层要为C块增加size,而这个size的开销是8
    2. 要确保A.size > a + 8,由于最小单元8字节,所以等价于A.size >= a + 8 + 8
  • 确定C块size的起始位置:

    • 用户data_ptr + 当前块size = 下一物理块size结尾
    • 下一块size的起始位置 = 结尾 - 8

    在这里插入图片描述

    • 由于用户申请malloc到的内存块要写入用户数据,所以分割得到的C块的prev_phys_blocks失效,要设置C块size第1位为0,防止C块通过混乱的prev_phys_blocks访问其他内存。

    还要设置C块的pre_phys_block,原A块下一块的pre_phys_block

  • 如果在malloc阶段没有和8字节对齐,那么当前块的size最后2位必定失效,引起内存访问混乱。

空闲块如何串成链表?

  • 上面我们分析之后发现size字段和用户使用的busy block已经占据了所有物理块。

    那么链表的next & prev在哪里存储?

  • 空闲块的busy block此时没有写入用户数据,那么我们可将next & prev写入size下面的busy block:

在这里插入图片描述

  • 这样,拿到任意内存块,通过看其size最后两位,我们即确定有无prev & next,又确定可否访问上一物理块

减少外部碎片:

  • malloc的时候,我们分割的目的是减少内部碎片。

    free的时候,我们尝试将物理上当前块和上下块合并为更大的块,目的是减少外部碎片。

查找上下块:

  • 查找上一块:
    1. 先看size第0位是不是1
    2. 再利用prev_phys_block访问上一块的起始地址
  • 查找下一块:
    1. 先向后移动当前块首地址指针,移动size-8个单位
    2. 再利用下一块size第1位判断下一块是不是空闲

合并块:

  • 合并相当于BC块合成A块,A的大小是B.size + C.size + sizeof(size字段)=8

  • 合并之后的A块空闲,除了本身的size最后两位要修改之外

    还有C块下一块的pre_phys_block及其size最后2位

疑问:

  • 开头说TLSF管理器在堆上,堆也在内存里面,为什么init_block()不考虑减去TLSF管理器的开销?
  • 哨兵块的size字段到底占用内存吗?
    我的理解哨兵块极其可能只是一个字节

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/19017.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

OpenGL 4.0的Tessellation Shader(细分曲面着色器)

细分曲面着色器&#xff08;Tessellation Shader&#xff09;处于顶点着色器阶段的下一个阶段&#xff0c;我们可以看以下链接的OpenGL渲染流水线的图&#xff1a;Rendering Pipeline Overview。它是由ATI在2001年率先设计出来的。 目录 细分曲面着色器细分曲面Patch细分曲面控…

Node.js对ES6 及更高版本的支持

目录 1、简介 2、默认情况下什么特性随着 Node.js 一起发布&#xff1f; 3、有哪些特性在开发中&#xff1f; 4、移除这个标记&#xff08;--harmony&#xff09;吗 5、Node.js 对应 V8 引擎 1、简介 Node.js 是针对 V8 引擎构建的。通过与此引擎的最新版本保持同步&…

【HMS Core】Health Kit想要查看数据是来自用户的哪个设备,如何查看?

【问题描述1】 如何查看运动健康数据是来自用户的哪个设备&#xff1f; 【解决方案】 可以通过返回的数据中携带的dataCollectorId来查询提供数据的设备信息&#xff1a; 请求示例&#xff08;以查询睡眠记录详情为例&#xff09;&#xff1a; 1、查询睡眠记录并关联睡眠状…

用友携国资国企走进浙江龙游,共探区县国资智慧监管新样板

近日&#xff0c;由龙游县国有资产经营有限公司指导&#xff0c;用友网络科技股份有限公司&#xff08;以下简称&#xff1a;用友网络&#xff09;主办的“成为数智企业 迈向高质量发展——2023走进龙游数智化观摩研讨会”在浙江龙游成功举办&#xff01;全国近百位国资国企负责…

操作系统学习02

&#xff01;&#xff01;&#xff01;由于感冒和出去玩&#xff0c;好几天没学这些计算机基础知识了&#xff01;&#xff01;&#xff01; 抓紧跟上嘿嘿嘿 1、内存管理主要做了什么 操作系统的内存管理非常重要&#xff0c;主要负责下面这些事情&#xff1a; 内存的分配与…

shell脚本--函数

目录 一&#xff1a;shell函数定义 1.函数的含义 2.函数的优点 3.函数的格式 4.函数返回值 &#xff08;1&#xff09;return输出 &#xff08;2&#xff09;echo输出 二&#xff1a;函数传参 1.情景一 2.情景二 3.情景三 4.情景四 三:递归函数 1.递归函数定义 2.通过…

ASEMI代理ADUM3223ARZ-RL7原装ADI车规级ADUM3223ARZ-RL7

编辑&#xff1a;ll ASEMI代理ADUM3223ARZ-RL7原装ADI车规级ADUM3223ARZ-RL7 型号&#xff1a;ADUM3223ARZ-RL7 品牌&#xff1a;ADI /亚德诺 封装&#xff1a;SOIC-16 批号&#xff1a;2023 安装类型&#xff1a;表面贴装型 引脚数量&#xff1a;16 工作温度:-40C~125…

利用MQ事务消息实现分布式事务

MQ事务消息使用场景 消息队列中的“事务”&#xff0c;主要解决的是消息生产者和消息消费者的数据一致性问题。 拿我们熟悉的电商来举个例子。一般来说&#xff0c;用户在电商 APP 上购物时&#xff0c;先把商品加到购物车里&#xff0c;然后几件商品一起下单&#xff0c;最后…

2路 QSFP,40G 光纤的数据实时采集(5GByte/s 带宽)板卡设计原理图 -PCIE732

板卡概述 PCIE732 是一款基于 PCIE 总线架构的高性能数据传输卡&#xff0c;板卡具有 1 个 PCIex8 主机接口、2 个 QSFP40G 光纤接口&#xff0c;可以实现 2 路 QSFP 40G 光纤的数据实时采集、传输。板卡采用 Xilinx 的高性 能 Kintex UltraScale 系列 FPGA 作为实时处理器…

qiankun 微前端 demo(Vue2)

前言 这是我最近刚开始学微前端&#xff08;qiankun框架&#xff09;做的一个小demo&#xff0c;做的时候还是遇到很多问题的&#xff0c;在网上也是看了很多别人的Blog&#xff0c;最后也是磨出来了&#x1f602;&#x1f602;&#x1f602;&#xff1b;这篇文章总统分为分为…

windows 编译 opencv

编译需要的基础工具 #cmake是配置构建工具&#xff0c;mingw是编译工具 cmake CMake是一款跨平台的编译管理工具&#xff0c;可以自动生成各种不同编译环境&#xff08;如Makefile、Visual Studio Solution等&#xff09;&#xff0c;从而实现在不同平台上进行代码编译的目的…

Qwik 1.0 发布,全栈式 Web 框架

Qwik 是一个全栈式 Web 框架&#xff0c;Qwik 基于 React、Angular 和 Vue 等其他 Web 框架的概念&#xff0c;但以 JavaScript 流等更新的方法脱颖而出&#xff0c;允许以高性能向用户交付复杂的 Web 应用程序。 随着 Web 应用程序变得越来越大&#xff0c;它们的启动性能会下…

强烈推荐:一款中文AI问答、创作、绘画工具

前言 相信很多人已经听过ChatGPT这款人工智能机器人了&#xff0c;它能够根据用户输入的内容&#xff0c;自动生成智能回复。它使用自然语言处理技术&#xff0c;通过学习大量的文本资料&#xff0c;能够模拟人类的对话行为。它是由OpenAI开发的&#xff0c;一家非常伟大的人工…

Http知识

一、http协议 目前存在HTTP1.1&#xff08;当前广泛运用的版本&#xff09;、HTTP2.0和HTTP3.0协议&#xff0c;有以下的优点和缺点 1. HTTP1.1 优点&#xff1a;默认支持长连接&#xff0c;即在一个TCP连接上可以传送多个HTTP请求和响应&#xff0c;减少了建立和关闭连接的…

Flutter框架:从入门到实战,构建跨平台移动应用的全流程解析

第一章&#xff1a;Flutter框架介绍 Flutter框架是由Google推出的一款跨平台移动应用开发框架。相比其他跨平台框架&#xff0c;Flutter具有更高的性能和更好的用户体验。本章将介绍Flutter框架的概念、特点以及与其他跨平台框架的比较&#xff0c;以及Flutter开发环境的搭建和…

应急物流 | 灾后早期阶段多目标选址路径问题的混合元启发式算法

解读作者&#xff1a;李奡&#xff0c;闫同仁 A hybrid meta-heuristic algorithm for the multi-objective location-routing problem in the early post-disaster stage Tongren Yan, Fuqiang Lu, Suxin Wang, Leizhen Wang, Hualing Bi Journal of industrial and managem…

设计原则之【接口隔离原则】,我只做我能做的事

文章目录 一、什么是接口隔离原则二、实例三、总结接口隔离原则与单一职责原则的区别 一、什么是接口隔离原则 接口隔离原则&#xff08;Interface Segregation Principle, ISP&#xff09;是指用多个专门的接口&#xff0c;而不使用单一的总接口&#xff0c;客户端不应该依赖…

【中级软件设计师】—(下午题)试题三精讲总结(四十二)

【中级软件设计师】—&#xff08;下午题&#xff09;试题三精讲总结&#xff08;四十二&#xff09; 一、关系 二、UML中的图 A包含B&#xff0c;那么A执行操作前必须要先执行B 试题一&#xff08;2021年下半年&#xff09; 试题2&#xff08;2021年上半年&#xff09; 官方…

Docker中部署监控

Docker概念 一、部署Prometheus+grafana环境 1.1 、部署Prometheus+grafana环境 docker pull registry.cn-hangzhou.aliyuncs.com/lhrbest/lhrprometheus:1.0 docker tag registry.cn-hangzhou.aliyuncs.com/lhrbest/lhrprometheus:1.0 lhrbest/lhrprometheus:1.01.2 、创建镜…

linux 定时器

Linux 系统实现底半部的机制主要有tasklet&#xff0c;工作队列和软中断。 tasklet 和工作队列都是调度中断底半部的良好机制&#xff0c;tasklet 基于软中断实现。 内核定时器也依靠软中断实现;内核中的延时是忙等待或者睡眠等待&#xff0c;为了充分利用CPU资源&#xff0c…