制作一个RISC-V的操作系统十四-任务同步和锁

文章目录

  • 并发与同步
  • 临界区和锁
  • 死锁
  • 解决死锁
  • 自旋锁(spin lock)
  • 原子性问题
  • 原子操作实现
    • amoswap.w.aq
    • 例子
  • 另一种方法
  • 自旋锁的注意事项
  • 代码
  • 其他同步技术

并发与同步

控制流:可理解为任务或进程

中断也可以理解为一个切换到另一个任务(中断处理程序),于是宏观上认为同时执行了

同步:可以理解要求某个任务的某个操作与某个任务的某个操作的先后顺序有要求
在这里插入图片描述

临界区和锁

在这里插入图片描述
并发执行中,当一个进程访问临界区时,除非访问结束,否则其他进程(即使切换到了该进程)不能进入临界区即阻塞。不然影响该进程对临界区资源的使用。

临界区是指在多线程环境中,同一时刻只允许一个线程访问的一段代码或资源区域。为了确保临界区的安全访问,避免因多个线程同时访问导致的数据不一致或其他竞态条件,我们需要采取同步措施来保护临界区

  • 当线程尝试获取一个已被其他线程持有的可睡眠锁时,如果锁不可用,该线程会被操作系统挂起,并放入等待队列中,从而停止执行(进入睡眠状态)。一旦持有锁的线程释放了锁,操作系统会选择合适的线程将其唤醒并赋予其锁的所有权。这样,线程就可以继续执行被保护的代码段。
  • 不可睡眠锁在尝试获取锁时,如果锁被占用,当前线程并不会被挂起,而是会在原地循环等待(自旋),不断检查锁是否已经释放。这种方式避免了线程上下文切换的开销,但可能会导致线程消耗大量的CPU资源,尤其是当锁被持有时间较长时。
    在这里插入图片描述

上锁导致另一个进程也要上锁时阻塞然后一直循坏,。直到最后解锁

死锁

访问多个临界区可能就需要涉及多个锁

当按照A执行获取A锁,然后B执行获取B锁,A再获取B锁,B再获取A锁
这样将导致阻塞。即再切换到A准备获取B锁,然后再切换到B获取A锁会阻塞。二者都卡住
在这里插入图片描述

解决死锁

除了三点之外还可以实现申请多个锁一次性申请,不中断。可以解决

调整获取锁的顺序,因为上个例子中申请锁的顺序不一致也是导致死锁的原因
防止在持有一把锁再申请其他锁就是尽量保存申请一把锁之前申请的锁都释放掉
在这里插入图片描述

自旋锁(spin lock)

  • 初始话锁
  • 在不同控制流访问临界区的前后执行上锁和解锁
    在这里插入图片描述

原子性问题

中断的级别是针对到汇编指令级别的

也就是说上锁操作可能还没完成就中断然后跳转到另一个控制流导致另一个控制流此时发现锁没有被锁上,导致两个都进入临界区(第一个汇编执行进入了if但没有设置locked导致第二个此时也能进入if并上锁)
在这里插入图片描述

原子操作实现

amoswap.w.aq 将locked值存到寄存器,同时locked的值更新为寄存器的值即为1。不会被打断

这里把值的变化给一气呵成完成了,使得不会出现锁没来得及更新就切换到另一个进程使得其也认为没上锁。(也可以认为让值的更新在判断是否进入临界区之前)

如果不是原子性的,那么假设分为几部分实现更新值和保存原来值的作用,那么可能会得到死锁或者同时进入临界区的结果

发现在只有执行这条指令的执行流会上锁,其他都不会,哪怕是快接触到该指令的执行流
在这里插入图片描述

amoswap.w.aq

在RISC-V架构中,amoswap.w.aq指令是原子内存操作指令之一,主要用于并发环境下的原子读改写内存操作。这个指令的名字来源于几个关键词的组合:

  • amo: AtomiC Memory Operation,原子内存操作,表明这条指令在执行过程中是不可分割的,即使在多线程或多处理器环境下也能确保操作的原子性。
  • swap: 表示该指令执行的是交换操作,即将寄存器中的值与内存位置的内容进行交换。
  • w: 表示操作的数据宽度是32位(word大小)。
  • aq: 是Atomicity Qualifier(原子性限定符)的一部分,RISC-V架构中使用aq和rl两个原子性顺序标签来配合实现内存排序模型。其中,aq(Acquire)确保了指令的执行不会与之前的内存操作重排,并且在指令执行后能够观察到对其他核心的写入操作。

amoswap.w.aq指令的具体功能是这样的:

  • 它同时读取内存位置(通过指定的地址)的原始值,并将寄存器中的值写入该内存位置。
  • 最终,指令会将读取到的原始内存值存储到另一个指定的寄存器中。

这一系列操作作为一个单一的原子步骤完成,这对于维护数据一致性至关重要,特别是在多线程并发访问共享内存区域时。

例如,amoswap.w.aq rs2, rs1, (ra) 指令格式中:

  • rs1 是要写入内存的新值的源寄存器。
  • rs2 是保存内存原值的目标寄存器。
  • ra 是包含要操作的内存地址的寄存器。
  1. aq(Acquire)

    • 当一个带有"aq"标签的指令被执行时,它起到“获取”内存屏障的作用,确保该指令在其之前的内存读写操作都已完成,并且这些操作对于后续的操作(包括本核和其他核)都是可见的。
    • 即,amoswap.w.aq指令不仅本身是原子性的,而且还能保证在执行该指令之后,任何对共享变量的读取操作都能够看到指令之前发生的所有写入操作的效果,有效地阻止了指令重排序。
  2. rl(Release)

    • 相对应的,带有"rl"标签的指令意味着它是一个“释放”内存屏障,确保该指令执行时,它及其之前的所有内存操作全部完成,并且在这条指令之后的写入操作对其他核将是不可见的,直到下一个带有"aq"标签的指令执行。
    • 也就是说,amoswap.w.rl指令在写入共享内存后,其他核心只有在执行了自身的"aq"指令后才能看到这次写入的结果。

例子

假设存在两个核心Core A和Core B,它们共享一块内存区域,并且Core A正在修改某个变量shared_var,而Core B需要读取shared_var的最新值。如果不加控制,可能出现以下情况:

  1. Core A首先修改了shared_var的值,但由于缓存一致性等因素,这个修改还没有刷新到主内存;
  2. Core B此时去读取shared_var,由于没有内存排序保障,可能会读取到旧值而非Core A刚修改的新值。

为了保证Core B能看到Core A的写入操作,我们可以使用带有aq标签的原子指令。例如,在RISC-V架构中,如果我们有一个amoswap.w.aq指令:

amoswap.w.aq t1, t2, (a0)

这条指令会将寄存器t2的值原子性地写入地址a0指向的内存位置,并且返回原来内存位置的值到t1。更重要的是,这里的aq标识确保了在执行此原子操作之前,所有内存操作都已经完成并且对外部核心可见,也就是说Core B在执行amoswap.w.aq指令之前,一定能观察到Core A对该共享内存的先前写入。

另一种方法

上锁可以理解为直接关掉中断,使得只有对应进程上锁后,逻辑就无法被切换,进而一直执行该执行流
在这里插入图片描述

自旋锁的注意事项

上锁需要是原子性操作
不能执行长时间,不然使得其他进程占用CPU大量时间但啥事没做
不能主动放弃CPU不然没有解锁,其他进程永远无法访问临界区
在这里插入图片描述

代码

https://github.com/FULLK/risllkos/tree/main/Fullkenerl9

其他同步技术

在这里插入图片描述
在操作系统和多线程编程中,完成变量(Completion Variable)是一种同步原语,主要用于实现线程或进程间的同步,尤其是在一个任务完成特定工作后通知另一个任务的场景。其核心作用在于简化并发环境下的协作流程。

具体来说,完成变量的主要作用包括:

  1. 任务标记:一个任务在完成某项操作后,它可以设置(或增加计数)一个完成变量,表明某个关键阶段已经结束。

  2. 阻塞与唤醒:其他任务可以在等待这个完成变量,当它们检测到变量被设置或等待计数达到预期值时,会被自动唤醒并恢复执行。这样,一个任务可以在开始执行下一个阶段之前,安全地等待前一个任务完成其工作。

  3. 替代信号量:在某些情况下,完成变量可以作为信号量的轻量级替代品,特别是在只需要一次性通知而不是多次信号控制的情况下。相比于传统的信号量,完成变量通常更易于理解和使用,因为它们直接关联到一个特定的操作完成与否。

例如,在Linux内核中,完成变量 (completion) 是一种内建的数据结构和API,它允许内核线程或其他并发实体之间进行同步。一个典型的使用场景是,当一个内核线程发起I/O操作后,可以挂起自己并在完成变量上等待,直到I/O完成,设备驱动或者其他相关部分会触发这个完成变量以唤醒等待的线程。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/571296.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【Linux网络】DHCP原理与配置

目录 一、DHCP工作原理 1.了解DHCP服务 2.使用DHCP的好处 3.DHCP的分配方式 二、DHCP的租约过程 三、DHCP场景应用实验 一、DHCP工作原理 1.了解DHCP服务 DHCP(Dynamic Host Configuration Protocol,动态主机配置协议) 由Internet工作…

<计算机网络自顶向下> 无连接传输UDP

UDP:User Datagram Protocol “尽力而为”的服务 报文可能丢掉或者乱序好处: 效率高(不建立连接无拥塞控制和流量控制【应用->传输的速率主机->网络的速率】)报文段的头部很小(开销小)UDP被用于 流媒…

数据结构系列-堆排序当中的T-TOK问题

🌈个人主页:羽晨同学 💫个人格言:“成为自己未来的主人~” 之前我们讲到了堆排序的实现逻辑,那么接下来我们重点关注的就是其中的T-TOK问题 T-TOK说简单点,就是说,假如有10000个数据(随机的…

bottle,Python轻量级的Web框架!

目录 前言 安装 特性 基本功能 1. 路由功能 2. 请求参数获取 3. 静态文件服务 4. 模板渲染 高级功能 1. 中间件 2. 插件 3. 异步处理 实际应用场景 1. 小型Web应用 2. RESTful API服务 3. Web界面与后端逻辑分离 4. Web服务的快速原型开发 总结 前言 大家好&#xff0c…

YOLOv9改进策略 | 添加注意力篇 | TripletAttention三重注意力机制(附代码+机制原理+添加教程)

一、本文介绍 本文给大家带来的改进是Triplet Attention三重注意力机制。这个机制,它通过三个不同的视角来分析输入的数据,就好比三个人从不同的角度来观察同一幅画,然后共同决定哪些部分最值得注意。三重注意力机制的主要思想是在网络中引入…

解密数字经济时代,元宇宙企业如何重塑商业价值?

从复盘中感知自我,坚持和过去对话,并引入未来的思考,飞天云动是一个典型的案例。 在科技的飞速发展和数字化浪潮的推动下,元宇宙这一概念如同一颗冉冉升起的新星,吸引了全球的目光。就目前而言,围绕元宇宙…

Ubuntu终端自动补全

文章目录 前言配置安装zsh安装 oh-my-zsh安装自动补全插件zsh-autosuggestions 参考 前言 Oh My Zsh 是一个针对命令行 shell 的开源框架,主要用于增强和美化命令行环境。它建立在 Zsh(一种强大的 shell 替代品)之上,提供了丰富的…

CountDownLatch

什么是CountDownLatch: CountDownLactch是一个同步工具类,用来协调线程之间的同步,其初始值是一个计数器,为线程的数量,当计时器的值为0时,代表此时所有线程的工作全部已经完成 常用方法: 1.cou…

33 信号产生

目录 1.键盘信号 2.显示器回显过程 3.信号产生方式 4.总结 键盘信号 键盘数据是如何输入给内核的,crtlc是怎么变成信号的? 键盘被按下,肯定是os先知道,os怎么知道键盘上有数据呢? c让操作系统每隔一段时间去轮询每…

Linux中Ctrl+C和Ctrl+Z的区别_实战讲解(超详细)

1、CtrlC和CtrlZ的区别: CtrlZ:暂停进程 即挂起进程 暂停当前进程并将其放到后台。可以在后续恢复执行。 暂停的进程仍然占用系统内存 CtrlC:终止进程 终止进程后,程序代码占用的内存会释放掉 2、实战讲解 跑人工智能代码的时候…

10.Java集合汇总

文章目录 1. Java集合概述1.1 Java集合框架概述1.2 Collection接口继承树1.3 Map接口继承树 2. Collection接口2.1 Collection接口方法 3 Iterator迭代器接口3.1 Iterator接口的方法3.2 foreach循环 4 List接口4.1 List接口方法4.1 ArrayList4.2 LinkedList4.3 Vector4.4 面试题…

如何通过大带宽优化美国站群服务器的全球访问速度?

如何通过大带宽优化美国站群服务器的全球访问速度? 在当今全球化的互联网时代,快速和稳定的网站访问对于企业至关重要。美国站群服务器因其地理位置和强大的网络基础设施而备受青睐,但要充分利用其优势,需要综合考虑多种因素。本文将探讨如…

233 基于matlab的多通道非负矩阵分解(MNMF)算法

基于matlab的多通道非负矩阵分解(MNMF)算法。其能够寻找到一个非负矩阵W和一个非负矩阵H,满足条件VW*H,从而将一个非负的矩阵分解为左右两个非负矩阵的乘积。使用EM准则对混合信号进行分解。程序已调通,可直接运行。 233 多通道非…

面试被刷,原因居然是不会Git

大家好,我是知微! 假设你是一个刚入行的菜狗程序员,正在开发一个软件。 现在老板需要你加一些功能,此时的你有一些担忧,如果对代码进行大刀阔斧的改动,最终却失败了。之前能正常运行的代码也被改得乱七八糟…

商汤大模型一体机可节约80%推理成本,完成云端边全栈布局

商汤科技在上海举办技术交流日活动 会上商汤发布业内首个“云、端、边”全栈大模型产品矩阵,并推出全新升级的“日日新SenseNova 5.0”大模型体系。 影响至股价方面,商汤(00020.HK)今日开盘后大幅上涨。随后商汤在港交所公告称,商汤集团的…

《看漫画学C++》背后的故事1:艺术与科技的结合

引言: 在数字化浪潮中,艺术与科技的结合催生了无数创新。《看漫画学C》正是这一跨界合作的产物,它不仅是一本编程书籍,更是艺术与科技融合的典范。 一、相遇: 科技与艺术的火花作为一名专注于技术的软件程序员&…

【JAVA基础之IO】字节流、字符流以及乱码问题

🔥作者主页:小林同学的学习笔录 🔥mysql专栏:小林同学的专栏 目录 1. IO概述 1.1 什么是IO 1.2 IO的分类 1.3 字节和字符流的顶级父类 2. 字节流 2.1 一切皆为字节 2.2 字节输出流【OutputStream】 2.3 FileOutputStream类…

mfc140.dll丢失如何修复,分享多种有效的修复方法

在日常操作和使用电脑的过程中,我们可能会遇到一种较为常见的问题,即在尝试启动或运行某个应用程序时,系统突然弹出一个错误提示窗口,明确指出“mfc140.dll文件丢失”。这个mfc140.dll实际上是一个动态链接库文件(DLL&…

Flask框架初探-如何在本机发布一个web服务并通过requests访问自己发布的服务-简易入门版

Flask框架初探 在接触到网络框架之前我其实一直对一个事情有疑惑,跨语言的API在需要传参的情况下究竟应该如何调用,之前做过的项目里,我用python做了一个代码使用一个算法得到一个结果之后我应该怎么给到做前端的同学或者同事,之前…