读写锁(arm)

 参考文章读写锁 - ARM汇编同步机制实例(四)_汇编 prefetchw-CSDN博客

读写锁允许多个执行流并发访问临界区。但是写访问是独占的。适用于读多写少的场景

另外好像有些还区分了读优先和写优先

读写锁定义

typedef struct {
	arch_rwlock_t raw_lock;
#ifdef CONFIG_GENERIC_LOCKBREAK
	unsigned int break_lock;
#endif
#ifdef CONFIG_DEBUG_SPINLOCK
	unsigned int magic, owner_cpu;
	void *owner;
#endif
#ifdef CONFIG_DEBUG_LOCK_ALLOC
	struct lockdep_map dep_map;
#endif
} rwlock_t;

typedef struct {
	u32 lock;
} arch_rwlock_t;

 可以看到在arm上面读写锁其实就是一个u32的变量。通过这个变量的值能够知道读者和写者的情况。(arm上面有strex指令能够实现独占访问)

读加锁

read_lock->_raw_read_lock->__raw_read_lock->do_raw_read_lock->arch_read_lock

可以看到就是不断的用指令strex去改写这个值,直到修改成功。

读加锁简单的理解就是执行rw->lock++。

static inline void arch_read_lock(arch_rwlock_t *rw)
{
	unsigned long tmp, tmp2;
/* 指令strex https://blog.csdn.net/w906787/article/details/78907067 
   指令条件pl(非负)https://blog.csdn.net/m0_73649248/article/details/132796539
   rsb及常见指令 https://blog.csdn.net/Tong89_xi/article/details/103458289
   wfe https://blog.csdn.net/xy010902100449/article/details/126812552
*/
	prefetchw(&rw->lock);
	__asm__ __volatile__(
"1:	ldrex	%0, [%2]\n"      // ldrex tmp, *(&rw->lock)  获取lock的值并保存在tmp中
"	adds	%0, %0, #1\n"    // adds  tmp, tmp, #1       tmp = tmp + 1 //难道是被当做一个有符号数看的,0x80000000其实是个负数??
"	strexpl	%1, %0, [%2]\n"  // strexpl tmp2, tmp, *(&rw->lock)  rw->lock = tmp, strex能独占访问,赋值成功tmp2会设置为0,反之为1
	WFE("mi")                // wfemi (CPSR NZCV )负数就进入低功耗模式,睡眠//需要特定的事件触发才能被唤醒
"	rsbpls	%0, %1, #0\n"    // rsbpls  tmp, tmp2, #0 tmp = 0 - tmp2 运算结果会影响到cpsr寄存器。如果cpsr中N为1(感觉这里还是adds如果为负数),则执行减法,并且修改cpsr寄存器
"	bmi	1b"                  // bmi  1b  如果strex执行成功 tmp = 0 - tmp2(0) = 0,为0 bmi不执行
	: "=&r" (tmp), "=&r" (tmp2)
	: "r" (&rw->lock)
	: "cc");

	smp_mb();
}

 之前一直不理解adds为什么会出现负数的情况。感觉确实是把相加的结果看做是有符号的,即如果加出来的值,最高位为1,cpsr的n就会被置为1

"	adds	%0, %0, #1\n"    // adds  tmp, tmp, #1       tmp = tmp + 1 //难道是被当做一个有符号数看的,0x80000000其实是个负数??
"	strexpl	%1, %0, [%2]\n"  // strexpl tmp2, tmp, *(&rw->lock)  rw->lock = tmp, strex能独占访问,赋值成功tmp2会设置为0,反之为1

测试样例 

int test_thread(void* a)
{
	printk(KERN_EMERG "\r\n thread start\n");
#ifdef CONFIG_PREEMPT_COUNT
	printk(KERN_EMERG "\r\n CONFIG_PREEMPT_COUNT\n");
#else
	printk(KERN_EMERG "\r\n not define CONFIG_PREEMPT_COUNT\n");
#endif	
	unsigned int cpsr = 0;
	unsigned long tmp = 0;
	unsigned long tmp2 = 0x80000000;
	__asm__ __volatile__(
	"mrs	%0, cpsr\n"        //rw->lock = 0;
	:
	: "r" (cpsr)
	: "cc");
	printk(KERN_EMERG "\r\n cpsr 0x%lx\n", cpsr);

	__asm__ __volatile__(
	"adds	%0, %1, #1\n"
	: "=&r" (tmp)
	: "r" (tmp2)
	: "cc");

	__asm__ __volatile__(
	"mrs	%0, cpsr\n"        //rw->lock = 0;
	:
	: "r" (cpsr)
	: "cc");

	printk(KERN_EMERG "\r\n after cpsr 0x%lx, tmp 0x%lx\n", cpsr, tmp);

	printk(KERN_EMERG "\r\n thread end\n");
	return 0;
}

可以看到经过tmp = tmp2 + 1后cpsr的最高位(N)确实被置为了1 

 

那结合后面写加锁,就能看到,如果有写者加了锁,读者是无法成功加锁的(strexpl 需要tmp非负才执行)。但是如果存在读者的情况下,其他读者继续尝试加锁是可以成功的。这样就运行多个读者进行临界区

 

读解锁

其实就是rw->lock--。最后需要注意的是如果tmp为0,即没有读者的时候,需要唤醒因为获取写锁失败的cpu(dsb_sev)

If the Event Register is not set, WFE(这个并不会让出cpu) suspends execution until 
one ofthe following events occurs:

1、an IRQ interrupt, unless masked by the CPSR I-bit
2、an FIQ interrupt, unless masked by the CPSR F-bit
3、an Imprecise Data abort, unless masked by the CPSR A-bit
4、a Debug Entry request, if Debug is enabled
5、an Event signaled by another processor using the SEV instruction.
————————————————
版权声明:本文为CSDN博主「狂奔的乌龟」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/xy010902100449/article/details/126812552

static inline void arch_read_unlock(arch_rwlock_t *rw)
{
	unsigned long tmp, tmp2;

	smp_mb();

	prefetchw(&rw->lock);
	__asm__ __volatile__(
"1:	ldrex	%0, [%2]\n"      //tmp = rw->lock
"	sub	%0, %0, #1\n"        //tmp = tmp - 1
"	strex	%1, %0, [%2]\n"  //rw->lock = tmp
"	teq	%1, #0\n"            //检查指令是否执行成功
"	bne	1b"
	: "=&r" (tmp), "=&r" (tmp2)
	: "r" (&rw->lock)
	: "cc");

	if (tmp == 0)
		dsb_sev();//唤醒获取锁失败的cpu(wfe需要sev事件唤醒)
}

写加锁

write_lock->_raw_write_lock->__raw_write_lock->do_raw_write_lock

1、感觉这里是写者加锁,需要等待全部读者退出才行 。并且这个时候写者是没有加锁成功的(即lock的值没有成功赋值为0x80000000)。read_lock那里不会出现相加为负数的情况。读者一直能够加锁成功。即只有等到读者全部退出,才能加锁成功。如果在你尝试加锁的时候,后面又来了很多加读锁的情况,你也无法阻止。只能看着读锁加锁成功

2、rw->lock = 0x80000000

static inline void arch_write_lock(arch_rwlock_t *rw)
{
	unsigned long tmp;

	prefetchw(&rw->lock);
	__asm__ __volatile__(
"1:	ldrex	%0, [%1]\n"  //tmp = rw->lock
"	teq	%0, #0\n"        //tmp == 0,需要读者全部退出才行
	WFE("ne")            //不为0休眠,等待特定事件发生后唤醒
"	strexeq	%0, %2, [%1]\n" // rw->lock = 0x80000000
"	teq	%0, #0\n"        // %0保存strex执行结果,0表示成功, 1表示失败
"	bne	1b"              //执行失败,则重复上述流程
	: "=&r" (tmp)
	: "r" (&rw->lock), "r" (0x80000000)
	: "cc");

	smp_mb();
}

写解锁

比较简单就是rw->lock = 0,然后唤醒其他获取锁失败的cpu

static inline void arch_write_unlock(arch_rwlock_t *rw)
{
	smp_mb();

	__asm__ __volatile__(
	"str	%1, [%0]\n"        //rw->lock = 0;
	:
	: "r" (&rw->lock), "r" (0)
	: "cc");

	dsb_sev();//这里估计是唤醒获取锁失败的cpu
}

总结

(1)假设临界区内没有任何的thread,这时候任何read thread或者write thread可以进入,但是只能是其一。

(2)假设临界区内有一个read thread,这时候新来的read thread可以任意进入,但是write thread不可以进入

(3)假设临界区内有一个write thread,这时候任何的read thread或者write thread都不可以进入

(4)假设临界区内有一个或者多个read thread,write thread当然不可以进入临界区,但是该write thread也无法阻止后续read thread的进入,他要一直等到临界区一个read thread也没有的时候,才可以进入,多么可怜的write thread。
————————————————
版权声明:本文为CSDN博主「生活需要深度」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/u012294613/article/details/123905288

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/312270.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Android Firebase (FCM)推送接入

官方文档: 向后台应用发送测试消息 | Firebase Cloud Messaging 1、根级(项目级)Gradlegradle的dependencies中添加: dependencies {...// Add the dependency for the Google services Gradle pluginclasspath com.google.gm…

使用推测解码 (Speculative Decoding) 使 Whisper 实现 2 倍的推理加速

Open AI 推出的 Whisper 是一个通用语音转录模型,在各种基准和音频条件下都取得了非常棒的结果。最新的 large-v3 模型登顶了 OpenASR 排行榜,被评为最佳的开源英语语音转录模型。该模型在 Common Voice 15 数据集的 58 种语言中也展现出了强大的多语言性…

CentOS安装k8s单机/集群及一些命令

目录 前言 1. 安装docker 2. 安装要求 3.准备网络(如果只装单机版可跳过此部) 4. 准备工作 5. 安装 5.1. 配置阿里云yum k8s源 5.2 安装kubeadm、kubectl和kubelet 5.3 初始化,只在master执行,子节点不要执行 5.3.1 一些…

ActiveMQ任意文件写入漏洞(CVE-2016-3088)

简述:ActiveMQ的fileserver支持写入文件(但是不支持解析jsp),同时也支持移动文件。所以我们只需要先上传到服务器,然后再移动到可以解析的地方即可造成任意文件写入漏洞。我们可以利用这个漏洞来上传webshell或者上传定时任务文件。 漏洞复现 启动环境 …

回归预测 | Matlab基于SO-BiLSTM蛇群算法优化双向长短期记忆神经网络的数据多输入单输出回归预测

回归预测 | Matlab基于SO-LSTM蛇群算法优化长短期记忆神经网络的数据多输入单输出回归预测 目录 回归预测 | Matlab基于SO-LSTM蛇群算法优化长短期记忆神经网络的数据多输入单输出回归预测效果一览基本介绍程序设计参考资料 效果一览 基本介绍 1.Matlab基于SO-BiLSTM蛇群算法优…

记录汇川:H5U与Fctory IO测试7

主程序: 子程序: IO映射 子程序: 辅助出料程序 子程序: 辅助上料 子程序: 自动程序 FB块创建: H5U模块添加: Fctory IO配置: HMI配置 实际动作如下: Fctory IO测试7

JDBC

1 连接JDBC jdbc是连接java和数据库的桥梁,对于不同的数据库,如果我们希望用java连接,我们需要下载不同的驱动。这里我们使用mysql数据库,下载驱动。 MySQL :: Download MySQL Connector/J (Archived Versions) (版本…

一卡通水控电控开发踩过的坑

最近在做一个项目,是对接一卡通设备的。我一开始只拿到设备和3个文档开局。不知道从哪下手。一步一步踩坑过来。踩了很多没有必要的坑,写出来给有用的人吧。 读卡器怎么用? 有个读卡器,一开始什么软件也不提供。我都不知道是干嘛…

深信服态势感知一体机SIP-1000 Y2100 3.0.1Y升级3.0.3Y步骤

当前版本:3.0.1Y 升级后版本:3.0.3Y PS:3.0.1Y不能直升3.0.3Y,需要先通过升级工具升级到3.0.2Y,再安装前置补丁从3.0.2Y升级到3.0.3Y;每一次升级时间为20-30分钟,设备升级会重启,需提…

Scrapy框架自学

配置国内镜像源 # pip设置配置 pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple pip config set trusted-host pypi.tuna.tsinghua.edu.cn创建虚拟环境 # 使用conda创建虚拟环境(具体内容请参考课件) conda create -n py_s…

树状结构查询 - 华为OD统一考试

OD统一考试 分值: 200分 题解: Java / Python / C 题目描述 通常使用多行的节点、父节点表示一棵树,比如: 西安 陕西 陕西 中国 江西 中国 中国 亚洲 泰国 亚洲 输入一个节点之后,请打印出来树中他的所有下层节点。 …

Element-ui图片懒加载

核心代码 <el-image src"https://img-blog.csdnimg.cn/direct/2236deb5c315474884599d90a85d761d.png" alt"我是图片" lazy><img slot"error" src"https://img-blog.csdnimg.cn/direct/81bf096a0dff4e5fa58e5f43fd44dcc6.png&quo…

使用paho.mqtt.embedded-c和openssl实现MQTT的单向认证功能

1、背景 由于项目有需求在一个现有的产品上增加MQTT通信的功能&#xff0c;且出于安全考虑&#xff0c;MQTT要走TLS&#xff0c;采用单向认证的方式。 2、方案选择 由于是在现有的产品上新增功能&#xff0c;那么为了减少总的成本&#xff0c;故选择只动应用软件的来实现需求。…

微软Office 2019 批量授权版

软件介绍 微软办公软件套件Microsoft Office 2019 专业增强版2024年1月批量许可版更新推送&#xff01;Office2019正式版2018年10月份推出&#xff0c;主要为多人跨平台办公与团队协作打造。Office2019整合对过去三年在Office365里所有功能&#xff0c;包括对Word、Excel、Pow…

小程序系列--4.协同工作和发布

一、小程序成员管理 1. 成员管理的两个方面 2. 不同项目成员对应的权限 3. 开发者的权限说明 4. 添加项目成员和体验成员 二、小程序的版本 1、小程序的版本 三、发布上线 1. 小程序发布上线的整体步骤 一个小程序的发布上线&#xff0c;一般要经过上传代码 -> 提…

Python: Spire.PDF-for-Python

# encoding: utf-8 # 版权所有 2024 ©涂聚文有限公司 # 许可信息查看&#xff1a; # 描述&#xff1a; # Author : geovindu,Geovin Du 涂聚文. # IDE : PyCharm 2023.1 python 3.11 # Datetime : 2024/1/11 10:32 # User : geovindu # Product : PyChar…

Unity组件开发--长连接webSocket

1.下载安装UnityWebSocket 插件 https://gitee.com/cambright/UnityWebSocket/ 引入unity项目&#xff1a; 2.定义消息体结构&#xff1a;ExternalMessage和包结构Package&#xff1a; using ProtoBuf; using System; using System.Collections; using System.Collections.Ge…

c++全排列

目录 next_permutation()函数 例 perv_permutation()函数 例 next_permutation()函数 next_pernutation()函数用于生成当前序列的下一个排序。它按照字典序对序列进行重新排序&#xff0c;如果存在下一个排列&#xff0c;则将当前序列更改为下一个排列&#xff0c;并返回t…

LeetCode-657/1275/1041

1.机器人能否返回原点&#xff08;657&#xff09; 题目描述&#xff1a; 在二维平面上&#xff0c;有一个机器人从原点 (0, 0) 开始。给出它的移动顺序&#xff0c;判断这个机器人在完成移动后是否在 (0, 0) 处结束。 移动顺序由字符串 moves 表示。字符 move[i] 表示其第 …

达梦数据库的归档模式介绍

几种归档模式 归档是实现数据守护系统的重要技术手段&#xff0c;根据功能与实现方式的不同&#xff0c;DM 数据库的归档可以分为 6 类&#xff1a;本地归档、远程归档、实时归档、即时归档、异步归档和同步归档。 其中&#xff0c;本地归档日志的内容与写入时机与数据库模式…