嵌入式中详解 ARM 几个常见的寄存器方法

大家好,今天来聊聊对于ARM几个特殊寄存器的理解,FP、SP和LR。

1、介绍
  • FP:栈顶指针,指向一个栈帧的顶部,当函数发生跳转时,会记录当时的栈的起始位置。

  • SP:栈指针(也称为栈底指针),指向栈当前的位置,

  • LR:链接寄存器,保存函数返回的地址。

关于gcc就有一个关于stack frame的优化选项,加上该选项则忽略掉FP栈顶指针,(记得高版本默认是不加FP的,gcc4.8以上吧(待确认))

  • -fomit-frame-pointer

Don’t keep the frame pointer in a register for functions that don’t need one. This avoids the instructions to save, set up and restore frame pointers; it also makes an extra register available in many functions. It also makes debugging impossible on some machines.

(大概意思 )不需要栈帧的时候不要加这个编译选项,这可以节省很多指令去保存,传递和恢复,同时也省出一个寄存器可以在函数中做更多事情,也使得在某些机制下更容易去debug

arm cc5编译也有关于FP生成的编译选项,默认是不加的。

  • –use_frame_pointer, --no_use_frame_pointer

Sets the frame pointer to the current stack frame. Using the --use_frame_pointer option reserves a register to store the 「frame pointer」. For newer processors that support Thumb-2 technology (ARMv6T2 and later), the reserved register is always R11. (arm v7)如果是arm v8 -a 系列,则是X29来表示。For older processors that do not support Thumb-2 technology, the reserved register is R11 in ARM code and R7 in Thumb code. Default「The default is --no_use_frame_pointer」. That is, register R11 (or register R7 for Thumb code on older processors) is available for use as a general-purpose registe

2、作用
2.1 FP的作用

关于APCS(ARM Procedure Call Standard,ARM 程序调用标准)的说法 ,

  • 除非子程序没有修改链接寄存器,否则FP都需要记录有效的栈帧位置

  • 其寄存器(r11或者x29)不能被用做一个通用型的寄存器

FP的主要作用就是用来「栈回溯」,找到子程序的调用关系,也成为backtrace,当然一级一级的子程序调用时,FP的记录也在变化,也会一级一级的保存到栈中,最后通过FP的值来反推出一级一级的调用关系。

图片

以ARM CC5 编译器为例,其栈回溯的主要逻辑如下图所示:

图片

通过上图可以看出,main->fun1->fun2,每调用一级的时候,都会将FP、LR以及参数等压栈,而每个FP指向了上一级的栈顶,通过保存关系,可以找到LR,从而找到上一级的调用函数。

具体的流程图就如右图所示,按照这样的方法可以找到backtrace,再比如可以通过stack memory查找调用栈信息,

图片

图片

左图为栈memory 右图为寄存器信息。

上图中:backtrace 第一级是寄存器中的LR,之后就是从栈中进入回溯来找到的。(FP、LR) 1、0x1F7BC 0x40BBAA4 2、0x1F7E4 0x18A3C 3、0x1F7EC 0x18818 4、 0x1F7F4 0x40A4108 5、 0x1F7FC 0x1594 6、 0x184BC 0x40A0015

图中 LR地址都-4 这是因为LR总是保存PC的下一个运行地址,所以找到PC进函数的位置,则需要LR-4可以得到。

图中 最后栈停止回溯,可以看到栈的边界到了0x1f800,所以停止,不然会继续一直进行回溯。

backtrace的C代码如下

void get_backtrace(u32 lr, u32 fP)
{
 u8 backtrace_deep = 0
 u32 stack_limit=getStackLimit()
 u32 stack_base=getStackBase()
 
 printf("Bactrace info:\n")
 do{
  if((fp <= stack_base) &&(fp >= stack_limit))
   break;
  lr = *(u32*)(fp)
  lr (lr == OxFFFFFFFF || lr == 0x0)
   break;
  fp=*(u32*)(fp-sizeof(u32))
  if(backtrace_deep++>MAX_BACKTRACE_DEPTH)
   break;
 }while(1);
 printf("\n");
}
12345678910111213141516171819
2.2 SP的作用

sp 为栈指针,通过push pop 实现对栈存储的访问,栈主要是用来存储局部变量 中间值 等数据,同样和全部变量等存储的区域一样,也是一块memory,没有任何区别,只是使用的方式不一样。

接下来简单介绍一下各个处理器架构的SP指针。

  • CortexM3/4(ARMv7)

  1. CortexM3/4中,「SP分为MSP与PSP」,主栈与线程栈,任何时刻只有一个栈指针有效,通过「CONTROL 寄存器」来选择栈指针。

  2. 程序刚运行时就处在主栈(特权模式),之后可以切到线程栈(非特权模式),之所以设置这样的原因是,一般OS会运行在主栈,而应用程序出在线程栈,应用程序即使出错,也不会影响OS的运行,也不会影响主栈。通过简单的程序无需这样运行,直接在主栈特权模式下面运行就可以。

  3. MSP的初值通过存储器的第一个DWORD中获取。

  4. MSP与PSP 都是32位,低两位均是0.

图片

  • CortexR5(Cortexv7)

  1. Cortex R5系列比较复杂,继承了多种工作模式的特性,大多数模式下都有独立的栈。

    图片

  2. 总共七种工作模式,SYS/FIQ/SYS/SVC/ABORT/IRQ/UND 以及USER,前面六种都是特权模式 后面是用户模式也是非特权模式。可以看到基本都有独立的栈寄存器,意味着每个模式下可以设置独立的栈空间

  3. 图片

图片

  • CortexA53 (ARMv8 -A系列)

  1. 其有变化了 分为EL1 EL2 EL3 EL4四种模式(AArch64状态)。每种模式下有自己的SP指针,SP_EL0,SP_EL1,SP_EL2,SP_EL3。通过SPSel来选择是哪一种的SP指针。

  2. 图片

  3. SP_EL1t 代表SP_EL0的指针,SP_ELxH代表相应等级下的SP指针。

  4. 如果用作基址运算时,SP的低四位[3:0]必须为0,否则会产生SP非对齐异常,系统自动会进行check。

CheckSPAlignment()
 bits(64) sp = SP[];
 if PSTATE.EL == EL0 then
  stack_align_check = (SCTLR[].SA0 != '0');
 else
  stack_align_check = (SCTLR[].SA != '0');
 if stack_align_check && sp != Align(sp, 16) then
  AArch64.SPAlignmentFault();
return;
123456789

由下图可以看到EL3下的SP有值,且与系统的SP值相同(X15下面),则处于EL3模式。

图片

2.3 LR的作用
  1. LR为程序跳转时需要用到的寄存器,用来保存「返回地址」(同时也包含异常返回地址)。

  2. 程序经常会存在调用关系,当程序执行完子程序之后,肯定会返回到主程序,这是返回到主程序的地址就是在LR保存。

  3. 在一些CorteM系列的处理,LR的第0位会置1 表示,表示Thumb状态。

  4. 当然没有LR这个寄存器也可以的,直接将返回地址保存到栈中,最后执行完之后弹出到PC也行,但是寄存器的访问速度可以远高于栈(存储器SRAM),所以LR的作用还是很明显的。

  5. 此外对应ARMv8系列,还有ELR寄存器,对应的是异常状态下的返回地址。

    a. 当程序执行到异常时,异常的返回地址保存到ELR中,当然ARMv8有四种模式,EL0没有异常处理,所以只有三个ELR寄存器,处理三种异常时的返回地址。b. AArch32到AArch64状态时,保存的是32位的地址,高8位均为0。

  6. 图片

2.3.1 LR的地址保存

当假如程序A->B->C,

void A()
{
 ....  //1地址
 B();  //;BL B
 .... //2地址
 return;
}
void B()
{
 .... //3地址
 C(); //BL C
 .... //4地址
 return;  //pop lr->PC
}
void C()
{
 ....
 return; //B LR
}
12345678910111213141516171819
  1. 程序A调用B程序,此时LR更新为「2地址」

  2. 跳转到B程序时,B发现还要跳转到C程序,所以LR会被覆盖,所以在B程序开始的时候,会讲LR保存到栈中。

  3. 挑转到C程序时,此时LR更新到「4地址」

  4. C程序执行开始时,发现没有子程序跳转了,所以此时的LR不会被覆盖,所以也不需要将LR保存,退出时直接跳转到「4地址」即可。

  5. B程序执行完时,发现LR还是错的,会将压栈的LR弹出,这样程序就可以回到「2地址」

  6. 如此一来,程序就完成调用过程,全部执行完毕。

2.3.2 接着来说跳转的指令
  • B

    • 用法:B Lable,直接跳转Lable处的地址,不改变LR,有限范围内的跳转,是不返回的跳转。可以看到上图B跳转的地址 就是在附近,说明可能是跳到后面的程序的指令,不带返回的。

    • 图片

  • BL

    • 用法:BL Lable,将LR=PC+4,(比如在32位程序上+4,Thumb是+2,64位程序上可能是+8)然后跳转到Lable地址,带链接的挑战,说明还会回来的。图中0x8000F300 地址不在该程序范围内,说明是跳到其他地址处 执行完成之后,w0是返回值,然后再跳到此次,是带链接的跳转。

    • 图片

  • BX:

    • 用法:BX Lable,跳转到对应Label地址,Lable中最后一位(bit)为指令集标志,1表示Thumb,0表示ARM状态,可能会进行模式切换,是不返回的跳转。

    • 用法:BX reg,跳转到 reg里面保存的地址,同上,可能会切换模式。该程序直接跳到lr所指示的地址,即返回地址。

    • 图片

  • BLX:

    • 用法:BLX Lable,跳转到对应Label地址,可能会切换模式,同时LR保存了返回的地址。

    • 用法:BLX reg,跳转到 reg里面保存的地址,可能会切换模式,同时LR保存了返回的地址。

  • BR:

    • 用法:BR reg,跳转到 reg里面保存的地址,是不返回的跳转。

  • BLR:

    • 用法:BLR reg,跳转到 reg里面保存的地址,同时LR保存了返回的地址。

  • B.

    • 用法:B.Cond label,根据状态位进行跳转,比如 ZCNV 等状态位,

    • 例如:BHI Lable 、BCS Lable

    • 图片

    • b.cs 如果w8 >= 0x397 则跳到0x800c0988地址处。

    • 图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/384388.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

2本对微服务拆分有帮助的书

迁移到云原生应用架构 可在线观看的免费书籍 https://pivotal.io/platform-as-a-service/migrating-to-cloud-native-application-architectures-ebook 微服务架构设计模式 世界十大架构师之一&#xff1a;克里斯理查森著

161基于matlab的快速谱峭度方法

基于matlab的快速谱峭度方法&#xff0c;选择信号峭度最大的频段进行滤波&#xff0c;对滤波好信号进行包络谱分析。输出快速谱峭度及包络谱结果。程序已调通&#xff0c;可直接运行。 161 信号处理 快速谱峭度 包络谱分析 (xiaohongshu.com)

2024年世界听力日活动的主题是什么?

改变思维模式&#xff1a;让所有人的耳和听力保健成为现实&#xff01; Let’s make ear and hearing care a reality for all! 据 世界卫生组织 报道&#xff1a;在全球范围内&#xff0c;超过 80% 的耳和听力保健需求仍未得到满足 &#xff1b; 未得到解决的听力损失每…

【NodeJS】006- API模块与会话控制介绍d

1.简介 1.1 接口是什么 接口是 前后端通信的桥梁 简单理解&#xff1a;一个接口就是 服务中的一个路由规则 &#xff0c;根据请求响应结果 接口的英文单词是 API (Application Program Interface)&#xff0c;所以有时也称之为 API 接口 这里的接口指的是『数据接口』&#…

视觉slam十四讲学习笔记(三)李群与李代数

1. 理解李群与李代数的概念&#xff0c;掌握 SO(3), SE(3) 与对应李代数的表示方式。 2. 理解 BCH 近似的意义。 3. 学会在李代数上的扰动模型。 4. 使用 Sophus 对李代数进行运算。 目录 前言 一、李群李代数基础 1 群 2 李代数的引出 3 李代数的定义 4 李代数 so(3…

【JVM篇】分析并讲解字节码文件

文章目录 &#x1f354;字节码文件⭐打开字节码文件的工具⭐字节码文件的组成✨具体分析 &#x1f354;字节码文件 字节码文件是一种中间表示形式&#xff0c;它通常由编译器将高级编程语言&#xff08;如Java、Python等&#xff09;源代码编译而成。字节码文件包含了程序的指…

Linux第50步_移植ST公司的linux内核第2步_编译ST公司的linux源码和修改网络驱动

1、修改“linux-5.4.31”目录下的“Makefile” 1)、使用VSCode打开“linux-5.4.31.code-workspace” 2)、点击“linux-5.4.31”目录下的“Makefile” 3)、点击“编辑”&#xff0c;点击“查找”&#xff0c;输入“CROSS_COMPILE回车”&#xff0c;找到“ARCH ? $(SUBARCH)”…

SpringCloud-高级篇(二十二)

前面解决了消息的可靠性、消息的延迟问题&#xff0c;消息的堆积的问题&#xff0c;下面研究mq可用性、并发能力问题&#xff0c;这就需要mq集群来实现了 一&#xff1a;集群分类 &#xff08;1&#xff09;普通集群 创建一个节点&#xff1a; 8082、8083也可以看到这个队列&…

Qt可视化大屏布局

科技大屏现在非常流行&#xff0c;这里分享一下某个项目的大屏布局&#xff08;忘了源码是哪个博主的了&#xff09; 展示 这个界面整体是垂直布局&#xff0c;分为两个部分&#xff0c;标题是一个部分&#xff0c;然后下面的整体是一个layout布局&#xff0c;为另外一部分。 l…

委托和事件详解

委托和事件详解 前言一、委托1.什么是委托2.委托的声明3.Action<T>委托和Func<T>委托4.委托的缺点5.委托与lambda表达式6.委托的使用&#xff08;1&#xff09;模板方法&#xff08;2&#xff09;回调方法 二、事件1.什么是事件2.事件模型的5个步骤和组成部分&…

UE5 播放本地MP3、MP4

1.创建一个媒体播放器 2.如创建视频&#xff0c;勾选。 它会多一个媒体纹理给你 3.1 设置音频 在一个actor上添加“媒体音频组件” “音频媒体播放器”赋值给它 3.2播放音频 添加一个音频媒体播放器变量&#xff0c; 赋值 地址使用绝对地址 4.1设置视频 UI上创建一个imag…

Linux第49步_移植ST公司的linux内核第1步_获取linux源码

已知ST公司的linux源码路径&#xff1a; /home/zgq/linux/atk-mp1/stm32mp1-openstlinux-5.4-dunfell-mp1-20-06-24/sources/arm-ostl-linux-gnueabi/linux-stm32mp-5.4.31-r0 1、创建“my_linux”目录 打开第1个终端 输入“ls回车” 输入“cd linux/回车”&#xff0c;切换…

C语言每日一题(55)另一颗树的子树

力扣 572 另一棵树的子树 题目描述 给你两棵二叉树 root 和 subRoot 。检验 root 中是否包含和 subRoot 具有相同结构和节点值的子树。如果存在&#xff0c;返回 true &#xff1b;否则&#xff0c;返回 false 。 二叉树 tree 的一棵子树包括 tree 的某个节点和这个节点的所…

C#,最大公共子序列(LCS,Longest Common Subsequences)的算法与源代码

1 最大公共子序列 最长的常见子序列问题是寻找两个给定字符串中存在的最长序列。 最大公共子序列算法&#xff0c;常用于犯罪鉴定、亲子鉴定等等的 DNA 比对。 1.1 子序列 让我们考虑一个序列S<s1&#xff0c;s2&#xff0c;s3&#xff0c;s4&#xff0c;…&#xff0c;…

python+django学习交流论坛系统244t6

系统可以提供信息显示和相应服务&#xff0c;其管理员管理用户发布的博客文章以及用户之间的论坛交流信息&#xff0c;管理留言以及文章分类信息。用户在论坛交流模块发布帖子以及评论帖子&#xff0c;在前台查看和评论其他用户发布的博客文章&#xff0c;收藏博客文章&#xf…

给定具体日期 返回给定日期是星期几 calendar.weekday(year,month,day)

【小白从小学Python、C、Java】 【计算机等考500强证书考研】 【Python-数据分析】 给定具体日期 返回给定日期是星期几 calendar.weekday(year,month,day) [太阳]选择题 如果2024年2月12日是星期一&#xff0c;请问最后一个print语句的运行结果是&#xff1f; import calenda…

ubuntu远程桌面配置以及常见问题

ubuntu桌面系统配置 ubuntu远程桌面配置如下 第一步&#xff0c;安装xrdp sudo apt-get isntall xrdp安装完检查一下服务是否可以正常启动&#xff0c; sudo systemctl status xrdp如果看到active应该就正常启动了 第二步&#xff0c;开启Ubuntu桌面共享 好接下来我们测试一…

【玩转408数据结构】线性表——线性表的顺序表示(顺序表)

知识回顾 通过前文&#xff0c;我们了解到线性表是具有相同数据类型的有限个数据元素序列&#xff1b;并且&#xff0c;线性表只是一种逻辑结构&#xff0c;其不同存储形式所展现出的也略有不同&#xff0c;那么今天我们来了解一下线性表的顺序存储——顺序表。 顺序表的定义 …

Linux:信号的处理

文章目录 信号处理 本篇总结的是关于信号的处理 信号处理 在之前有这样的观点&#xff1a;信号在合适的时候被处理好&#xff0c;当进程收到信号后&#xff0c;当前进程可能在做优先级更高的事&#xff0c;所以它来不及处理这个信号&#xff0c;那么就会把这个信号暂时保存起…

Apache 神禹(shenyu)源码阅读(一)——Admin向Gateway的数据同步(Admin端)

源码版本&#xff1a;2.6.1 单机源码启动项目 启动教程&#xff1a;社区新人开发者启动及开发防踩坑指南 源码阅读 前言 开了个新坑&#xff0c;也是第一次阅读大型项目源码&#xff0c;写文章记录。 在写文章前&#xff0c;已经跑了 Divide 插件体验了一下&#xff08;体…