本章重点
一、何为函数栈帧
二、函数栈帧特性 - 同栈 - 后进先出
三、认识内存空间布局图
四、认识相关寄存器
五、认识相关汇编命令
六、测试代码:
七、函数栈帧全过程
要解决的问题
- 局部变量是怎么创建的?
- 为什么局部变量的值是随机值?
- 函数是怎么传参的?传参的顺序是怎么样的?
- 形参和实参是什么关系?
- 函数调用是怎么做的?
- 函数调用结束后怎么返回的?
一、何为函数栈帧
函数栈帧(Function Stack Frame),也被称为调用栈帧(Call Stack Frame),是在计算机程序中用于管理函数调用和执行的一种数据结构。每当函数被调用时,都会创建一个新的函数栈帧,用于存储该函数的局部变量、参数、返回地址和其他执行相关的信息。当函数执行完毕或返回时,相应的函数栈帧将被销毁,控制权回到上一个函数的栈帧中。
二、函数栈帧特性 - 同栈 - 后进先出
函数栈帧的管理遵循一种后进先出(Last-In, First-Out,LIFO)的原则。这意味着最后调用的函数的栈帧会首先被执行,然后在函数返回时销毁,程序控制权回到上一个函数的栈帧中,以此类推,直到回到主程序的栈帧,整个程序执行完毕。
三、认识内存空间布局图
栈(Stack):
- 栈是一种线性数据结构,用于存储函数调用时的局部变量、函数参数以及函数调用的返回地址。
- 栈内存是有限的,以栈帧的方式分配和释放,遵循后进先出(Last-In, First-Out,LIFO)原则。
- 栈内存的生命周期与函数调用关联,当函数返回时,其栈帧上的数据会被销毁。
堆(Heap):
- 堆是一块较大的、动态分配的内存区域,用于存储程序运行时动态分配的数据,如动态分配的对象和数组。
- 堆内存的生命周期不受函数调用的影响,需要手动分配和释放,否则可能导致内存泄漏。
- 在C中,通常使用
malloc()
、calloc()
和realloc()
等函数来分配堆内存,使用free()
来释放堆内存。全局变量区(Global Variables):
- 全局变量区存储程序中的全局变量,这些变量在整个程序的生命周期内都可访问。
- 全局变量在程序启动时被分配,在程序结束时被释放。
常量区(Constants):
- 常量区存储常量数据,如字符串文字和全局常量。
- 这些数据在程序运行期间是只读的。
代码区(Code):
- 代码区存储程序的二进制代码,包括所有函数的机器代码。
- 代码区通常是只读的,不允许修改程序代码。
四、认识相关寄存器
eax:通用寄存器,保留临时数据,常用于返回值
ebx:通用寄存器,保留临时数据
esp:栈顶寄存器
注:ebp和esp主要用于维护当前存在的这个函数栈帧。
问:函数是被调用的,那main函数呢???它是谁调用的???
在VS2013,main函数也是被其他函数调用的,该函数是_tmainCRTStartup,而该函数又是mainCRTStartup函数调用的,而mainCRTStartup函数则是由操作系统调用的。所以从编程者的角度来看,
main
函数似乎是程序的入口点,但实际上,在特定的编程环境中,它是由启动代码调用的。这些启动代码负责设置程序环境并确保main
函数能够正确执行。
五、认识相关汇编命令
- mov:数据转移指令
- push:数据入栈,同时esp栈顶寄存器也要发生改变
- pop:数据弹出至指定位置,同时esp栈顶寄存器也要发生改变
- sub:减法命令
- add:加法命令
- call:函数调用,1. 压入返回地址 2. 转入目标函数
- jump:通过修改eip,转入目标函数,进行调用
- ret:恢复返回地址,压入eip,类似pop eip命令
- lea:将表达式addr的值放入寄存器
六、测试代码:
#include<stdio.h>
int Add(int x, int y)
{
int z = 0;
z = x + y;
return z;
}
int main()
{
int a = 10;
int b = 20;
int c = 0;
c = Add(a, b);
printf("%d\n", c);
return 0;
}
七、函数栈帧全过程
1.ebp寄存器push压栈,同时esp栈顶寄存器地址值改变 - 变小
2.ebp寄存器数据转移到esp寄存器
3.0E4h的十进制是288,sub减法指令,此时开始创建main函数栈帧,main函数此时空间大小就是ebp寄存器-esp寄存器的差 = 0E4h
4.ebx寄存器,esi寄存器和edi寄存器push压栈,同时esp栈顶寄存器地址值改变 - 变小
5. 将表达式ebp-24h的值放入edi寄存器
6.word一个字两个字节,dword表示双字四个字节,刚好表示一个整型变量的大小。move将表达式9移入到ecx寄存器中,代表重复的次数,move将表达式CCCCCCCCh移入eax寄存器中,代表数值。rep stos就是重复执行stos指令,stos指令将eax中的值拷贝到ES:EDI指向的地址,所以这串指令就是在main函数中找到9个连续的4字节空间,将其值设置为CCCCCCCCh。
7.局部变量a,b,c开始创建,并进行初始化
8.函数传参过程,传参过程仍然是在main函数,且传参的过程是从右到左,先传y,后传x。
9.call函数调用,1. 压入返回地址 00682297,方便函数调用后返回到main函数栈帧,2. 转入目标Add函数
10.Add函数栈帧形成,这个过程同mian函数栈帧形成的过程相同,唯一的区别是在Add函数中找到3个连续的4字节空间,将其值设置为CCCCCCCCh。
11.变量z创建,并被初始化为0.
12.将地址为ebp+8放到eax寄存器中,然后在将ebp+14h的值与eax寄存器之前存放的值相加放到eax寄存器中,再将eax寄存器的值放到ebp-8处,也就是z变量地址处。
13.将运算的结果放到寄存器中,由于变量z是局部变量,出了函数作用域就会被销毁,为了能顺利带回返回值,利用寄存器不会被销毁的特点,将运算的结果放到eax寄存器。
14.pop数据弹出至指定位置,同时esp栈顶寄存器也要发生改变,Add函数栈帧被释放。
15.ret是恢复返回地址,找到call指令压入的地址,返回到main函数栈帧。
16.局部变量被销毁,变量c接收返回值
17.后面就是main函数的栈帧销毁过程,同Add函数相同
要解决的问题
- 局部变量是怎么创建的?
在栈帧中,会分配一块内存空间来存储函数的局部变量。这些局部变量是在函数内部定义的,只在函数的生命周期内可见。编译器会根据函数的局部变量声明来确定需要分配多少内存空间。
- 为什么局部变量的值是随机值?
局部变量的值可能会被认为是随机的主要是因为在栈帧创建过程中,这些变量并没有经过显式的初始化。当函数栈帧被分配内存并为局部变量分配空间时,这些变量的内容实际上是未定义的,vs编译器会自动为其初始化为0xcccccc。
- 函数是怎么传参的?传参的顺序是怎么样的?
函数传参的过程,形参的实例化并不在新的函数栈帧内,而是在调用一方函数栈帧内实例化的,当该函数要使用该形参的时候,是通过地址的方法去寻找该形参变量,传参的顺序是从右到左。
- 形参和实参是什么关系?
当调用一个函数时,实参的值被传递给函数的形参。这发生在函数的栈帧创建阶段。形参在函数内部被视为局部变量,并且其值被初始化为相应的实参值。但是实参的地址和形参的地址是不同的,所以形参只是实参的一份临时拷贝,修改形参是不能改变实参的。
- 函数调用是怎么做的?
函数栈帧通过call指令先1. 压入返回地址 ,也就是调用完函数后要执行的下一条指令,然后call通过jump转入目标函数,待函数使用完,ret指令会找到call指令压入的地址值,通过这个值返回到main函数的栈帧,即调用完函数要执行的下一条指令。
- 函数调用结束后怎么返回的?
利用寄存器的值不会随着函数栈帧被销毁而被销毁的特点,利用寄存器将值返回。