目录
程序的存储
程序的编译过程
各位宝宝好,我们这次从计算机底层来讲一下程序是如何存储,编译的
程序的存储
我们拿一个最简单的程序来举个例子:
#include<stdio.h>
int main()
{
printf("hello world");
return 0;
}
就拿上面的这个代码来说,hello程序的周期是从一个源程序(也叫源文件)开始的,也是我们通过编辑器创建并保存的文本文件,文件名是hello.c。源程序实际上就是一个由0和1组成的位序列,8个比特位为一个字节。每个字节表示程序中的某些文本字符。
而现代计算机系统基本都使用ASCII来表示文本字符,通过这种方式,用一个唯一的单字节大小的整数值来表示每个字符。
上面的代码用ASCII表示如下:(SP表示空格)
hello.c程序是以字节序列的方式存储在文件中的。每个字节都有一个整数值,对应某些字符。
例如:第一个字节的整数值是35,它对应的就是字符“#”。第二个字节的整数值为105,它对应的字符是“i”,以此类推。
特别注意的是,每个文本行都是以一个看不见的换行符“\n”来结束的,它对应的整数值是10。
像hello.c这样由ASCII字符构成的文件称为文本文件,所有其他文件都称为二进制文件。
程序的编译过程
hello程序的生命周期是从一个高级C语言程序开始的,因为这种形式能够被人读懂。但是,人能够读懂,可是计算机看不懂,所以,为了能够在计算机系统上运行我们的hello.c程序,每条c语句都必须被其他程序转化为一系列低级机器语言指令(也就是机器语言,计算机能看懂的语言)然后这些指令按照一种称为可执行目标程序的格式打包好,并以二进制磁盘文件的形式存放起来。目标程序也称为可执行目标文件。
在这里,编译器驱动程序读取源程序文件hello.c,并把它翻译成一个可执行目标文件hello。这个过程可分为四个阶段完成,如图所示,其中执行这四个阶段的程序(预处理器,编译器,汇编器,链接器)一起构成了编译系统。
- 预处理阶段。预处理器 (cpp) 根据以字符#开头的命令,修改原始的 C 程序。比如hello.c 中第 1 行的#include<stdio. h> 命令告诉预处理器读取系统头文件stdio.h 的内容,并把它直接插入程序文本中。结果就得到了另一个 C 程序,通常是以.i 作为文件扩展名。
- 编译阶段。编译器 (eel) 将文本文件 hello.i 翻译成文本文件 hello.s, 它包含一个汇编语言程序。该程序包含函数 main 的定义,如下所示:
- 汇编阶段。接下来,汇编器(as)将hello.s翻译成机器语言指令,把这些指令打包成一种叫做可重定位目标程序(relocatable object program)的格式,并将结果保存在目标文件he11o.o中。hel1o.o文件是一个二进制文件,它包含的17个字节是函数main的指令编码。如果我们在文本编辑器中打开he11o.o文件,将看到一堆乱码。
- 链接阶段。请注意,hello程序调用了printf函数,它是每个C编译器都提供的标准C库中的一个函数。printf函数存在于一个名为printf.o的单独的预编译好了的目标文件中,而这个文件必须以某种方式合并到我们的he11o.。程序中。链接器(1d)就负责处理这种合并。结果就得到he11o文件,它是一个可执行目标文件(或者简称为可执行文件),可以被加载到内存中,由系统执行。