此刻,hello.c源程序已经被编译系统翻译成了可执行目标文件hello,并被存放在硬盘上。要想在Unix系统上运行该可执行文件,我们将它的文件名输入到称为shell的应用程序中:
linux>./hello
hello, world
linux>
shell是一个命令行解释器,它输入一个提示符,等待输入一个命令行,然后执行这个命令。如果该命令行的第一个单词不是一个内置的shell命令,那么shell就会假设这是一个可执行文件的名字,它将加载并运行这个文件。所以在此例中,shell将加载并运行hello程序,然后等待程序终止。hello程序在屏幕上输出它的消息,然后终止。shell随后输出一个提示符,等待下一个输入的命令行。
一.4.1 系统的硬件组成
为了理解运行hello程序时发生了什么,我们需要了解一个典型系统的硬件组织,如图1-4所示。这张图是近期(其实是2003年以前了)Intel系统产品族的模型,但是所有其他系统也有相同的外观和特性。
1.总线
贯穿整个系统的是一组电子管道,称作总线,它携带信息字节并负责在各个部件间传递。通常总线被设计成传送定长的字节块,也就是字(word)。字中的字节数(即字长)是一个基本的系统参数,各个系统中都不尽相同。现在的大多数机器字长要么是4个字节(32位),要么是8个字节(64位)。本书中,我们不对字长做任何固定的假设。相反,我们将在需要明确定义上下文中具体说明一个“字”是多大。
2.I/O设备
I/O(输入/输出)设备是系统与外部世界的联系通道。我们的示例系统包括四个I/O设备:作为用户输入的键盘和鼠标,作为用户输出的显示器,以及用于长期储存数据和程序的硬盘。最开始可执行程序hello就存放在磁盘上。
每个I/O设备都通过一个控制器或适配器和I/O总线相连。控制器和适配器之间的区别主要在于他们的封装方式。控制器是I/O设备本身或者系统的主印制电路板(也就是主板)上的芯片组。而适配器则是一块插在主板插槽上的卡。无论如何,它们的功能都是在I/O总线和I/O设备之间传递信息。
第六章会更多地说明磁盘之类的I/O设备是如何工作的。在第十章,将学习如何在应用程序中利用Unix I/O接口访问设备。我们将特别关注网络类设备,不过这些技术对于其他设备来说也是通用的。
3.主存
主存是一个临时存储设备,在处理器执行程序时,用来存放程序和程序处理的数据。从物理上来说,主存是由一组动态随机存取存储器(DRAM)芯片组成的。从逻辑上来说,存储器是一个线性的字节数组,每个字节都有其唯一的地址(数组索引),这些地址是从0开始的。一般来说,组成程序的每条机器指令都由不同数量的字节构成。与C程序变量相对应的数据项的大小是根据数据类型变化的。比如,在运行linux的X86-64机器上,short类型的数据需要2个字节,int和float类型需要4个字节,而long和double类型需要8个字节。第六章将具体介绍存储器技术,比如DRAM芯片是如何工作的,它们又是如何组合起来构成主存的。
4.处理器
中央处理单元(CPU),简称处理器,是解释(或执行)存储在主存中指令的引擎。处理器的核心是一个大小为一个字的存储设备(或寄存器),称为程序计数器(PC)。在任何时刻,PC都指向主存中的某条机器语言指令(即含有该条指令的地址)。
从系统通电开始,直到系统断电,处理器一直在不断地执行程序计数器指向的指令,再更新程序计数器,使其指向下一条指令。处理器看上去是按照一个非常简单地指令执行模型来操作的,这个模型是由指令集架构决定的。在这个模型中,指令按照严格的顺序执行,而执行一条指令包含执行一系列的步骤。处理器从程序计数器指向的内存处读取指令,解释指令中的位,执行该指令指示的简单操作,然后更新PC,使其指向下一条指令,而这条指令并不一定和在内存中刚刚执行的指令相邻。
这样的简单操作并不多,它们围绕着主存、寄存器文件(register file)和算术/逻辑单元(ALU)进行。寄存器文件是一个小的存储设备,由一些单个字长的寄存器组成,每个寄存器都有唯一的名字。ALU计算新的数据和地址值。下面是一些简单操作的例子,CPU在指令的要求下可能会执行这些操作。
- 加载:从主存复制一个字节或者一个字到寄存器,以覆盖寄存器原来的内容。
- 存储:从寄存器复制一个字节或者一个字到主存某个位置,以覆盖这个位置上原来的内容。
- 操作:把两个寄存器的值复制到ALU,ALU对这两个字做算术运算,并将结果存放到一个寄存器中,以覆盖寄存器中原来的内容。
- 跳转:从指令本身中抽取一个字,并将这个字复制到程序计数器(PC)中,以覆盖PC中原来的值。
处理器看上去是它的指令集架构的简单实现,但是实际上现代处理器使用了非常复杂的机制来加速程序的执行。因此:我们将处理器的指令集架构和处理器的微体系结构区分开来:指令集架构描述的是每条机器代码指令的效果;而微体系结构描述的是处理器实际上是如何实现的。在第三章研究机器代码时,我们考虑的是机器的指令集架构所提供的抽象性。第四章将更详细地介绍处理器实际上是如何实现的。第五章用一个模型说明现代处理器是如何工作的,从而能预测和优化机器语言程序的性能。
一.4.2 运行hello程序
前面简单地描述系统的硬件组成和操作,现在开始介绍当我们运行示例程序时到底发生了些什么。在这里必须省略很多细节(不省略看不懂啊……),稍后会做补充。
初始时,shell程序执行它的指令,等待我们输入一个命令。当我们在键盘上输入字符串“./hello”后,shell程序将字符逐一读入寄存器,再把它存放到内存中,如图1-5所示。 当我们在键盘上敲回车键时,shell程序就知道我们已经结束了命令的输入。然后shell执行一系列指令来加载可执行的hello文件,这些指令将hello目标文件中的代码和数据从磁盘复制到主存。数据包括最终会被输出的字符串“hello,world\n”。
利用直接存储器存取(DMA,将在第六章中讨论)技术,数据可以不通过处理器而直接从硬盘到主存。这个步骤如图1-6所示。 一旦目标文件hello中的代码和数据被加载到主存,处理器就开始执行hello程序中main程序中的机器语言指令。这些指令将“hello,world\n”字符串中的字节从主存复制到寄存器文件,再从寄存器文件中复制到显示设备,最终显示在屏幕上。这个步骤如图1-7所示。
(上强度了,上强度了)