- 进程创建
- 进程退出码
- 进程等待
- 程序替换
Shell作为命令行解释器是一个进程,它也有自己的数据结构task_struct
和代码和数据。为了防止用户输入的指令造成Shell崩溃,所以Shell执行用户输入的指令是通过创建一个子进程来执行的。例如ls``pwd
等等。
一.进程创建
1.fork系统调用
在Linux中,有一个系统调用fork
可以创建一个子进程。
- 返回值:给子进程返回0,父进程返回子进程pid,创建子进程失败返回-1
根据返回值的不同,我们可以让子进程执行父进程的一部分代码,这也是创建进程的目的之一。另一个目的就是让进程执行其他程序,这与程序替换有关。下面代码就是fork()
的用法
2.fork 的原理
进程包括 task_struct 和 程序数据和代码,fork的作用就是创建一个task_struct
和父进程共享代码和数据,当代码和数据需要改变时,写时拷贝机制保证进程独立性。
- fork创建的子进程
task_struct
大部分属性是来自于父进程。 - 操作系统将子进程的
task_struct
加入进程队列。 - fork之后,执行流有两个,因为有两个进程控制块。
- fork之后,父子进程谁先执行由调度器决定。
二.进程退出码
在写c代码时,我们会在main函数中写return 0;
相信大家都会疑惑,这句话有什么用呢,要理解这个代码有什么用,就要充分理解进程退出码。
大家在用程序完成任务时,都会关心程序的执行结果对不对,结果不对要知道为什么不对,那么如何知道结果对不对呢,我们可以通过打印来判断,但是当结果不好判断时,这种方式显然就不实用了,此时我们可以通过进程退出码来判断。每一个进程退出码都对应一个字符串,显示错误原因,在c语言中,strerror()
可以将进程退出码转换为错误原因。
在Linux中,可以用echo $?
打印上一个程序的进程退出码。main函数中的return 0;
0就是进程退出码。除了在main函数中return,还可以用exit(),_exit()
进行退出
三.进程等待
程序的执行结果有两种,一种是正确执行完毕,另一种是程序奔溃。当程序正确执行完后,会有一个进程退出码来表示结果是否正确;如果程序奔溃的话,操作系统会给进程发送一个信号。因此,只要获得进程退出码+信号,就可以获得子进程的执行情况。进程等待就是取得进程退出码+信号的过程。
如果子进程退出,父进程不回收它,那么子进程将会成为僵尸进程,造成内存泄漏。父进程如何回收子进程呢,就是通过进程等待。Linux中有wait,waitpid
两个系统调用来等待进程。
pid_t wait(int* status);
- 功能:阻塞等待调用进程的任意子进程
- 返回值:等待成功,返回子进程pid,失败返回-1
- int* status:输出型参数,获取进程退出码和进程退出信号。提取这两个字段可以用位运算,也可以用宏WIFEXITED(status)判断是否正常退出,然后用WEXITSTATUS(status)来提取退出码
阻塞等待的工作流程:
当父进程阻塞等待子进程时,父进程的状态由R变为S,挂到子进程的parent队列上,当子进程退出时,os会将parent队列上的父进程状态由S变为R,然后os会将子进程退出码+信号写入进程控制块的相应字段,os读取子进程task_struct 中的字段:exit_code, exit_signal
,并将这两个字段设置进status。
pid_t waitpid(pid_t pid, int* status, int option);
- 第一个参数pid:pid>0 表示等待指定进程,如果pid=-1,等待任一进程
- status:同上
- option:可以指定是阻塞等待还是非阻塞等待。WNOHANG:非阻塞等待;0:阻塞等待
- 返回值:当返回值>0,表示等待成功,返回值=0,表示还没有成功(非阻塞等待),父进程可以做自己的事,返回值=-1,表示等待失败
?? buffers
#include<stdio.h>
#include<unistd.h>
#include<stdlib.h>
#include<sys/wait.h>
#include<sys/types.h>
int main(){
pid_t id = fork();
if (id == 0)
{
//子进程
sleep(2);
exit(9);
}
sleep(3);
// 父进程
int status = 0;
while (1)
{
pid_t n = waitpid(id, &status, WNOHANG);
if (n > 0)
{
if (WIFEXITED(status))
{
printf("等待成功!进程退出码:%d\n", WEXITSTATUS(status));
}
else
{
printf("等待成功!进程退出信号:%d\n", status & 0x7f);
}
break;
}
}
return 0;
}
四.程序替换
创建子进程的目的之一是为了执行任务,这个任务有可能是来源于父进程,也有可能来源于另一个程序,那么如果让创建的子进程执行另一个程序呢,这就要用到exec系列的接口进行程序替换,这种接口也叫做加载器。
4.1 接口的介绍
- execl
- path:执行程序的路径,arg:表示执行程序名字,…:可变参数列表,同printf,写命令行选项,以NULL结尾
- 返回值:当函数有返回值时,必定替换失败
- execlp
- file:执行程序的名字,系统会在默认环境变量PATH中查找程序
- 其余同上
- execle
- envp :父进程可以将自己的环境变量表传递给子进程。
- execv
- argv:表示将上述的arg和可变参数列表,放入指针数组
- execvp
- execvpe
- execve
- 该接口是系统调用接口,上面六个接口都是库函数,底层封装了evecve接口
4.2 替换的原理
程序替换原理用到了写时拷贝机制,不仅仅变量可以支持写时拷贝,代码也可以支持写时拷贝。fork创建子进程,将共享父进程的代码和数据,调用exec系列接口时,os会将子进程的所有代码和数据都替换为目标程序,然后修改了页表中的映射关系,故此,程序替换完毕。同理,os加载程序的原理也是如此,所以exec系列函数也是加载器。
- 程序替换,不仅仅能替换c语言,c++,java,python,只要能在Linux运行的都可以替换。