信号是由用户、系统或者进程发送给目标进程的信息,以通知目标进程某个状态的改变或系统异常。Linux信号可由如下条件产生:
- 对于前台进程,用户可以通过输入特殊的终端字符来给它发送信号。比如输入Ctrl+C通常会给进程发送一个中断信号。
- 系统异常。比如浮点异常和非法内存段访问。
- 系统状态变化。比如alarm定时器到期将引起SIGALRM信号。
- 运行kill命令或调用kill函数。
服务器程序必须处理一些常见信号,以免异常终止。
一、信号概述
1.1、发送信号
#include <sys/types.h>
#include <signal.h>
int kill(pid_t pid, int sig);
pid
:目标进程
- pid>0:信号发送给PID=pid的进程
- pid=0:信号发送给本进程组内的其他进程
- pid=-1:信号发送给除了init进程外的所有进程,但发送者需要有对目标进程发送信号的权限
- pid<-1:发送给组ID为-pid的进程组中的所有成员
sig
:准备向目标进程发送的信号,sig大于0,如果sig为0则kill函数不发送任何信号
该函数成功时返回0,失败则返回-1并设置errno
- EINVAL 无效信号
- EPERM 该进程没有权限发送信号给任何一个目标进程
- ESRCH 目标进程,进程组不存在
1.2、信号的处理方式
信号处理函数的原型如下:信号处理函数只带有一个整型参数,该参数用来指示信号类型。信号处理函数应该是可重入的,否则很容易引发一些竞态条件。所以信号处理函数中严禁调用不安全函数。
#include <signal.h>
typedef void(*__sighandler_t)(int);
除了用户自定义信号处理函数外,bits/signum.h头文件中还定义了信号的两种其他处理方式:
#include <bits/signum.h>
#define SIG_DFL((__sighandler_t)0)
#define SIG_IGN((__sighandler_t)1)
SIG_IGN
表示忽略目标信号,SIG_DFL
表示使用信号的默认处理方式。信号的默认处理方式有如下几种:
- 结束进程(Term)
- 忽略信号(Ign)
- 结束进程并生成核心转储文件(Core)
- 暂停进程(Stop)
- 以及继续进程(Cont)。
1.3、Linux信号
Linux的可用信号都定义在bits/signum.h头文件中,其中包括标准信号和POSIX实时信号。下面列出一些常见的信号
信号 | 起源 | 默认行为 | 含义 |
---|---|---|---|
SIGHUP | POSIX | 终止 | 终端挂断或控制进程终止 |
SIGINT | POSIX | 终止 | 键盘中断字符,通常是Ctrl+C |
SIGQUIT | POSIX | 终止+核心转储 | 键盘退出字符,通常是Ctrl+\ |
SIGILL | POSIX | 终止+核心转储 | 非法指令 |
SIGABRT | ANSI | 终止+核心转储 | 中止信号,由abort函数生成 |
SIGFPE | POSIX | 终止+核心转储 | 浮点异常 |
SIGKILL | POSIX | 终止 | 不可捕获,强制终止进程 |
SIGSEGV | POSIX | 终止+核心转储 | 无效的内存引用 |
SIGPIPE | POSIX | 终止 | 管道破裂 |
SIGALRM | POSIX | 终止 | 定时器信号 |
SIGTERM | POSIX | 终止 | 终止请求,通常用于优雅地终止进程 |
SIGUSR1 | POSIX | 终止 | 用户定义信号1 |
SIGUSR2 | POSIX | 终止 | 用户定义信号2 |
SIGCHLD | POSIX | 忽略 | 子进程状态改变 |
SIGCONT | BSD | 继续执行 | 继续一个停止的进程 |
SIGSTOP | POSIX | 停止 | 不可捕获,停止进程 |
SIGTSTP | POSIX | 停止 | 键盘挂起字符,通常是Ctrl+Z |
SIGTTIN | POSIX | 停止 | 后台进程请求输入 |
SIGTTOU | POSIX | 停止 | 后台进程请求输出 |
SIGBUS | UNIX | 终止+核心转储 | 总线错误 |
SIGPOLL | System V | 终止 | I/O可用性变化 |
SIGPROF | BSD | 终止 | Profiling定时器到期 |
SIGSYS | UNIX | 终止+核心转储 | 非法系统调用 |
SIGTRAP | BSD | 终止+核心转储 | 跟踪/断点陷阱 |
SIGURG | BSD | 忽略 | Socket紧急情况 |
SIGVTALRM | BSD | 终止 | 虚拟定时器到期 |
SIGXCPU | BSD | 终止+核心转储 | 超出CPU时间限制 |
SIGXFSZ | BSD | 终止+核心转储 | 文件大小超出限制 |
1.4、中断系统调用
如果程序在执行处于阻塞状态的系统调用时接收到信号,并且我们为该信号设置了信号处理函数,则默认情况下系统调用将被中断,并且errno被设置为EINTR。我们可以使用sigaction函数(见后文)为信号设置SA_RESTART标志以自动重启被该信号中断的系统调用。
对于默认行为是暂停进程的信号(比如SIGSTOP、SIGTTIN),如果我们没有为它们设置信号处理函数,则它们也可以中断某些系统调用(比如connect、epoll_wait)。POSIX没有规定这种行为,这是Linux独有的。
二、信号函数
2.1、发送信号
2.1.1、kill函数
给某一个进程发送一个信号
#include <signal.h>
int kill(pid_t pid, int sig);
pid
: 进程ID(man 文档里边写的比较详细)sig
: 要发送的信号
举个例子
// 自己杀死自己
kill(getpid(), 9);
// 子进程杀死自己的父进程,可以看到发送的是10号信号,父进程也不必立即处理这个信号
kill(getppid(), 10);
2.1.2、raise
给当前进程发送指定的信号,函数原型如下:
#include <signal.h>
int raise(int sig);
2.1.3、abort
给当前进程发送一个固定信号 (SIGABRT),杀死当前进程,函数原型如下:
#include <stdlib.h>
void abort(void);
2.2、为信号设置处理函数
2.2.1、signal
要为一个信号设置处理函数,可以使用下面的signal系统调用:
#include <signal.h>
_sighandler_t signal(int sig, _sighandler _t_handler)
sig
参数指出要捕获的信号类型。
_handler
参数是_sighandler_t类型的函数指针,用于指定信号sig的处理函数。
signal函数成功时返回一个函数指针,该函数指针的类型也是_sighandler_t。这个返回值是前一次调用signal函数时传入的函数指针,或者是信号sig对应的默认处理函数指针SIG_DEF(如果是第一次调用signal的话)。
2.2.2、sigaction
更健壮的接口是下面的系统调用
#include <signal.h>
int sigaction(int sig, const struct sigaction* act, struct sigaction* oact);
sig
参数指出要捕获的信号类型,act
参数指定新的信号处理方式,oact
参数则输出信号先前的处理方式。
struct sigaction {
#ifdef __USE_POSIX199309
union {
_sighandler_t sa_handler;
void(*sa_sigaction)(int, siginfo_t*, void*);
} _sigaction_handler;
#define sa_handler __sigaction_handler.sa_handler
#define sa_sigaction __sigaction_handler.sa_sigaction
#else
_sighandler_t sa_handler;
#endif
_sigset_t sa_mask;
int sa_flags;
void (*sa_restorer)(void);
};
sa_hander
成员指定信号处理函数。
sa_mask
成员增加进程的信号掩码,以指定哪些信号不能发送给本进程。sa_mask是信号集sigset_t(_sigset_t的同义词)类型,该类型指定一组信号。
sa_flags
成员用于设置程序收到信号时的行为,其可选值如下(或下面的组合):
SA_RESETHAND
:当调用信号处理程序时,将信号的处理程序重置为默认值。这意味着处理程序在每次调用后都会被重新设置,不会保持永久性。SA_NODEFER
:在调用信号处理程序时,不会阻塞当前信号。通常,当信号处理程序运行时,相同类型的信号会被阻塞,直到处理程序执行完成。使用SA_NODEFER
标志可以避免此阻塞。SA_RESTART
:当系统调用由于信号中断而返回时,自动重新启动该系统调用,而不是返回-1
并将errno
设置为EINTR
。这使得系统调用在接收到信号时可以自动恢复执行,而不会中断。SA_SIGINFO
:指定使用带有三个参数的信号处理函数,而不是传统的只有一个参数的信号处理函数。带有三个参数的处理函数接收有关信号的更多信息,如信号来源、信号的附加数据等。SA_NOCLDSTOP
:子进程停止或继续运行时,不会向父进程发送SIGCHLD
信号。通常,当子进程停止或继续时,会向父进程发送SIGCHLD
信号,但使用SA_NOCLDSTOP
标志可以防止这种行为。SA_NOCLDWAIT
:当子进程退出时,不会创建僵尸进程,并且不会向父进程发送SIGCHLD
信号。通常,父进程需要调用wait
或waitpid
来等待子进程退出并获取其退出状态,但使用SA_NOCLDWAIT
标志可以避免这种行为。
2.3、定时器
2.3.1、alarm
alarm
函数只能进行单次定时,定时完成发射出一个信号。
#include <unistd.h>
unsigned int alarm(unsigned int seconds);
seconds
:倒计时秒数。 倒计时完成发送一个信号 SIGALRM , 当前进程会收到这个信号,这个信号默认的处理动作是中断当前进程- 返回值大于0表示倒计时还剩多少秒,返回值为0表示倒计时完成, 信号被发出
2.3.2、setitimer
setitimer
函数可以进行周期性定时,每触发一次定时器就会发射出一个信号。
#include <sys/time.h>
struct itimerval {
struct timeval it_interval; /* 时间间隔 */
struct timeval it_value; /* 第一次触发定时器的时长 */
};
// 这个结构体表示的是一个时间段: tv_sec + tv_usec
struct timeval {
time_t tv_sec; /* 秒 */
suseconds_t tv_usec; /* 微妙 */
};
int setitimer(int which, const struct itimerval *new_value, struct itimerval *old_value);
which
: 定时器使用什么样的计时法则, 不同的计时法则发出的信号不同ITIMER_REAL
: 自然计时法, 最常用, 发出的信号为SIGALRM, 一般使用这个宏值,自然计时法时间 = 用户区 + 内核 + 消耗的时间(从进程的用户区到内核区切换使用的总时间)ITIMER_VIRTUAL
: 只计算程序在用户区运行使用的时间,发射的信号为 SIGVTALRMITIMER_PROF
: 只计算内核运行使用的时间, 发出的信号为SIGPROF
new_value
: 给定时器设置的定时信息, 传入参数old_value
: 上一次给定时器设置的定时信息, 传出参数,如果不需要这个信息, 指定为NULL
2.4、示例
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <string.h>
#include <sys/time.h>
#include <signal.h>
// 定时器信号的处理动作
void doing(int arg) {
printf("当前捕捉到的信号是: %d\n", arg);
}
int main() {
// 注册要捕捉哪一个信号, 执行什么样的处理动作
signal(SIGALRM, doing);
// 调用定时器函数设置定时器函数
struct itimerval newact;
// 3s之后发出第一个定时器信号, 之后每隔1s发出一个定时器信号
newact.it_value.tv_sec = 3;
newact.it_value.tv_usec = 0;
newact.it_interval.tv_sec = 1;
newact.it_interval.tv_usec = 0;
setitimer(ITIMER_REAL, &newact, NULL);
while(1);
return 0;
}
三、信号集
3.1、信号集函数
Linux使用数据结构sigset_t
来表示一组信号
#include <bits/sigset.h>
#define _SIGSET_NWORDS (1024/(8*sizeof(unsigned long int)))
typedef struct {
unsigned long int __val[_SIGSET_NWORDS];
}__sigset_t;
sigset_t
实际上是一个长整型数组,数组的每个元素的每个位表示一个信号。在我看来像是一个位图。
Linux提供了如下一组函数来设置、修改、删除和查询信号集:
#include <signal.h>
// 将set集合中所有的标志位设置为0
int sigemptyset(sigset_t *set);
// 将set集合中所有的标志位设置为1
int sigfillset(sigset_t *set);
// 将set集合中某一个信号(signum)对应的标志位设置为1
int sigaddset(sigset_t *set, int signum);
// 将set集合中某一个信号(signum)对应的标志位设置为0
int sigdelset(sigset_t *set, int signum);
// 判断某个信号在集合中对应的标志位到底是0还是1, 如果是0返回0, 如果是1返回1
int sigismember(const sigset_t *set, int signum);
3.2、进程信号掩码
前文提到,可以用sigaction
结构体的sa_mask
成员来设置进程的信号掩码。此外,如下函数也可以用于设置或查看进程的信号掩码:
#include <signal.h>
int sigprocmask(int_how, _const sigset_t* _set, sigset_t* _oset);
_set
参数指定新的信号掩码,_oset
参数则输出原来的信号掩码(如果不为NULL的话)
如果_set
参数不为NULL,则_how
参数指定设置进程信号掩码的方式:
SIG_BLOCK
新的进程信号掩码是当前值和_set
指定信号集的并集SIG_UNBLOCK
新的进程信号掩码是其当前值和~_set
信号集的并集,因此_set
指定的信号集将不被屏蔽SIG_SETMASK
直接将进程信号掩码设置为_set
如果_set为NULL,则进程信号掩码不变
3.3、被挂起的信号
设置进程信号掩码后,被屏蔽的信号将不能被进程接收。如果给进程发送一个被屏蔽的信号,则操作系统将该信号设置为进程的一个被挂起的信号。如果我们取消对被挂起信号的屏蔽,则它能立即被进程接收到。
如下函数可以获得进程当前被挂起的信号集:
#include <signal.h>
int sigpending(sigset_t* set);
set
参数用于保存被挂起的信号集。也就是未决信号集。
进程即使多次接收到同一个被挂起的信号,sigpending函数也只能反映一次。并且,当我们再次使用sigprocmask使能该挂起的信号时,该信号的处理函数也只被触发一次。
sigpending
成功时返回0,失败时返回-1并设置errno。
3.4、使用信号集
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <string.h>
#include <signal.h>
int main()
{
// 初始化信号集
sigset_t myset;
sigemptyset(&myset);
// 设置阻塞的信号,也就是屏蔽2,3,9号信号
sigaddset(&myset, SIGINT); // 2
sigaddset(&myset, SIGQUIT); // 3
sigaddset(&myset, SIGKILL); // 9
// 将初始化的信号集中的数据设置给内核
sigset_t old;
sigprocmask(SIG_BLOCK, &myset, &old);
// 让进程一直运行, 在当前进程中产生对应的信号
int i = 0;
while(1) {
// 读内核的未决信号集
sigset_t curset;
sigpending(&curset);
// 遍历这个信号集
for(int i=1; i<32; ++i) {
int ret = sigismember(&curset, i);
printf("%d", ret);
}
printf("\n");
sleep(1);
// i++;
// if(i==10) {
// 解除阻塞, 重新设置阻塞信号集
// sigprocmask(SIG_UNBLOCK, &myset, NULL);
// sigprocmask(SIG_SETMASK, &old, NULL);
// }
}
return 0;
}
可以看下图,当我们按下 ctrl+c
可以发现出现了未决信号SIGINT,当我们按下 ctrl+\
可以发现出现了未决信号SIGQUIT,
四、统一事件源
信号是一种异步事件:信号处理函数和程序的主循环是两条不同的执行路线。很显然,信号处理函数需要尽可能快地执行完毕,以确保该信号不被屏蔽(前面提到过,为了避免一些竞态条件,信号在处理期间,系统不会再次触发它)太久。
一种典型的解决方案是:把信号的主要处理逻辑放到程序的主循环中,当信号处理函数被触发时,它只是简单地通知主循环程序接收到信号,并把信号值传递给主循环,主循环再根据接收到的信号值执行目标信号对应的逻辑代码。信号处理函数通常使用管道来将信号“传递”给主循环:信号处理函数往管道的写端写入信号值,主循环则从管道的读端读出该信号值。那么主循环怎么知道管道上何时有数据可读呢?这很简单,我们只需要使用I/O复用系统调用来监听管道的读端文件描述符上的可读事件。如此一来,信号事件就能和其他I/O事件一样被处理,即统一事件源。
下面给出统一事件源的一个简单实现:
#include <sys/types.h>
#include <sys/socket.h>
#include <netinet/in.h>
#include <arpa/inet.h>
#include <assert.h>
#include <stdio.h>
#include <stdbool.h>
#include <signal.h>
#include <unistd.h>
#include <errno.h>
#include <string.h>
#include <fcntl.h>
#include <stdlib.h>
#include <sys/epoll.h>
#include <pthread.h>
#define MAX_EVENT_NUMBER 1024
#define MAX_CONNECTIONS 1024
#define PORT 8080
static int pipefd[2];
int setnonblocking(int fd)
{
int old_option = fcntl(fd, F_GETFL);
int new_option = old_option | O_NONBLOCK;
fcntl(fd, F_SETFL, new_option);
return old_option;
}
void addfd(int epollfd, int fd)
{
struct epoll_event event;
event.data.fd = fd;
event.events = EPOLLIN | EPOLLET;
epoll_ctl(epollfd, EPOLL_CTL_ADD, fd, &event);
setnonblocking(fd);
}
/*信号处理函数*/
void sig_handler(int sig)
{
/*保留原来的errno,在函数最后恢复,以保证函数的可重入性*/
int save_errno = errno;
int msg = sig;
send(pipefd[1], (char *)&msg, 1, 0); /*将信号值写入管道,以通知主循环*/
errno = save_errno;
}
/*设置信号的处理函数*/
void addsig(int sig)
{
struct sigaction sa;
memset(&sa, '\0', sizeof(struct sigaction));
sa.sa_handler = sig_handler;
sa.sa_flags |= SA_RESTART;
sigfillset(&sa.sa_mask);
assert(sigaction(sig, &sa, NULL) != -1);
}
int main(int argc, char *argv[])
{
// 创建 socket 文件描述符
int listenfd;
if ((listenfd = socket(AF_INET, SOCK_STREAM, 0)) == 0)
{
perror("socket failed");
exit(EXIT_FAILURE);
}
// 绑定到指定端口
struct sockaddr_in address;
address.sin_family = AF_INET;
address.sin_port = htons(PORT);
address.sin_addr.s_addr = inet_addr("192.168.189.129");
int addrlen = sizeof(address);
if (bind(listenfd, (struct sockaddr *)&address, addrlen) < 0)
{
perror("bind failed");
exit(EXIT_FAILURE);
}
// 开始监听
if (listen(listenfd, MAX_CONNECTIONS) < 0)
{
perror("listen failed");
exit(EXIT_FAILURE);
}
// 注册epoll事件
struct epoll_event events[MAX_EVENT_NUMBER];
int epollfd = epoll_create(1);
addfd(epollfd, listenfd);
// 使用socketpair创建管道,注册pipefd[0]上的可读事件
int ret = socketpair(PF_UNIX, SOCK_STREAM, 0, pipefd);
setnonblocking(pipefd[1]);
addfd(epollfd, pipefd[0]);
// 设置一些信号的处理函数
addsig(SIGHUP);
addsig(SIGCHLD);
addsig(SIGTERM);
addsig(SIGINT);
bool stop_server = false;
while (!stop_server)
{
int number = epoll_wait(epollfd, events, MAX_EVENT_NUMBER, -1);
if ((number < 0) && (errno != EINTR))
{
printf("epoll failure\n");
break;
}
for (int i = 0; i < number; i++)
{
int sockfd = events[i].data.fd;
/*如果就绪的文件描述符是listenfd,则处理新的连接*/
if (sockfd == listenfd)
{
struct sockaddr_in client_address;
socklen_t client_addrlength = sizeof(client_address);
int connfd = accept(listenfd, (struct sockaddr *)&client_address, &client_addrlength);
addfd(epollfd, connfd);
}
/*如果就绪的文件描述符是pipefd[0],则处理信号*/
else if ((sockfd == pipefd[0]) && (events[i].events & EPOLLIN))
{
int sig;
char signals[1024];
ret = recv(pipefd[0], signals, sizeof(signals), 0);
if (ret == -1)
{
continue;
}
else if (ret == 0)
{
continue;
}
else
{
/*因为每个信号值占1字节,所以按字节来逐个接收信号。我们以SIGTERM为例,来说明如何安全地终止服务器主循环*/
for (int i = 0; i < ret; ++i)
{
switch (signals[i])
{
case SIGCHLD:
case SIGHUP:
continue;
case SIGTERM:
case SIGINT:
stop_server = true;
}
}
}
}
}
}
printf("close fds\n");
close(listenfd);
close(pipefd[1]);
close(pipefd[0]);
return 0;
}
五、网络编程常用信号
5.1、SIGHUP
当挂起进程的控制终端时,SIGHUP信号将被触发。对于没有控制终端的网络后台程序而言,它们通常利用SIGHUP信号来强制服务器重读配置文件。
5.2、SIGPIPE
默认情况下,往一个读端关闭的管道或socket连接中写数据将引发SIGPIPE信号。我们需要在代码中捕获并处理该信号,或者至少忽略它,因为程序接收到SIGPIPE信号的默认行为是结束进程,而我们绝对不希望因为错误的写操作而导致程序退出。引起SIGPIPE信号的写操作将设置errno为EPIPE。
可以使用send函数的MSG_NOSIGNAL标志来禁止写操作触发SIGPIPE信号。在这种情况下,我们应该使用send函数反馈的errno值来判断管道或者socket连接的读端是否已经关闭。
此外,我们也可以利用I/O复用系统调用来检测管道和socket连接的读端是否已经关闭。以poll为例,当管道的读端关闭时,写端文件描述符上的POLLHUP事件将被触发;当socket连接被对方关闭时,socket上的POLLRDHUP事件将被触发。
5.3、SIGURG
内核通知应用程序带外数据到达主要有两种方法:
一种是I/O复用技术,select等系统调用在接收到带外数据时将返回,并向应用程序报告socket上的异常事件
一种是使用SIGURG信号
#include <sys/socket.h>
#include <netinet/in.h>
#include <arpa/inet.h>
#include <assert.h>
#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <errno.h>
#include <string.h>
#include <signal.h>
#include <fcntl.h>
#define BUF_SIZE 1024
static int connfd;
void sig_urg( int sig )
{
int save_errno = errno;
char buffer[ BUF_SIZE ];
memset( buffer, '\0', BUF_SIZE );
int ret = recv( connfd, buffer, BUF_SIZE-1, MSG_OOB );
printf( "got %d bytes of oob data '%s'\n", ret, buffer );
errno = save_errno;
}
void addsig( int sig, void ( *sig_handler )( int ) )
{
struct sigaction sa;
memset( &sa, '\0', sizeof( sa ) );
sa.sa_handler = sig_handler;
sa.sa_flags |= SA_RESTART;
sigfillset( &sa.sa_mask );
assert( sigaction( sig, &sa, NULL ) != -1 );
}
int main( int argc, char* argv[] )
{
if( argc <= 2 )
{
printf( "usage: %s ip_address port_number\n", basename( argv[0] ) );
return 1;
}
const char* ip = argv[1];
int port = atoi( argv[2] );
struct sockaddr_in address;
bzero( &address, sizeof( address ) );
address.sin_family = AF_INET;
inet_pton( AF_INET, ip, &address.sin_addr );
address.sin_port = htons( port );
int sock = socket( PF_INET, SOCK_STREAM, 0 );
assert( sock >= 0 );
int ret = bind( sock, ( struct sockaddr* )&address, sizeof( address ) );
assert( ret != -1 );
ret = listen( sock, 5 );
assert( ret != -1 );
struct sockaddr_in client;
socklen_t client_addrlength = sizeof( client );
connfd = accept( sock, ( struct sockaddr* )&client, &client_addrlength );
if ( connfd < 0 )
{
printf( "errno is: %d\n", errno );
}
else
{
addsig( SIGURG, sig_urg );
fcntl( connfd, F_SETOWN, getpid() );
char buffer[ BUF_SIZE ];
while( 1 )
{
memset( buffer, '\0', BUF_SIZE );
ret = recv( connfd, buffer, BUF_SIZE-1, 0 );
if( ret <= 0 )
{
break;
}
printf( "got %d bytes of normal data '%s'\n", ret, buffer );
}
close( connfd );
}
close( sock );
return 0;
}