Linux之多线程

一、进程与线程

1.1 进程的概念

1.2 线程的概念

1.3 线程的优点

1.4 线程的缺点

1.5 线程异常

1.6 线程用途

二、线程控制

2.1 POSIX线程库

2.2 创建一个新的线程

2.3 线程ID及进程地址空间布局

2.4 线程终止

2.5 线程等待

2.6 线程分离

一、进程与线程

在学习多线程之前，我们首先要搞清楚进程与线程的区别。

1.1 进程的概念

进程是操作系统进行资源分配的基本单位。每个进程都有一个唯一的标识符（PID），用于操作系统在管理和调度进程时进行标识和区分。操作系统可以根据一定的调度算法来分配CPU时间片给不同的进程，从而实现多任务并发执行。在Linux中一个进程的创建实际上伴随着进程控制块（PCB或task_struct），进程地址空间以及页表的创建。

1.2 线程的概念

在一个程序里的一个执行路线就叫做线程（thread）。更准确的定义是：线程是“一个进程内部的控制序列”。线程是操作系统进行任务调度的基本单位。

要知道，Linux并不存在真正意义上的线程。线程比进程往往是多对一的，即一切进程至少都有一个执行线程：

线程在进程内部运行，本质是在进程地址空间内运行的 ，如果Linux实现真的线程，那么就需要对这些线程进行管理。比如说创建线程、终止线程、调度线程、切换线程、给线程分配资源、释放资源以及回收资源等等，搞一套与进程类似的线程管理模块，整个难度就比较大。线程并没有独立的虚拟地址空间，只是在进程虚拟地址空间中拥有相对独立的一块空间：

1.3 线程的优点

线程的粒度小于进程，不论是创建、切换还是占用资源线程要付出的代价都更少，因此通常多线程比多进程并发性更高。
在等待慢速I/O操作结束的同时，程序可执行其他的计算任务。
计算密集型应用，为了能在多处理器系统上运行，将计算分解到多个线程中实现。
I/O密集型应用，为了提高性能，将I/O操作重叠。线程可以同时等待不同的I/O操作。

1.4 线程的缺点

性能损失

        一个很少被外部事件阻塞的计算密集型线程往往无法与共它线程共享同一个处理器。如果计算密集型线程的数量比可用的处理器多，那么可能会有较大的性能损失，这里的性能损失指的是增加了额外的同步和调度开销，而可用的资源不变。

健壮性降低

        编写多线程需要更全面更深入的考虑，在一个多线程程序里，因时间分配上的细微偏差或者因共享了不该共享的变量而造成不良影响的可能性是很大的，换句话说线程之间是缺乏保护的。比如：进程之间是相互独立的，我们打开各种软件，一个软件的崩溃并不会影响其他软件，变相的也就增加了进程的健壮性，而线程就不同了，因为大部分资源都是共享的，一个线程的崩溃就会导致其他所有线程崩溃，进而导致整个进程崩溃；

缺乏访问控制

        进程是访问控制的基本粒度，在一个线程中调用某些OS函数会对整个进程造成影响。

编程难度提高

        编写与调试一个多线程程序比单线程程序困难得多。

1.5 线程异常

单个线程如果出现除零，野指针问题导致线程崩溃，进程也会随着崩溃。
线程是进程的执行分支，线程出异常，就类似进程出异常，进而触发信号机制，终止进程，进程终止，该进程内的所有线程也就随即退出。

1.6 线程用途

合理的使用多线程，能提高CPU密集型程序的执行效率。
合理的使用多线程，能提高IO密集型程序的用户体验（如生活中我们一边写代码一边下载开发工具，就是多线程运行的一种表现）。

二、线程控制

2.1 POSIX线程库

与线程有关的函数构成了一个完整的系列，绝大多数函数的名字都是以“pthread_”打头的
要使用这些函数库，要通过引入头文<pthread.h>
链接这些线程函数库时要使用编译器命令的“-lpthread”选项：

2.2 创建一个新的线程

参数：

thread：返回线程ID
attr：设置线程的属性，attr为NULL表示使用默认属性
start_routine：是个函数地址，线程启动后要执行的函数
arg：传给线程启动函数的参数
返回值：成功返回0；失败返回错误码

错误检查：

传统的一些函数是，成功返回0，失败返回-1，并且对全局变量errno赋值以指示错误。
pthreads函数出错时不会设置全局变量errno（而大部分其他POSIX函数会这样做）。而是将错误代码通过返回值返回。
pthreads同样也提供了线程内的errno变量，以支持其它使用errno的代码。对于pthreads函数的错误，建议通过返回值判定，因为读取返回值要比读取线程内的errno变量的开销更小。

下面尝试使用一段代码创建线程：

#include<iostream>
#include<pthread.h>
#include<unistd.h>
using namespace std;
void* thread_func(void* args)
{
    while(true)
    {
        cout << "new thread running..." << endl;
        sleep(1);
    }
}
int main()
{
    pthread_t t;
    pthread_create(&t,nullptr,thread_func,nullptr);
    while(true)
    {
        cout<<"main thread is running..."<<endl;
        sleep(1);
    }
    return 0;
}

运行结果：

此时我们可以用一个Linux命令查找进程并输出相关信息：ps -aL

可以看到它们的PID是相同的，因为它们属于同一个进程，而LWP指的是轻量级进程ID（Linux中没有线程，而是叫做轻量级进程）。

2.3 线程ID及进程地址空间布局

pthread_ create函数会产生一个线程ID，存放在第一个参数指向的地址中。该线程ID和前面说的线程ID不是一回事。
前面讲的线程ID属于进程调度的范畴。因为线程是轻量级进程，是操作系统调度器的最小单位，所以需要一个数值来唯一表示该线程。
pthread_create函数第一个参数指向一个虚拟内存单元，该内存单元的地址即为新创建线程的线程ID，属于NPTL线程库的范畴。线程库的后续操作，就是根据该线程ID来操作线程的。
线程库NPTL提供了pthread_ self函数，可以获得线程自身的ID: pthread_t pthread_self(void)

pthread_t 到底是什么类型呢？取决于实现。对于Linux目前实现的NPTL实现而言，pthread_t类型的线程ID，本质就是一个进程地址空间上的一个地址。

2.4 线程终止

如果需要只终止某个线程而不终止整个进程,可以有三种方法:

从线程函数return。这种方法对主线程不适用,从main函数return相当于调用exit。
线程可以调用pthread_ exit终止自己。
一个线程可以调用pthread_ cancel终止同一进程中的另一个线程。

void pthread_exit(void *retval);

功能：线程终止
参数：retva表示线程退出时的退出码信息
返回值：无返回值，跟进程一样结束时无法返回自身。

intpthread_cancel(pthread_t thread);

功能：取消一个执行中的线程
参数：线程ID
返回值：成功返回0，失败返回错误码

2.5 线程等待

为什么需要线程等待？

已经退出的线程，其空间没有被释放，仍然在进程的地址空间内。
创建新的线程不会复用刚才退出线程的地址空间。

int pthread_ join(pthread_t thread，void **value_ptr);

功能：等待线程结束
参数：thread表示线程ID，value_ptr 指向一个指针，后者指向线程的返回值。
返回值：成功返回0，失败返回错误码。

调用该函数的线程将挂起等待，直到id为thread的线程终止，线程以不同的方法终止，通过pthread_join得到的终止状态是不同的：

如果thread线程通过return返回，retval 所指向的单元里存放的是thread线程函数的返回值。
如果thread线程被别的线程调用 pthread_cancel 异常终止掉，retval 所指向的单元里存放的是常数PTHREAD_CANCELED，就是 -1。
如果thread线程是自己调用 pthread_exit 终止的，retval 所指向的单元存放的是传给 pthread_exit 的参数。
如果对thread线程的终止状态不感兴趣，可以传NULL给 retval 参数。

2.6 线程分离

默认情况下，新创建的线程是joinable的，线程退出后，需要对其进行pthread_join操作，否则无法释放资源，从而造成系统泄漏。
如果不关心线程的返回值，join是一种负担，这个时候，我们可以告诉系统，当线程退出时，自动释放线程资源。

int pthread_detach(pthread_t thread);

可以是线程组内其他线程对目标线程进行分离，也可以是线程自己分离：

pthread_detach(pthread_self());

joinable和分离是冲突的，一个线程不能既是joinable又是分离的。