Linux中线程创建,线程退出,线程接合

线程的简单了解

之前我们了解过 task_struct 是用于描述进程的核心数据结构。它包含了一个进程的所有重要信息,并且在进程的生命周期内保持更新。我们想要获取进程相关信息往往从这里得到。

  • 在Linux中,线程的实现方式与进程类似,每个线程都有一个task_struct结构体,用于存储线程的信息。线程的task_struct结构体比进程的task_struct结构体要小,包含的信息更少。
  • 进程是操作系统资源分配的最小单位,而线程是操作系统调度的最小单位。
  • 线程之间的切换通常比进程切换更高效,因为线程共享进程的资源,不需要像进程切换那样保存和恢复大量的资源信息。

windows中的线程和Linux中线程区别 

在Windows操作系统,内核中有真线程,名为TCB :线程控制块。需要维护进程与线程之间的调度关系算法,这过于复杂。

 在Linux中,由于线程的控制块与进程控制块相似性非常高,所以直接复用了PCB的结构体——task_struct ,用PCB模拟线程的TCB。所以Linux没有真正意义上的线程,而是用进程方案模拟的线程。这样做的好处是复用代码和结构更简单,好维护,效率更高,也更安全。

线程的特性 

多线程的优点

  • 同时执行多个任务: 多线程允许程序同时执行多个任务,而不是按顺序一个接一个地执行。
  • 提高响应速度: 对于需要处理大量并发请求的程序(如Web服务器),多线程可以显著提高程序的响应速度。
  • 更小开销,更快的切换: 线程切换的开销也比进程切换要小,这使得多线程程序可以更高效地进行任务切换。
  • 在等待慢速I/O操作结束的同时,程序可执行其他的计算任务
  • 计算密集型应用,为了能在多处理器系统上运行,将计算分解到多个线程中实现,可以有效提高计算效率,但是注意:线程不是越多越好,正常情况下最合适的原则是:进程/线程与cpu个数/核数保持一致

多线程的缺点

  • 共享资源竞争 多个线程共享进程的地址空间,当它们同时访问和修改共享资源时,可能会出现竞争条件,导致数据不一致或程序错误。
  • 同步机制复杂 为了解决线程安全问题,需要使用线程同步机制(如互斥锁、条件变量等),这些机制会增加编程的复杂性,容易出错。
  • 上下文切换开销: 线程切换需要保存和恢复线程的上下文,这会消耗一定的CPU时间。过多的线程切换可能会降低程序的效率。
  • 线程间依赖: 线程之间可能存在依赖关系,一个线程的执行可能会影响到其他线程的执行。如果处理不当,可能会导致程序出现意外错误。
  • 调试困难:多线程程序的执行顺序是不确定的,这使得程序的调试变得更加困难。由于线程的执行受到多种因素的影响,一些错误可能很难复现,增加了调试的难度。

PROSIX线程库

与线程有关的函数构成了一个完整的系列,绝大多数函数的名字都是以pthread_打头的
要使用这些函数库,要通过引入头文件 <pthread.h>

并且链接这些线程函数库时要使用编译器命令的“-lpthread”选项

之前我们使用的都是linux中的基础标准库,这些标准库在编译的时候会自动帮我们进行链接,我们只需要包含一个头文件,不需要手动链接。但是对于线程库的话默认不会帮我们链接,除了需要我们程序中包含对应头文件,还需要编译的时候手动链接

包含头文件和编译时链接区分

  • 包含头文件(#include): 这是在源代码文件中做的,用于告诉编译器程序中使用了哪些函数、变量、类型等。头文件通常包含函数声明、宏定义、结构体定义等。
  • 编译时链接: 这是在编译命令中做的,用于告诉链接器将程序中使用的函数和变量与它们在库文件中的具体实现链接起来。库文件通常包含编译好的函数和变量的二进制代码。

包含头文件的作用:

  • 让编译器理解代码: 头文件相当于一个“接口说明书”,告诉编译器程序中使用了哪些“零件”(函数、变量等),以及这些“零件”的规格(参数类型、返回值类型等)。
  • 提供类型检查: 编译器可以根据头文件中的声明来检查程序中函数和变量的使用是否正确,避免类型错误。

编译时链接的作用:

  • 生成可执行文件: 链接器将程序中使用的函数和变量与它们在库文件中的实现“组装”起来,生成最终的可执行文件。
  • 链接外部代码: 程序中使用的某些函数和变量可能不是由自己编写的,而是由其他人或组织提供的,这些代码通常放在库文件中。链接器将这些外部代码链接到程序中,使得程序可以使用这些外部功能。

线程创建

pthread_create函数介绍

函数作用:创建一个新的线程。这个线程在创建后会并行执行指定的线程函数

头文件:#include <pthread.h>

函数原型

int pthread_create(pthread_t *thread,
                   const pthread_attr_t *attr,
                   void *(*start_routine) (void *),
                   void *arg);

参数

  • thread: 一个指向 pthread_t 类型变量的指针,用于存储新创建线程的 ID
  • attr: 一个指向 pthread_attr_t 类型变量的指针,用于设置新线程的属性。如果设置为 NULL,则使用默认属性。通常我们设置成NULL就行
  • start_routine: 一个函数指针,表示新线程要执行的函数。该函数必须接受一个 void * 类型的参数,并返回一个 void * 类型的值。
  • arg: 一个指向 void * 类型变量的指针,表示传递给 start_routine 线程函数的参数。如果我们不需要传递任何数据给线程函数,完全可以将它设置为 NULL

返回值

  • 成功: 返回 0。
  • 失败: 返回一个非零的错误码,表示创建线程失败的原因。

线程函数的定义

线程函数必须符合 void *(*start_routine)(void *) 的函数签名,即接收一个 void * 类型的参数并返回一个 void * 类型的值。

简单的线程创建例子

例子比较简单,主要就是创建了一个新的线程,然后主线程和新线程同时执行,主线程输出26个英文字母,新线程输出数字0-9。

编译代码的时候记得加上编译链接选项:-lpthread

gcc a.c -o a -lpthread
#include <stdio.h>
#include <pthread.h>

void *thread_function(void *arg) {
    int i=0;
    while(1){
        fprintf(stderr,"%d",i);
        i++;
        if(i==10){
            i=0;
        }
    }
}

int main() {
    pthread_t thread_id;
    int ret = pthread_create(&thread_id, NULL, thread_function, NULL);
    if (ret != 0) {
        perror("pthread_create failed");
        return 1;
    }
    printf("Thread created successfully\n");
    int i=0;
    while(1){
        fprintf(stderr,"%c",'a'+i);
        i++;
        if(i==26){
            i=0;
        }
    }
    return 0;
}

最终看到的效果就是主线程和新线程双线执行输出。

线程间共享资源与不共享资源

共享资源

  • 堆(Heap): 存储进程中动态分配的对象。
  • 代码段(Code Segment): 存储程序的指令。
  • 数据段(Data Segment): 存储进程的全局变量和静态变量
  • 文件描述符表: 存储进程打开文件的信息。
  • 信号处理函数: 用于处理进程接收到的信号。

不共享资源

  • 栈(Stack): 每个线程都有自己的栈,用于存储局部变量、函数调用信息等。
  • 寄存器(Registers): 每个线程都有一组寄存器,用于存储线程执行过程中的临时数据。
  • 线程 ID: 每个线程都有一个唯一的线程 ID,用于标识线程。

使用共享资源时需要注意的问题:

  • 竞态条件(Race Condition): 多个线程同时访问和修改共享资源时,可能会导致数据不一致的问题。
  • 死锁(Deadlock): 多个线程互相等待对方释放资源,导致程序无法继续执行的问题。

解决竞态条件和死锁问题的方法:

  • 互斥锁(Mutex): 用于保护共享资源,同一时刻只允许一个线程访问。
  • 条件变量(Condition Variable): 用于线程之间的同步,当一个线程等待某个条件满足时,可以使用条件变量进行阻塞。
  • 信号量(Semaphore): 用于控制同时访问共享资源的线程数量。

多线程共享资源同时访问出错例子

场景假设有一个共享的计数器变量 counter,初始值为 0。现在有多个线程同时对 counter 进行加 1 操作。

预期结果由于有 10 个线程,每个线程执行 100000 次加 1 操作,因此最终的 counter 值应该为 10 * 100000 = 1000000。

实际结果实际运行结果通常会小于 10000。

原因分析

当多个线程同时访问 counter 变量时,由于线程切换的存在,可能会导致以下情况:

  1. 线程 A 读取 counter 的值。
  2. 线程 A 被切换出去,线程 B 开始执行。
  3. 线程 B 读取 counter 的值。
  4. 线程 B 将 counter 的值加 1。
  5. 线程 B 被切换出去,线程 A 继续执行。
  6. 线程 A 将之前读取的 counter 值加 1,并写回。

这样,线程 A 和线程 B 都只进行了一次加 1 操作,但 counter 的值只增加了 1,而不是 2。这种情况称为竞态条件

解决方法可以使用互斥锁(Mutex)来保护共享资源 counter,确保同一时刻只有一个线程可以访问它。

通过使用互斥锁,可以保证每个线程对 counter 的加 1 操作都是原子性的,从而避免竞态条件,得到正确的结果。

#include <stdio.h>
#include <pthread.h>

#define NUM_THREADS 10
#define INCREMENTS 100000

int counter = 0;

void *increment_counter(void *arg) {
    for (int i = 0; i < INCREMENTS; i++) {
        counter++;
    }
    return NULL;
}

int main() {
    pthread_t threads[NUM_THREADS];

    for (int i = 0; i < NUM_THREADS; i++) {
        pthread_create(&threads[i], NULL, increment_counter, NULL);
    }

    //作用是等待多个线程执行结束。它通常出现在多线程程序中,
    //用于确保主线程在所有子线程完成任务后才退出。
    for (int i = 0; i < NUM_THREADS; i++) {
        pthread_join(threads[i], NULL);
    }

    printf("Expected counter value: %d\n", NUM_THREADS * INCREMENTS);
    printf("Actual counter value: %d\n", counter);

    return 0;
}

线程退出 

pthread_exit 函数介绍

 函数作用:结束调用该函数的线程,同时还可以传递一个退出状态值给其他线程

头文件:#include <pthread.h>

函数原型

void pthread_exit(void *retval);

参数

retval 参数可以用于传递一个退出状态值给其他线程,通常通过 pthread_join() 函数来接收这个值。如果不需要传递退出状态,可以将 retval 设置为 NULL。

僵尸线程

首先我们来回顾一下僵尸进程:

僵尸进程

  • 当一个进程结束运行时,内核不会立即释放它占用的所有资源,而是将其状态设置为僵尸态(Zombie)
  • 僵尸进程会保留一些基本信息(如进程ID、退出状态等),以便父进程可以获取到子进程的退出信息。
  • 父进程需要调用 wait()waitpid() 等函数来回收僵尸进程的资源,否则僵尸进程会一直存在,占用系统资源。

然后我们来看一下线程的僵尸态

与进程类似,当一个线程结束运行时,它也会进入一个类似于僵尸态的状态。

  • 状态保留: 线程退出后,其占用的大部分资源(如栈空间)会被自动回收,但是线程也会保留一些状态信息,例如退出状态,以便其他线程(通常是主线程)可以通过 pthread_join() 函数来获取。
     
  • 回收方式: 线程的“回收”主要通过 pthread_join() 函数来实现。当主线程调用 pthread_join() 函数等待某个线程结束时,实际上就是在“回收”该线程的状态信息。

僵尸态的重要性 

  • 无论是进程还是线程,僵尸态的存在都是为了让父进程或主线程能够获取到子进程或子线程的退出信息
  • 这些退出信息可能包含执行结果、错误码等,对于程序的调试和错误处理非常有帮助。

线程接合

pthread_join函数介绍

 函数作用:阻塞当前线程,直到指定的线程执行完毕,适用于线程间的同步

头文件:#include <pthread.h>

函数原型

int pthread_join(pthread_t thread, void **retval);

参数

thread:要等待的线程的线程 ID。这是一个由 pthread_create 创建的线程 ID。

retval:这是一个指向指针的指针,函数会把目标线程的退出状态通过该指针返回。如果目标线程没有返回任何值,可以传递 NULL。

其实我蛮不理解这里为什么使用二级指针的,在我看来pthread_exit 传递的参数是一个一级指针,但是这里pthread_join选择一个一级指针来对应赋值就可以了,不太理解为什么要使用二级指针

 

返回值

  • 成功: 返回 0。
  • 失败: 返回一个非零的错误码。

适用场景

  • 同步线程: 当一个线程需要等待另一个线程完成后才能继续执行时,可以使用 pthread_join() 函数进行同步。
  • 获取线程返回值: 有些线程会返回一个值,表示它们的执行结果。可以使用 pthread_join() 函数获取这个返回值。
  • 资源回收: 当一个线程结束后,它的资源不会立即被释放。需要调用 pthread_join() 函数才能回收这些资源。

 线程分离态(了解)

线程的默认状态

默认情况下,新创建的线程都处于非分离态 (Joinable State)。这意味着:

  1. 资源回收: 当一个线程结束运行时,它所占用的资源(如栈空间)不会立即被释放,而是会保留一段时间,直到有其他线程调用 pthread_join() 函数来“回收”该线程。
  2. 获取退出状态: 其他线程可以通过调用 pthread_join() 函数来等待该线程结束,并获取它的退出状态。

什么是分离态?

分离态 (Detached State) 是一种特殊的线程状态。当一个线程被设置为分离态时,它与创建它的线程(通常是主线程)之间的关系就会被“分离”。这意味着:

  1. 自动资源回收: 当一个分离态线程结束运行时,它所占用的资源会被自动回收,无需其他线程调用 pthread_join() 函数。
  2. 无法获取退出状态: 其他线程无法通过 pthread_join() 函数来等待分离态线程的结束,也无法获取它的退出状态。

如何设置线程为分离态?

方法一

pthread_detach(thread_id);

这个函数可以直接将指定线程设置为分离状态。

但是你可能会想如何获得一个线程自身的线程tid呢?其实很简单,有一个函数pthread_self可以很容易帮我们获取到当前线程的tid。

这个函数在后面一篇文章中也会详细讲到,这里只是简单提一下。

函数原型:pthread_t pthread_self(void);

所以我们常常将 pthread_self 配合 pthread_detach 一起使用,像下面这样:

pthread_detach(pthread_self());

方法二

使用pthread_create函数创建线程的时候,有一个参数可以设置新创建的线程的属性。我们可以凭借这个参数来设置线程为分离态,这种方式相比于方法一,更加麻烦,但是有着自己的优点,之后我们会详细讲到,这里不详细阐述。

适用场景

有些情况下,我们对于某些线程来说不关心它的返回状态,并且也不想要使用pthread_join来阻塞等待回收这个死后的僵尸线程。那么此时我们就可以把这个线程设置成分离态度,当线程死亡自动释放,不需要其他线程调用pthread_join来回收这个僵尸进程的资源。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/972209.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

用deepseek学大模型08-长短时记忆网络 (LSTM)

deepseek.com 从入门到精通长短时记忆网络(LSTM),着重介绍的目标函数&#xff0c;损失函数&#xff0c;梯度下降 标量和矩阵形式的数学推导&#xff0c;pytorch真实能跑的代码案例以及模型,数据&#xff0c; 模型应用场景和优缺点&#xff0c;及如何改进解决及改进方法数据推导…

力扣 买卖股票的最佳时机

贪心算法典型例题。 题目 做过股票交易的都知道&#xff0c;想获取最大利润&#xff0c;就得从最低点买入&#xff0c;最高点卖出。这题刚好可以用暴力&#xff0c;一个数组中找到最大的数跟最小的数&#xff0c;然后注意一下最小的数在最大的数前面即可。从一个数组中选两个数…

mysql的rpm包安装

(如果之前下载过mariadb&#xff0c;使用yum remove mariadb卸载&#xff0c;因为mariadb与rpm包安装的mysql有很多相似的组件和文件&#xff0c;会发生冲突&#xff0c;而源码包安装的mysql不会&#xff0c;所以不用删除源码包安装myqsl&#xff0c;只删除mariadb就可以&#…

vue3 子组件属性响应性丢失分析总结(四)

一、先看例子&#xff1a; <script setup lang"ts"> import { onMounted, reactive, ref, watch } from vue; import Test from /components/Test.vue;let a {a:"a"};const aRef ref(a);var aReactive reactive(a);let bObj "B";cons…

Jenkins同一个项目不同分支指定不同JAVA环境

背景 一些系统应用,会为了适配不同的平台,导致不同的分支下用的是不同的gradle,导致需要不同的JAVA环境来编译,比如a分支需要使用JAVA11, b分支使用JAVA17。 但是jenkins上,一般都是Global Tool Configuration 全局所有环境公用一个JAVA_HOME。 尝试过用 Build 的Execut…

实现可拖拽的 Ant Design Modal 并保持下层 HTML 可操作性

前言 在开发复杂的前端界面时&#xff0c;我们常常需要一个可拖拽的弹窗&#xff08;Modal&#xff09;&#xff0c;同时又希望用户能够在弹窗打开的情况下操作下层的内容。Ant Design 的 Modal 组件提供了强大的功能&#xff0c;但默认情况下&#xff0c;弹窗会覆盖整个页面&…

网络安全三件套

一、在线安全的四个误解     Internet实际上是个有来有往的世界&#xff0c;你可以很轻松地连接到你喜爱的站点&#xff0c;而其他人&#xff0c;例如黑客也很方便地连接到你的机器。实际上&#xff0c;很多机器都因为自己很糟糕的在线安全设置无意间在机器和系统中留下了“…

Jetson Agx Orin平台JP6.0-r36.3版本修复了vi模式下的原始图像损坏(线条伪影)

1.问题描述 这是JP-6.0 GA/ l4t-r36.3.0的一个已知问题 通过vi模式捕获的图像会导致异常线条 参考下面的快照来演示这些线伪影 这个问题只能通过VI模式进行修复,不应该通过LibArgus看到。 此外,这是由于内存问题。 由于upstream已经将属性名称更改为“dma-noncoherent”…

封装neo4j的持久层和服务层

目录 持久层 mp 模仿&#xff1a; 1.抽取出通用的接口类 2.创建自定义的repository接口 服务层 mp 模仿&#xff1a; 1.抽取出一个IService通用服务类 2.创建ServiceImpl类实现IService接口 3.自定义的服务接口 4.创建自定义的服务类 工厂模式 为什么可以使用工厂…

Spring Boot (maven)分页2.0版本

前言&#xff1a; 通过实践而发现真理&#xff0c;又通过实践而证实真理和发展真理。从感性认识而能动地发展到理性认识&#xff0c;又从理性认识而能动地指导革命实践&#xff0c;改造主观世界和客观世界。实践、认识、再实践、再认识&#xff0c;这种形式&#xff0c;循环往…

Docker安装Minio对象存储

介绍 MinIO 是一种对象存储解决方案&#xff0c;提供与Amazon Web Services S3兼容的API并支持所有核心S3功能。MinIO可部署在任何地方&#xff1a;公共云或私有云、裸机基础设施、编排环境和边缘基础设施。 详情参见官方文档&#xff1a;MinIO Object Storage for Container…

BERT 大模型

BERT 大模型 EmbeddingTransformer预微调模块预训练任务 BERT 特点 : 优点 : 在语言理解相关任务中表现很好缺点 : 更适合 NLU 任务&#xff0c;不适合 NLG 任务 BERT 架构&#xff1a;双向编码模型 : Embedding 模块Transformer 模块预微调模块 Embedding Embedding 组成 …

cmake:定位Qt的ui文件

如题。在工程中&#xff0c;将h&#xff0c;cpp&#xff0c;ui文件放置到不同文件夹下&#xff0c;会存在cmake找不到ui文件&#xff0c;导致编译报错情况。 cmake通过指定文件路径&#xff0c;确保工程找到ui文件。 标识1&#xff1a;ui文件保存路径。 标识2&#xff1a;添加…

DFS算法篇:理解递归,熟悉递归,成为递归

1.DFS原理 那么dfs就是大家熟知的一个深度优先搜索&#xff0c;那么听起来很高大尚的一个名字&#xff0c;但是实际上dfs的本质就是一个递归&#xff0c;而且是一个带路径的递归&#xff0c;那么递归大家一定很熟悉了&#xff0c;大学c语言课程里面就介绍过递归&#xff0c;我…

H5自适应响应式代理记账与财政咨询服务类PbootCMS网站模板 – HTML5财务会计类网站源码下载

(H5自适应)响应式代理记账财政咨询服务类pbootcms网站模板 html5财务会计类网站源码下载 为了提升系统安全&#xff0c;请将后台文件admin.php的文件名修改一下。修改之后&#xff0c;后台登录地址就是&#xff1a;您的域名/您修改的文件名.php 模板特点&#xff1a; 1&#x…

嵌入式音视频开发(二)ffmpeg音视频同步

系列文章目录 嵌入式音视频开发&#xff08;零&#xff09;移植ffmpeg及推流测试 嵌入式音视频开发&#xff08;一&#xff09;ffmpeg框架及内核解析 嵌入式音视频开发&#xff08;二&#xff09;ffmpeg音视频同步 嵌入式音视频开发&#xff08;三&#xff09;直播协议及编码器…

工业自动化丨工业控制系统五层架构以及PLC、SCADA系统、DCS系统,从零基础到精通,收藏这篇就够了!

工业控制系统通常是几种类型控制系统的总称&#xff0c;包括监控和数据采集&#xff08;SCADA&#xff09;系统、分布式控制系统&#xff08;DCS&#xff09;和可编程逻辑控制器&#xff08;PLC&#xff09;以及其它控制系统。 【右下角**点赞、**转发、在看&#xff0c;为企业…

✨1.HTML、CSS 和 JavaScript 是什么?

✨✨ HTML、CSS 和 JavaScript 是构建网页的三大核心技术&#xff0c;它们相互协作&#xff0c;让网页呈现出丰富的内容、精美的样式和交互功能。以下为你详细介绍&#xff1a; &#x1f98b;1. HTML&#xff08;超文本标记语言&#xff09; 定义&#xff1a;HTML 是一种用于描…

MySQL基本操作——包含增删查改(环境为Ubuntu20.04,MySQL5.7.42)

1.库的操作 1.1 创建数据库 语法&#xff1a; 说明&#xff1a; 大写的表示关键字 [] 是可选项 CHARACTER SET: 指定数据库采用的字符集 COLLATE: 指定数据库字符集的校验规则 1.2 创建案例 创建一个使用utf8字符集的db1数据库 create database db1 charsetutf8; …

【项目】基于STM32F103C8T6的四足爬行机器人设计与实现(源码工程)

&#x1f449;博__主&#x1f448;&#xff1a;米码收割机 &#x1f449;技__能&#x1f448;&#xff1a;C/Python语言 &#x1f449;专__注&#x1f448;&#xff1a;专注主流机器人、人工智能等相关领域的开发、测试技术。 【项目】基于STM32F103C8T6的四足爬行机器人设计与…