【Linux】第四十站:线程概念

文章目录

  • 一、线程
  • 二、Linux中线程应该如何理解
  • 三、重新定义线程
  • 四、四谈进程地址空间(页表相关)
  • 五、Linux线程周边的概念
    • 1. 线程与进程切换
    • 2.线程优点
    • 3.线程缺点
    • 4.线程异常
    • 5.线程用途

一、线程

线程:是进程内的一个执行分支。线程的执行粒度,要比进程要细

  • 在一个程序里的一个执行路线就叫做线程(thread)。更准确的定义是:线程是“一个进程内部的控制序列”
  • 一切进程至少都有一个执行线程
  • 线程在进程内部运行,本质是在进程地址空间内运行
  • 在Linux系统中,在CPU眼中,看到的PCB都要比传统的进程更加轻量化
  • 透过进程虚拟地址空间,可以看到进程的大部分资源,将进程资源合理分配给每个执行流,就形成了线程执行流

二、Linux中线程应该如何理解

如下图所示的内容,我们都是可以理解的

image-20240227182959872

我们可以注意到,我们进程所能看到的资源都是通过地址空间+页表才能看到的。

所以地址空间是进程的资源窗口

而进程的独立性是,当我们创建好一个子进程的时候,他们就有了不同内核数据结构,他们就可以映射到不同的物理地址中

image-20240227183402212

如果我们再创建一个进程,并且它不创建新的地址空间。而是去共享地址空间,直接把原来地址空间中的一部分给他,并且和内存建立映射

image-20240227184003058

那么这些进程它的执行粒度就更细了,因为它只执行那一点点,我们将这样的进程称为线程

Linux的具体的实现线程的方案:

  1. 再linux中,线程在”进程内部“执行,线程在进程的地址空间内运行(为什么?)

    我们知道任何执行流要执行,都要有资源!进程空间是进程的资源窗口。

  2. 在linux中,线程的执行粒度要比进程更细,代码执行进程代码的一部分

    进程它访问的时候更粗犷一些,而线程是比较细一些的

    在CPU看来,它不知道也不需要知道哪个task_struct是进程还是线程。

    CPU只有调度执行流的概念

在不通过的平台中,实现线程的方案各有不同。

三、重新定义线程

什么叫做线程?

  • 我们认为线程是操作系统调度的基本单位

起初我们认为进程=内核数据结构(task_struct) + 代码和数据

上面的当然是正确的。

其实:像下面的红色框所圈的部分,这才是进程!,进程 = 一大堆的执行流+进程地址空间+页表+在物理内存中所占据的代码和数据

image-20240227190148635

所以我们可以重新理解进程:

内核观点:进程是承担分配系统资源的基本实体

那么执行流是资源吗?当然是的!

所以线程和进程的关系就是,进程是包含线程的

因为进程是承担分配系统资源的基本实体

而线程是内部的执行流资源

如何理解,我们以前谈的这个进程?(下图的)

image-20240227190723565

操作系统以进程为单位,给我们分配资源,只不过我们当前的进程内部,只有一个执行流!

在我们的系统中,进程:线程一定是1:n的,至少也是1:1。所以linux系统中线程一旦躲起来,它也要进行管理。所以还是我们曾经说的那六个字 先描述,在组织,它也是要管理线程的

在大部分的教材中,存在一个tcb

struct tcb;//therad ctrl block

所以就需要创建tcb之后,然后将他们组织起来

而windows就这样干了,就是为每个线程创建tcb,然后把进程和线程管理起来

而对于linux系统,它直接复用了进程数据结构和管理算法。使用下面的去模拟线程

struct task_struct //模拟线程

所以Linux没有真正意义上的线程而是用”进程“(用它的内核数据结构)模拟的线程

那么windows的方案还是linux的方案。那么更好呢?

当然那是linux中的,因为像如果专门设计一个tcb的话,那么中间必然有大量的相似的代码,就会导致它的维护成本直线上升。它的健壮性就不够好了。

所以其实linux有线程,不过它没有真正意义上的线程罢了。它用的是进程的数据结构去模拟的线程(进程还包括代码和数据,这里我们只用内核数据结构)

站在我们CPU的视角上,CPU无法区分是线程还是进程

但是在在CPU的视角线程(tcb)<=执行流(进程模拟的线程)<=进程

我们将Linux当中的执行流,称之为轻量级进程

举个例子,在我们的家庭中。我们的每个人都有自己的任务,我们要学习,父母要赚钱,爷爷奶奶要养好身体。所有人都有自己的任务,但是所有人的共同目标是将家里的日子过好。这个家就是一个进程,而每个人就是一个线程。而进程中的哪些其他资源都是给这些对应的执行流的。

而我们的创建进程,就需要创建这些资源,其实就好比买房买车

四、四谈进程地址空间(页表相关)

如何理解资源分配给线程??


如下图所示,是我们曾经所提及的内容,CPU中一个CR3寄存器指向页表,还有一个寄存器指向task_struct,物理内存也是被划分为一个个的也页框,磁盘中的可执行程序也是按照4KB的大小放的

image-20240228152541018

而4KB其实就是2^12


虚拟地址是如何转换到物理地址的???

当我们将物理地址读到CPU的时候,这里是虚拟地址

image-20240228154305815

我们这里以32位计算机虚拟地址为例

虚拟地址就是32位的。其实这个32位的虚拟地址不是一个整体:而是10 + 10 +12

其次页表也不是一整块的。如果它是整块的,假设我们页表的一行是10个字节(它至少也有四个字节的虚拟地址,四个字节的物理地址,还有一些其他的标志位,我们这里为了方便计算,就按10字节来计算)

如果我们的页表是满的话,它有2^32次方个条目,每行10字节,总共需要40GB!

我们会发现,整个内存全放页表都放不下,更何况这只是一个页表,所以计算机中肯定不可能是页表是一整块的

其实32位是被拆成两级的

第一级页表是1024个条目。每一个条目,还存放另一个二级页表,而每个二级页表也有1024个条目。如下图所示是页表的真实面目

image-20240228164902379

我们可以来计算一下此时的页表有多大

一个二级页表假设每一个页表表项是4字节,那么它一共是4KB。其实这刚好是一个页框。而他一共最多有1024个二级页表。所以是4MB

它相比上面的结构,已经大大减少了内存了。而且二级页表也不一定是全部存在的,大部分情况下二级页表都是不全的。

所以创建一个进程其实依旧是一个”很重“的工作

现在我们已经找到了这个数据的地址了。可是我们访问的时候访问的是4个字节等。这如何找到呢?所以这里就需要用类型了,它会认识这个int。然后就会取出四个字节。这些类型是给CPU看的,CPU就知道了读取几个字节了。

起始地址+类型==>起始地址+偏移量

image-20240228172029332


所以如何理解资源分配呢?

线程分配资源的本质,本质是分配地址空间范围

五、Linux线程周边的概念

1. 线程与进程切换

我们知道线程比进程要更轻量化(为什么?)

  1. 创建和释放更加轻量化(创建线程只需要创建tcb,进程还有一堆进程地址空间,页表等…)
  2. 切换更加轻量化(运行时,页表等不需要切换)

整个生命周期都是更加轻量化的

线程的执行本质就是进程的执行,因为线程是进程的一个分支

所以CPU内还有一个硬件级别的缓存:Cache(它里面就是一些缓存的热数据)

CPU在切换线程的时候,上下文虽然一直在变化,但是缓存一直不变,或者在少量更新。而进程切换的时候,它的这些Cache里面的热数据都要被丢弃掉,重新缓存新的数据。所以进程内的线程切换时,Cache内的数据不需要重新缓存。

那么我们怎么知道当前切换的线程是进程被切换了,还是一个线程内的被切换了。所以我们需要对每个线程作一个标识,第一个创建的线程是主线程,其他的线程就是新线程

image-20240228172150238


2.线程优点

  • 创建一个新线程的代价要比创建一个新进程小得多
  • 与进程之间的切换相比,线程之间的切换需要操作系统做的工作要少很多
  • 线程占用的资源要比进程少很多
  • 能充分利用多处理器的可并行数量
  • 在等待慢速I/O操作结束的同时,程序可执行其他的计算任务
  • 计算密集型应用,为了能在多处理器系统上运行,将计算分解到多个线程中实现
  • I/O密集型应用,为了提高性能,将I/O操作重叠。线程可以同时等待不同的I/O操作。

3.线程缺点

  • 性能损失
  • 一个很少被外部事件阻塞的计算密集型线程往往无法与共它线程共享同一个处理器。如果计算密集型线程的数量比可用的处理器多,那么可能会有较大的性能损失,这里的性能损失指的是增加了额外的同步和调度开销,而可用的资源不变。
  • 健壮性降低
  • 编写多线程需要更全面更深入的考虑,在一个多线程程序里,因时间分配上的细微偏差或者因共享了不该共享的变量而造成不良影响的可能性是很大的,换句话说线程之间是缺乏保护的。
  • 缺乏访问控制
  • 进程是访问控制的基本粒度,在一个线程中调用某些OS函数会对整个进程造成影响。
  • 编程难度提高
  • 编写与调试一个多线程程序比单线程程序困难得多

4.线程异常

  • 单个线程如果出现除零,野指针问题导致线程崩溃,进程也会随着崩溃
  • 线程是进程的执行分支,线程出异常,就类似进程出异常,进而触发信号机制,终止进程,进程终止,该进程内的所有线程也就随即退出

5.线程用途

  • 合理的使用多线程,能提高CPU密集型程序的执行效率
  • 合理的使用多线程,能提高IO密集型程序的用户体验(如生活中我们一边写代码一边下载开发工具,就是多线程运行的一种表现

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/440919.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

事务失效问题

1&#xff0c;事务方法非public修饰 由于Spring的事务是基于AOP的方式结合动态代理来实现的。因此事务方法一定要是public的&#xff0c;这样才能便于被Spring做事务的代理和增强。 2&#xff0c;非事务方法调用事务方法 Service public class OrderService {public void creat…

Linux grep

文章目录 1. 基本用法2.字符转义3.二进制文件查找4.打印目标字段的附近行4. 多条件过滤5. 目录中过滤——用于在文件夹中筛选/排除指定后缀文件6.反向过滤——用于筛选7.只输出匹配内容——用于统计8. 筛选出包含字段的文件9.正则匹配10.管道和grep11.grep和wc/uniq/sort的合用…

【考研数学】李林《880》vs 李永乐《660》完美使用搭配

没有说谁一定好&#xff0c;只有适不适合自身情况&#xff0c;针对自身弱点选择性价比才最高。 两者侧重点不同&#xff0c;660适合强化前期&#xff0c;弥补基础的不足&#xff0c;880适合强化后期&#xff0c;题型全面&#xff0c;提高我们对综合运用知识的能力。 选择习题…

2.4_1 死锁的概念

文章目录 2.4_1 死锁的概念&#xff08;一&#xff09;什么是死锁&#xff08;二&#xff09;死锁、饥饿、死循环的区别&#xff08;三&#xff09;死锁产生的必要条件&#xff08;四&#xff09;什么时候会发生死锁&#xff08;五&#xff09;死锁的处理策略 总结 2.4_1 死锁的…

MySQL 存储过程(超详细)

一、什么是存储过程&#xff1f; 存储过程可称为过程化SQL语言&#xff0c;是在普通SQL语句的基础上增加了编程语言的特点&#xff0c;把数据操作语句(DML)和查询语句(DQL)组织在过程化代码中&#xff0c;通过逻辑判断、循环等操作实现复杂计算的程序语言。换句话说&#xff0c…

JVM-虚拟机栈概述

背景&#xff1a;由于跨平台的设计&#xff0c;java指令都是根据栈来设计的。不同平台CPU架构不同&#xff0c;所以不能设计为基于寄存器。 栈是运行时单位&#xff0c;而堆是存储的单位。即&#xff1a;栈解决程序运行的问题&#xff0c;即程序如何执行&#xff0c;或者说如何…

瑞芯微 | I2S-音频基础 -1

最近调试音频驱动&#xff0c;顺便整理学习了一下i2s、alsa相关知识&#xff0c;整理成了几篇文章&#xff0c;后续会陆续更新。 喜欢嵌入式、Li怒晓得老铁可以关注一口君账号。 1. 音频常用术语 名称含义ADC&#xff08;Analog to Digit Conversion&#xff09;模拟信号转换…

TCP重传机制、滑动窗口、拥塞控制

一、总述 TCP&#xff0c;Transmission Control Protocol&#xff0c;是一个面向连接、基于流式传输的可靠传输协议&#xff0c;考虑到的内容很多&#xff0c;比如数据包的丢失、损坏、分片和乱序等&#xff0c;TCP协议通过多种不同的机制来实现可靠传输。今天&#xff0c;重点…

代码随想录算法训练营第三十九天|62.不同路径、63. 不同路径 II

62.不同路径 刷题https://leetcode.cn/problems/unique-paths/description/文章讲解https://programmercarl.com/0062.%E4%B8%8D%E5%90%8C%E8%B7%AF%E5%BE%84.html视频讲解https://www.bilibili.com/video/BV1ve4y1x7Eu/?vd_sourceaf4853e80f89e28094a5fe1e220d9062 题解&…

基于YOLOv5的无人机视角水稻杂草识别检测

&#x1f4a1;&#x1f4a1;&#x1f4a1;本文主要内容:详细介绍了无人机视角水稻杂草识别检测整个过程&#xff0c;从数据集到训练模型到结果可视化分析。 博主简介 AI小怪兽&#xff0c;YOLO骨灰级玩家&#xff0c;1&#xff09;YOLOv5、v7、v8优化创新&#xff0c;轻松涨点…

探讨2024年AI辅助研发的趋势

一、引言 随着科技的飞速发展&#xff0c;人工智能&#xff08;AI&#xff09;已经成为当今时代最具变革性的技术之一。AI的广泛应用正在重塑各行各业&#xff0c;其中&#xff0c;AI辅助研发作为科技和工业领域的一大创新热点&#xff0c;正引领着研发模式的深刻变革。从医药…

用WSGI发布flask到centos7.9

起因 想把自己的Flask或者Django网站&#xff0c;发布到服务器上&#xff0c;让大家都可以访问。网上搜的结果&#xff0c;要么是用NginxuWSGI&#xff0c;要么是用NginxGunicorn。大名鼎鼎的Nginx我早有耳闻&#xff0c;那么两位俩玩意是啥呢。 WSGI是什么 uwsgi是Nginx和w…

用pyqt5实现的滑动开关(有动画效果)

1、效果展示 2、控件源码 import sys from PyQt5.QtCore import Qt, QRect, QPoint, QVariantAnimation from PyQt5.QtGui import QPainter, QColor from PyQt5.QtWidgets import QApplication, QWidget, QHBoxLayoutclass SwitchButton(QWidget):def __init__(self, parent=N…

华为设备小型园区网方案(有线+无线+防火墙)

&#xff08;一&#xff09;配置有线部分 1.配置LSW2 &#xff08;1&#xff09;创建相关vlan [LSW2]vlan batch 10 3000 &#xff08;2&#xff09;配置连接LSW1的Eth-Trunk1&#xff0c;透传VLAN 10 3000 [LSW2]int Eth-Trunk 1 [LSW2-Eth-Trunk1]port link-type trunk [LSW2…

关于Linux上的$ORIGIN解说

1、Linux RPATH & $ORIGIN 许多现代C / C 项目都利用Autotools创建GNU构建系统&#xff0c;例如 根据平台生成make文件。 可执行文件&#xff08;二进制文件&#xff09;在生成/编译过程中生成&#xff0c;并且可以在执行编译的计算机上本地执行。 但是&#xff0c;如果将…

centos 系统 yum 无法安装(换国内镜像地下)

centos 系统 yum 因为无法连接到国外的官网而无法安装&#xff0c;问题如下图&#xff1a; 更换阿里镜像&#xff0c;配置文件路径&#xff1a;/etc/yum.repos.d/CentOS-Base.repo&#xff08;如果目录有多余的文件可以移动到子目录&#xff0c;以免造成影响&#xff09; bas…

【PyTorch][chapter 22][李宏毅深度学习]【无监督学习][ WGAN]【理论一】

简介&#xff1a; 2014年Ian Goodfellow提出以来&#xff0c;GAN就存在着训练困难、生成器和判别器的loss无法指示训练进程、生成样本缺乏多样性等问题。从那时起&#xff0c;很多论文都在尝试解决&#xff0c;但是效果不尽人意&#xff0c;比如最有名的一个改进DCGAN依靠的是对…

B端系统优化,可不是换个颜色和图标,看看与大厂系统的差距。

Hi&#xff0c;我是贝格前端工场&#xff0c;优化升级各类管理系统的界面和体验&#xff0c;是我们核心业务之一&#xff0c;欢迎老铁们评论点赞互动&#xff0c;有需求可以私信我们 一、不要被流于表面的需求描述迷惑。 很多人找我们优化系统界面&#xff0c;对需求总是轻描淡…

开源模型应用落地-工具使用篇-Ollama(六)

一、前言 在AI大模型百花齐放的时代&#xff0c;很多人都对新兴技术充满了热情&#xff0c;都想尝试一下。但是&#xff0c;实际上要入门AI技术的门槛非常高。除了需要高端设备&#xff0c;还需要面临复杂的部署和安装过程&#xff0c;这让很多人望而却步。不过&#xff0c;随着…

设计模式大题做题记录

设计模式大题 09年 上半年&#xff1a; 09年下半年 10年上半年 10年下半年 11年上半年 11年下半年 12年上半年 12年下半年 13年上半年 13年下半年