Linux:线程概念 线程控制

Linux:线程概念 & 线程控制

    • 线程概念
      • 轻量级进程 LWP
      • 页表
    • 线程控制
      • POSIX 线程库 - ptherad
      • 线程创建
        • pthread_create
        • pthread_self
      • 线程退出
        • pthread_exit
        • pthread_cancel
        • pthread_join
        • pthread_detach
    • 线程架构
      • 线程与地址空间
      • 线程与pthread动态库
    • 线程的优缺点


线程概念

假设某个进程要在输出1 - 10的同时,让另外一个执行流去输出11 - 20,应该怎么办?

如果从进程的角度出发,我们可以创建一个子进程,让父子进程同时跑,比如这样:

int main()
{
    pid_t id = fork();

	//子进程
    if (id == 0)
    {
        for (int i = 1; i <= 10; i++)
        {
            cout << i << endl;
            sleep(1);
        }

        exit(0);
    }
	
	//父进程
    for (int i = 11; i <= 20; i++)
    {
        cout << i << endl;
        sleep(1);
    }

    return 0;
}

输出结果:

在这里插入图片描述

这样确实可以做到让两个执行流同时运行,从而提高效率,但是代价太大了。这种方式是通过创建一个子进程实现的,而一个进程需要额外创建PCB进程地址空间页表等等。

CPU调度进程的时候,本质是在调度进程的PCB,把进程的PCB放到运行队列中,然后CPU依次执行队列中的进程。也就是说,如果我们想要让一个进程被CPU多次执行,从而让一个进程有多个执行流,只需要创建更多的PCB就可以了。在没学习到线程前,我们认为一个进程只有一个PCB,实则不然,一个进程可以有多个PCB(仅对Linux而言)。

而对于同一个进程的每一个PCB,都算作一个线程

在这里插入图片描述

线程是进程内部的一个执行分支,是CPU调度的基本单位

每个线程都会拿到同一个进程的不同部分代码,从而让多个区域的代码一起执行,提高进程的效率。

我们再辨析一下进程线程的关系:

在这里插入图片描述

进程 = 内核数据结构 + 代码和数据

上图中,多个PCB进程地址空间页表等都属于进程的内核数据结构,因此这些所有内容加起来,才算做进程

进程是承担系统资源分配的基本实体

因为多个线程是共享地址空间,页表等等,所以一个线程不可能去承担系统的资源分配,反而来说,线程是被分配资源的。操作系统分配资源时,以进程为单位,当一个进程拿到资源后,再去分配给不同的线程


轻量级进程 LWP

其实我刚刚的所有描述,都是针对Linux而言的。大部分操作系统的处理线程的方式,并不是直接创建多个PCB,而是额外设计了一个TCB (Thread Contrl Block)

在这里插入图片描述

多个TCB分别控制不同部分的代码,CPU调度线程时,也去调度TCB。比如主流的WindowsMacOS等操作系统,都是这样做的。

但是Linux认为:PCB就已经可以被CPU调度了,进程调度已经有一套很完善的体系了,如果再额外给线程设计一套线程的调度解决方案,未免太多余了。因此Linux中没有设计TCB这样的结构,而是直接复用PCB来实现线程

Linux中,一个进程可以有多个PCBPCB的数目为1,那么这个PCB可以代表一个进程;如果PCB数目有多个,那么这个PCB代表一个进程的多个线程

因此在Linux中,没有真正的线程,一个执行流由一个PCB维护。一个执行流既有可能表示一个进程,也有可能表示一个线程。Linux把这种介于线程进程之间的状态,称为轻量级进程 LWP (Light Weight Process)

Linux中所有对线程的操作,本质都是对轻量级进程的操作

接下来在一个进程内部创建两个线程,观察一些现象。如何创建线程,在本博客的线程控制部分会讲解,现在大家只需要观察现象,知道我的一个进程内部有两个线程即可。

在这里插入图片描述

上图中,为两个线程同时输出,第一个线程输出I am thread - 1,第二个线程输出I am thread - 2

我们先通过 ps -ajx观察一下进程test.exe的状态:

在这里插入图片描述

看可以看到只有一个进程,PID = 141776,也就是这两个线程同属于一个进程。

如果想要观察线程,需要指令ps -aL

在这里插入图片描述

可以看到,确实是有两个叫做test.exe线程的,它们的PID都是141776,但是它们的LWP不同。一个LWP = 141776,另外一个LWP = 141777,而LWP就是我们刚刚说的轻量级进程。

另外的,你会发现第一个线程的PID = LWP = 141776,说明这个线程是主线程,其余的所有线程都是这个主线程创造的。


页表

那么进程是如何实现把资源分配给多个线程的呢?这就要谈一谈页表了。

先看一看内存磁盘是如何管理的:

在这里插入图片描述

不论是内存还是磁盘,都被划分为了以4kb为单位的数据块,一个数据块可以被称为页框 / 页帧

操作系统管理内存,或者管理磁盘,都是以4kb为基本单位的。比如把磁盘中的数据加载到内存中,就是以4kb为基本单位进行拷贝id。

页框是被struct page管理的,Linxu 2.6.10中,struct page源码如下:

struct page 
{
	page_flags_t flags;		
	atomic_t _count;		
	atomic_t _mapcount;	
	unsigned long private;		
	struct address_space *mapping;
	pgoff_t index;
	struct list_head lru;	
	
#if defined(WANT_PAGE_VIRTUAL)
	void *virtual;	
#endif 
};

操作系统想要管理所有的页框,只需要创建一个数组,数组的元素类型是struct page。此时操作系统对内存或磁盘的管理,就变成了对数组的增删查改。而且从上方的struct page源码中可以发现,它是不存储页框的起始地址和终止地址的,因为可以通过下标计算出起始地址,起始地址 + 4kb就可以求出终止地址。

那么这个页框页表有什么关系呢?

我们以32位操作系统为例,页表的结构如下:

在这里插入图片描述

页表的任务是把虚拟地址解析为物理地址,当传入一个虚拟地址,页表就要对其解析。一个32位的地址,会被分为三部分,第一部分是前10位,第二部分是中间10位,第三部分是末尾12位。

第一部分就是上图中的深蓝色部分,其由页目录进行解析。 2 10 = 1024 {\color{Red} 2 ^ {10} = 1024} 210=1024,即前10位地址有1024种可能,而页目录就是一个长度为1024的数组。解析地址时,先通过前10位,在页目录中找到对应的下标。每个页目录的元素,指向一个页表

第二部分是上图中的黄色部分,其由页表进行解析,同样的 2 10 = 1024 {\color{Red} 2 ^ {10} = 1024} 210=1024,即中间10位地址也1024种可能,所以每个页表的长度也是1024。解析中间10位时,在页表中找到对应的下标,从而找到对应的内存。

第三部分时上图中的绿色部分。还记得吗,一个数据块的大小是4 kb,这是内存管理的基本单位。而 2 12 b y t e = 4 k b {\color{Red} 2 ^ {12} byte = 4 kb} 212byte=4kb,而第三部分就是12位!因此第三部分也叫做页内偏移,通过前两个部分,我们已经可以锁定到内存中的一个页框了,而第三部分存储的是物理地址相对于页框起始地址的偏移量,此时就可以根据起始地址 + 偏移量来确定一个地址。

以上就是页表解析地址的全过程。

那么这和线程的资源分配有什么关系呢?

我们可以看到,一个页目录把整个页表划分为了1024部分,一个部分能映射的总地址数目位4kb * 1024 = 4mb

给不同线程分配进程不同的区域,本质就是让不同进程看到页表的不同子集


线程控制

POSIX 线程库 - ptherad

讲完基本概念后,我们再看看如何控制线程。Linux控制线程,是通过原生线程库pthread的。

Linux中本质上是没有线程的,而是通过轻量级进程来模拟线程。因此 Linux 没有线程相关的系统调用接口,而是轻量级进程的系统调用接口。为了让用户感觉自己在操控线程,因此所有Linux系统都会必须配套一个 原生线程库 pthread,将轻量级进程的系统调用,封装为线程的操控,让用户感觉自己在操控线程。

之所以叫做原生线程库,就是因为所有Linux系统必须配备这个库,是原生的。因为属于用户操作接口的范围,所以Linux的线程也叫做用户级线程

在使用gcc / g++编译时,要带上选项-l pthread,来引入原生线程库

例如:

g++ -o test.exe test.cpp -l pthread

那么简单了解什么是线程库后,接下来就要讲解线程相关接口了。

在讲解接口前,先铺垫一个概念:TID,所有线程库对线程的操作,都是基于TID的。这个TID用于标识一个唯一的线程。TIDLWP不是一个东西,不要搞混

TID的数据类型是pthread_t

线程创建

pthread_create

ptherad_create函数用于创建一个线程,需要头文件<pthread.h>,函数原型如下:

int pthread_create(pthread_t *thread, const pthread_attr_t *attr, void *(*start_routine) (void *), void *arg);

参数:

  • thread:输出型参数,输出创建出来的线程的TID
  • attr:设置线程的状态,这个不用管,设为nullptr即可
  • start_routine:类型为void* (*)(void*)线程执行的函数的函数指针
  • arg:用于给新的线程传递参数,也就是给函数start_routine传参,该函数的第一个参数为void*类型,arg也是void*

返回值:

  • 如果创建成功,返回0
  • 如果创建失败,返回错误码

示例:

void *threadRun(void *args)
{
    string name = (char *)args;

    while (true)
    {
        cout << name << endl;
        sleep(1);
    }

    return nullptr;
}

int main()
{
    pthread_t tid;
    pthread_create(&tid, nullptr, threadRun, (void *)"thread - 1");

    while (true)
    {
        cout << "thread - main" << endl;
        sleep(1);
    }

    return 0;
}

以上代码中,先创建一个pthread_t类型的tid,随后通过pthread_create创建一个线程。

  • 第一个参数&tid,即创建线程后把该线程的TID输出到变量tid中;
  • 第二个参数nullptr,不用管;
  • 第三个参数threadRun,即创建出来的线程去执行这个函数;
  • 第四个参数(void *)"thread - 1",即函数threadRun的第一个参数传入一个字符串,由于参数类型是void*,要进行一次类型转换。

随后主线程循环输出"thread - main",创建的线程把参数args提取出来变成stringstring name = (char *)args;,再输出这个string

输出结果:

在这里插入图片描述

现在就有两个线程同时在跑了,而且我们成功把字符串thread - 1通过参数传给了新创建的线程。


pthread_self

ptherad_self函数用于得到当前线程的TID,需要头文件<pthread.h>,函数原型如下:

pthread_t pthread_self(void);

返回值:当前线程的TID


线程退出

讲解线程退出的相关接口前,我们来看一个实验:

如果某个线程调用exit接口,会发生什么

代码:

void *threadRun(void *args)
{
    string name = (char *)args;

    int cnt = 3;
    while (cnt--)
    {
        cout << name << endl;
        sleep(1);
    }
    
    exit(0);

    return nullptr;
}

int main()
{
    pthread_t tid;
    pthread_create(&tid, nullptr, threadRun, (void *)"thread - 1");

    while (true)
    {
        cout << "thread - main" << endl;
        sleep(1);
    }

    return 0;
}

以上代码十分简单,就是在刚才的代码中多加了一句exit而已。主线程创建完线程后,死循环输出thread - main。而创建出来的线程在输出三次thread - 1后通过exit退出。

按理来说,创建出来的线程通过exit退出后,此时就只剩主线程了,于是一直循环输出thread - main。所以预测现象为:输出三次thread - 1后,剩下的全是thread - main

输出结果:

在这里插入图片描述

奇怪的现象发生了,当thread - 1通过exit退出后,主线程也退出了。

exit接口的作用,是终止整个进程,任意一个线程调用该接口,所有线程都会退出

因此我们不能通过exit来退出一个线程

pthread_exit

ptherad_exit函数用于退出当前线程,需要头文件<pthread.h>,函数原型如下:

void pthread_exit(void *retval);

pthread_create时,线程执行的函数类型就是void* (*)(void*)也就是说线程调用的函数返回值是void*。退出线程pthread_exit时,第一个参数retval就是用于指定这个返回值的。


pthread_cancel

ptherad_cancel函数用于在主线程中指定退出一个线程,需要头文件<pthread.h>,函数原型如下:

int pthread_cancel(pthread_t thread);

参数:thread是要杀掉的线程的TID


pthread_join

线程和进程一样,也有等待的机制,用于获取线程的退出信息,这个过程叫做线程等待,而线程等待就是通过pthread_join完成的。

pthread_join函数用于等待一个线程,需要头文件<pthread.h>,函数原型如下:

int pthread_join(pthread_t thread, void **retval);

参数:

  • thread:等待的线程的TID
  • retval:输出型参数,线程退出后,该参数会接收到线程的函数返回值

返回值:

  • 等待成功:返回0
  • 等待失败:返回错误码

ptherad_join会进行阻塞式等待

示例:

void* threadRun(void* args)
{
    string name = (char*)args;

    int cnt = 3;
    while (cnt--)
    {
        cout << name << endl;
        sleep(1);
    }

    return (void*)12345;
}

int main()
{
    pthread_t tid;
    pthread_create(&tid, nullptr, threadRun, (void*)"thread - 1");

    void* ret;
    pthread_join(tid, &ret);
    cout << "return value = " << (long long) ret << endl;

    return 0;
}

以上代码中,创建的线程输出三次"thread - 1"后退出,返回值为数字12345。主线程中通过join等待这个线程,并把返回值保存到变量ret中。随后输出这个结果,因为ret是指针,输出时先转为long long再输出。

输出结果:

在这里插入图片描述

可以看到,主线程成功通过pthread_join拿到了线程的返回值。

如果我们通过pthread_exit终止线程,该函数的第一个参数就是函数返回值,那么pthread_join得到的返回值就是pthread_exit的参数。

但是如果通过pthread_cancel终止线程,由于该函数没有指定线程的返回值,此时pthread_join得到的返回值是固定值PTHREAD_CANCELED


pthread_detach

线程都是要被释放的,如果一个线程退出后没有被pthread_join,就会造成内存泄漏。但是如果你真的不希望去回收一个线程,你可以进行线程分离,被分离的线程,退出后会自己回收自己

pthread_detach函数用于等待一个线程,需要头文件<pthread.h>,函数原型如下:

int pthread_detach(pthread_t thread);

参数:thread是被分离的线程的TID

返回值:

  • 分离成功:返回0
  • 分离失败:返回错误码

一个线程被分离后,不允许再被pthread_join等待,等待会发生错误

pthread_detach既可以在主线程中对创建出来的线程使用,也可以线程自己对自己使用。

我们以后者作为示例:

void *threadRun(void *args)
{
    pthread_detach(pthread_self());

    while(true) ;

    return (void*)12345;
}

int main()
{
    pthread_t tid;
    pthread_create(&tid, nullptr, threadRun, (void *)"thread - 1");

    cout << "join..." << endl;
    int ret = pthread_join(tid, nullptr);
    cout << ret << ": " << strerror(ret) << endl;

    return 0;
}

以上代码中,在线程的函数中,自己分离自己pthread_detach(pthread_self()),随后创建的线程陷入死循环。

主线程中,强行pthread_join这个已经分离的函数,并输出错误码。

输出结果:

在这里插入图片描述

可以看到,由于等待了一个已经分离的线程,此时pthread_join的返回值就是22号错误Incalid argument


线程架构

线程与地址空间

在这里插入图片描述

依然是这一张图,我们之前一直没有讨论一个问题,那就是所有的线程共享一个进程地址空间。这意味着多个线程是可以访问同一个变量的,比如说一个全局变量g_val,我们可以在任意一个线程中访问它,一个线程修改了这个值,其余的线程的g_val也会受到影响。

示例:

int g_val = 5;

void* threadRun(void* args)
{
    cout << "g_val = " << g_val << "  &g_val = " << &g_val << endl;

    return nullptr;
}

int main()
{
    pthread_t tid;
    pthread_create(&tid, nullptr, threadRun, nullptr);

    sleep(1);
    cout << "g_val = " << g_val << "  &g_val = " << &g_val << endl;

    return 0;
}

以上代码中,先创建了一个全局变量g_val,随后创建一个线程。

主线程与被创建的线程,都输出g_val的值与g_val的地址。

输出结果:

在这里插入图片描述

两个线程的g_val不论是值还是地址,都是一模一样的,说明就是同一个g_val

如果你希望对于一个变量,每个线程都维护一份,互不影响,此时可以使用线程局部存储

只需要在变量前面使用__thread(注意前面有两条下划线)修饰即可,比如这样:

__thread int g_val = 5;

再次输出:

在这里插入图片描述

这次两个线程的g_val地址就不同了。

当然,线程之间不是啥都共享的,也有各自独立的部分:

  1. 线程PID
  2. 一组寄存器 / 硬件上下文:因为线程是调度的基本单位,线程调度是需要上下文来记录自己的调度相关信息的,这个必须每个线程各自一份
  3. 栈帧:也是因为线程是调度的基本单位,每个线程都在执行自己的函数栈,这个栈也是各自独立
  4. errno:线程之间的错误码各自独立
  5. 信号屏蔽字:当一个进程收到信号,此时所有线程都会收到信号,但是每个线程的处理方式可以不同,就是通过每个线程独自维护一份block达到的
  6. 调度优先级:同理,因为线程是调度的基本单位,线程之间可以有不同的优先级

线程与pthread动态库

我先前说过,线程的控制是通过pthread库实现的,毫无疑问pthread是一个动态库。线程需要被结构体描述,同时再被数据结构组织,这样才好管理一群线程,这个任务是pthread库完成的。

如下图:

在这里插入图片描述

pthread库中,通过结构体struct pthread来管理一个线程,在这给结构体中会存储很多线程之间独立的部分。我们刚讲过的线程局部存储栈帧TID,这几个部分就是保存在struct pthread中的

还记得我们在说过,TID是一个线程的唯一标识符吗?我们来输出一下这个TID试试:

int main()
{
	cout << pthread_self() << endl;

    return 0;
}

直接通过pthread_self拿到自己的TID,然后输出。

输出结果:

在这里插入图片描述

可以发现,这是一个很大很大的数字,这是为啥?

TID就是线程的struct pthread在内存中的物理地址

你不妨想想,为什么所有对线程的操作中,基本都带上了参数TID,因为通过TID,线程可以直接找到对应的物理地址,从而访问线程的更多信息

Linux中,标识一个轻量级进程是通过LWP完成的,struct pthread内部,一定有一个成员是该线程对应的轻量级进程LWP,进而完成用户操作线程库操作轻量级进程的转换


线程的优缺点

线程有如下优点

创建一个新线程的代价要比创建一个新进程小得多

创建一个线程只需要额外创建一个PCB,进程地址空间,页表等都和别的线程共用,因此创建线程代价很小

与进程之间的切换相比,线程之间的切换需要操作系统做的工作要少很多

由于线程共用进程地址空间和页表,在CPU切换调度的PCB时,如果两个PCB属于同一个进程的不同线程,那么它们的进程地址空间和页表都不用更新,因为它们共用,此时CPU就可以少加载很多数据。

在等待慢速I/O操作结束的同时,程序可执行其他的计算任务

一般来说,I/O是很慢的操作,如果主线程一直等待I/O,效率就会很低下。这种需要阻塞等待的任务,建议创建其它线程,让其他线程去做。这样I/O对程序的运行效率影响就低很多,因为等待I/O的同时,主线程可以去做其他任务。

计算密集型应用,为了能在多处理器系统上运行,将计算分解到多个线程中实现

所谓计算密集型应用,就是该程序主要功能是利用CPU进行计算。此时线程个数不建议太多,因为线程的调度也是需要消耗CPU资源的,此时最好让CPU多执行计算,而不是去频繁调度。

I/O密集型应用,为了提高性能,将I/O操作重叠。线程可以同时等待不同的I/O操作。

所谓I/O密集型应用,就是说程序大部分时间都在I/O,此时建议多创建一些线程,让线程去I/O

线程缺点如下

  1. 线程的频繁调度也要消耗资源,可能会和计算争夺CPU资源,导致计算效率降低,比如计算密集型应用就不太适合创建太多线程
  2. 程序健壮性降低,因为多线程的代码很难维护,不好控制

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/708292.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

复分析——第2章——Cauchy定理及其应用(E.M. Stein R. Shakarchi)

第2章 Cauchy定理及其应用 The solution of a large number of problems can be reduced, in the last analysis, to the evaluation of definite integrals; thus mathematicians have been much occupied with this task... However, among many results obtained, a n…

【RabbitMQ】初识 RabbitMQ

初识 RabbitMQ 1.认识 RabbitMQ1.1 介绍1. 2.使用场景1.2.1 推送通知1.2.2 异步任务1.2.3 多平台应用的通信1.2.4 消息延迟1.2.5 远程过程调用 1.3 特性 2.基本概念2.1 生产者、消费者和代理2.2 消息队列2.3 交换机2.3.1 direct2.3.2 topic2.3.3 headers2.3.4 fanout 2.4 绑定2…

基于SpringBoot+VueBBS论坛系统设计和实现(源码+LW+调试文档+讲解等)

&#x1f497;博主介绍&#xff1a;✌全网粉丝1W,CSDN作者、博客专家、全栈领域优质创作者&#xff0c;博客之星、平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌&#x1f497; &#x1f31f;文末获取源码数据库&#x1f31f; 感兴趣的可以先收藏起来&#xff0c;还…

蓝牙模块的工作原理与电路设计

蓝牙技术是一种短距离无线通信技术&#xff0c;广泛应用于各种智能设备中&#xff0c;如手机、耳机、智能手表等。蓝牙模块作为实现蓝牙通信的核心部件&#xff0c;其工作原理和电路设计对于蓝牙设备的性能和稳定性至关重要。本文将深入解析蓝牙模块的工作原理&#xff0c;包括…

Docker(一)-认识Docker

1.docker理念 Docker是基于Go语言实现的云开源项目。 Docker的主要目标是“Build,Ship and Run Any App,Anywhere”&#xff0c;也就是通过对应用组件的封装&#xff0c;分发&#xff0c;部署&#xff0c;运行等生命周期的管理&#xff0c;使用户的应用及其运行环境能够做到”…

18.1 HTTP服务器-极简服务器、请求与响应

1. 极简服务器 大道至简。使用Go语言构建世界上最简单的HTTP服务器&#xff0c;仅需四行代码。 标准库的net/http包提供了多种用于创建HTTP服务器的方法&#xff0c;其中包括&#xff1a; http.HandleFunc("/", rootHandler) 第一参数&#xff1a;访问的url 第二…

Elasticsearch搜索引擎(高级篇)

3.1 查询语法 | 《ElasticSearch入门到实战》电子书 (chaosopen.cn) day09-Elasticsearch02 - 飞书云文档 (feishu.cn) 目录 第一章 DSL查询 1.1 基本语法 1.2 叶子查询 全文检索查询 精确查询 1.3 复合查询 算分函数查询 bool查询 1.4 排序 1.5 分页 基础分页 深度分…

数据可视化:Seaborn

安装Seaborn 进入虚拟环境&#xff0c;在终端中键入 pip install seaborn 即可安装。 初步使用Seaborn 在使用seaborn之前&#xff0c;我们先了解一下seaborn是什么&#xff0c;seaborn是以matplotlib为底层的更简便的python第三方库&#xff0c;它可以更快捷地去设置图形的一…

Web应用安全测试-防护功能缺失

Web应用安全测试-防护功能缺失 1、Cookie属性问题 漏洞描述&#xff1a; Cookie属性缺乏相关的安全属性&#xff0c;如Secure属性、HttpOnly属性、Domain属性、Path属性、Expires属性等。 测试方法&#xff1a; 通过用web扫描工具进行对网站的扫描&#xff0c;如果存在相关…

快速提升沟通能力:客服必备的话术技巧

在现在的这个互联网时代&#xff0c;各行业竞争日益激烈&#xff0c;而客服作为连接商家和消费者的桥梁&#xff0c;无疑是一个重要的岗位。可以说客服是一个极具挑战性的岗位&#xff0c;客服每天需要面对来自全国各地的客户&#xff0c;同时还要对不同地区、不同性格、不同需…

Unity资源 之 最受欢迎的三消游戏开发包 - Bubble Shooter Kit 【免费领取】

三消游戏开发包 - Bubble Shooter Kit 免费领取 前言资源包内容领取兑换码 前言 如果你是一名 Unity 游戏开发者&#xff0c;并且正在寻找一种快速、简单的方式来创建自己的三消游戏&#xff0c;那么 Bubble Shooter Kit 就是你所需要的。 资源包内容 Bubble Shooter Kit 是…

推荐系统三十六式学习笔记:原理篇.矩阵分解10|那些在Netflix Prize中大放异彩的推荐算法

目录 缘起矩阵分解为什么要矩阵分解1 基础的SVD算法2 增加偏置信息3 增加历史行为4 考虑时间因素 总结 我们先前聊过推荐系统中的经典问题&#xff0c;其中有一类就是评分预测。平心而论&#xff0c;评分预测问题只是很典型&#xff0c;其实并不大众。毕竟在实际的应用中&#…

使用Omnipeek进行Wifi/P2P抓包

前言 工作中解决Mirracast投屏连接失败的问题时&#xff0c;遇到了需要抓取wifi数据包的情况&#xff0c;记录一下配置和使用过程。 一、Omnipeek 的安装和配置 1.1 Omnipeek 安装 双击 setup.exe 进行安装 1.2 注册 注册时&#xff0c;版本写 71 &#xff0c;产生序列号和…

Leetcode刷题笔记10

14. 最长公共前缀 14. 最长公共前缀 - 力扣&#xff08;LeetCode&#xff09; 首先&#xff0c;检查边界条件 如果输入的字符串数组为空&#xff0c;直接返回空字符串。 然后使用minmax_element函数找到数组中字典序最小和最大的字符串。 因为公共前缀一定会出现在字典序最…

爬虫相关面试题(其二)

十一 分布式爬虫爬虫原理 一个分布式爬虫&#xff0c;是需要有一个或多个发任务的程序&#xff0c;提取将来需要的任务&#xff0c;主要指的就是任务链接&#xff0c;存到任务队列&#xff08;redis数据库中&#xff09;&#xff0c;还需要多个执行任务的程序&#xff0c;从任…

微软无所不知的人工智能召回功能“Recall”被推迟,将不会与 Copilot Plus PC 一起提供

微软计划下周推出新的 Copilot Plus 个人电脑&#xff0c;取消其备受争议的 Recall 功能&#xff0c;该功能可以截取您在这些新笔记本电脑上所做的所有操作。该软件制造商推迟了 Recall&#xff0c;以便可以通过 Windows Insider 程序对其进行测试&#xff0c;此前该公司最初承…

解决CentOS的yum命令失效的问题

近日笔者对一台装有 CentOS 7.9 系统的服务器反复折腾&#xff0c;玩到最后发现 yum 命令用不了&#xff0c;总是报下面的错误信息&#xff1a; There was a problem importing one of the Python modules required to run yum. The error leading to this problem was:/usr/l…

eclipse如何导入springboot项目

打开eclipse 找到你的springboot项目 点击finish即可 test02就已经导入进去了 配置一下maven 在将那个springboot项目刷新一下即可 运行成功

服务器数据恢复—vxfs文件系统元数据被破坏的数据恢复案例

服务器存储数据恢复环境&#xff1a; 某品牌MSA2000服务器存储中有一组由8块SAS硬盘组建的raid5磁盘阵列&#xff0c;其中包含一块热备盘。分配了6个LUN&#xff0c;均分配给HP-Unix小机使用。磁盘分区由LVM进行管理&#xff0c;存放的数据主要为Oracle数据库及OA服务端。 服务…

企业数据放到公有云上安全吗?

将企业数据放置在公有云上是否安全&#xff0c;取决于多种因素&#xff0c;包括所选择的云服务提供商、数据类型、行业合规要求、以及企业本身的安全策略和实践。下面是一些关键点&#xff0c;可以帮助理解公有云上的数据安全性&#xff1a; 公有云提供商的安全措施 物理安全与…