Python的秘密基地--[章节7] Python 并发与多线程编程

第7章:Python 并发与多线程编程

随着计算机硬件的发展,多核处理器已经成为主流。为了更好地利用多核资源,提高程序的运行效率,Python 提供了并发(Concurrency)和并行(Parallelism)编程的工具。本章将深入探讨 Python 中的 线程(Threading)进程(Multiprocessing)异步编程(Asyncio)


7.1 并发与并行的区别

  • 并发(Concurrency):多个任务交替执行,可能在单核 CPU 上完成,主要关注任务的切换。
  • 并行(Parallelism):多个任务同时执行,必须依赖多核 CPU,多个任务真正“同时”运行。

简单理解

  • 并发 → 多个任务在同一时间段内“轮流”执行。
  • 并行 → 多个任务在同一时刻“同时”执行。

7.2 多线程(Threading)

7.2.1 什么是线程?

  • 线程(Thread) 是操作系统能够进行调度的最小单元。
  • Python 提供了 threading 模块来实现多线程。
  • 注意:由于 GIL(全局解释器锁) 的存在,Python 的多线程无法真正实现并行计算,适合 I/O 密集型任务

7.2.2 使用 threading 模块

示例:创建多线程
import threading
import time

def task(name):
    print(f"线程 {name} 开始")
    time.sleep(2)
    print(f"线程 {name} 结束")

# 创建线程
thread1 = threading.Thread(target=task, args=("线程1",))
thread2 = threading.Thread(target=task, args=("线程2",))

# 启动线程
thread1.start()
thread2.start()

# 等待线程结束
thread1.join()
thread2.join()

print("所有线程已完成")

输出

线程 线程1 开始
线程 线程2 开始
线程 线程1 结束
线程 线程2 结束
所有线程已完成
7.2.3 线程锁(Lock)

多个线程同时访问共享资源时,可能会导致 数据竞争(Race Condition)。为了解决这个问题,可以使用 线程锁(Lock)

import threading

lock = threading.Lock()
counter = 0

def increment():
    global counter
    with lock:  # 上锁
        temp = counter
        temp += 1
        counter = temp

threads = []
for i in range(5):
    t = threading.Thread(target=increment)
    threads.append(t)
    t.start()

for t in threads:
    t.join()

print(f"最终计数器值: {counter}")

7.3 多进程(Multiprocessing)

7.3.1 什么是进程?

  • 进程(Process) 是操作系统资源分配的基本单位。
  • Python 的 multiprocessing 模块支持真正的 并行计算,每个进程都有自己的 Python 解释器,不受 GIL 的限制。
  • 适合 CPU 密集型任务

7.3.2 使用 multiprocessing 模块

示例:创建多进程
import multiprocessing
import time

def task(name):
    print(f"进程 {name} 开始")
    time.sleep(2)
    print(f"进程 {name} 结束")

if __name__ == "__main__":
    process1 = multiprocessing.Process(target=task, args=("进程1",))
    process2 = multiprocessing.Process(target=task, args=("进程2",))

    process1.start()
    process2.start()

    process1.join()
    process2.join()

    print("所有进程已完成")
7.3.3 进程池(Pool)

当需要大量进程时,可以使用 进程池(Pool) 管理。

from multiprocessing import Pool

def square(n):
    return n * n

if __name__ == "__main__":
    with Pool(4) as pool:
        results = pool.map(square, [1, 2, 3, 4, 5])
    print(results)  # [1, 4, 9, 16, 25]

7.4 异步编程(Asyncio)

7.4.1 什么是异步编程?

  • 异步编程是一种 非阻塞 的编程方式。
  • 使用 asyncawait 关键字。
  • 适合 I/O 密集型任务,例如网络请求、数据库访问等。

7.4.2 异步函数

示例:异步任务
import asyncio

async def task(name):
    print(f"任务 {name} 开始")
    await asyncio.sleep(2)  # 异步等待
    print(f"任务 {name} 结束")

async def main():
    await asyncio.gather(
        task("任务1"),
        task("任务2")
    )

asyncio.run(main())

输出

任务 任务1 开始
任务 任务2 开始
任务 任务1 结束
任务 任务2 结束
7.4.3 异步与协程
  • async:定义异步函数。
  • await:在异步函数内部暂停执行,等待某个异步任务完成。

7.5 并发工具

7.5.1 队列(Queue)

Python 提供了 queue.Queuemultiprocessing.Queue 来实现线程间或进程间通信。

import queue
import threading

q = queue.Queue()

def producer():
    for i in range(5):
        q.put(i)
        print(f"生产者放入: {i}")

def consumer():
    while not q.empty():
        item = q.get()
        print(f"消费者取出: {item}")

thread1 = threading.Thread(target=producer)
thread2 = threading.Thread(target=consumer)

thread1.start()
thread1.join()

thread2.start()
thread2.join()

7.6 小结

线程(Threading)

  • 适合 I/O 密集型任务
  • 受限于 GIL,无法实现真正的并行。

进程(Multiprocessing)

  • 适合 CPU 密集型任务
  • 每个进程都有独立的内存空间。

异步编程(Asyncio)

  • 适合 I/O 密集型任务
  • 使用 asyncawait 关键字实现。

7.7 实战项目:爬虫示例

使用多线程进行网页爬取
import threading
import requests

def fetch_url(url):
    response = requests.get(url)
    print(f"{url}: {response.status_code}")

urls = ["https://www.example.com", "https://www.python.org"]

threads = []
for url in urls:
    t = threading.Thread(target=fetch_url, args=(url,))
    threads.append(t)
    t.start()

for t in threads:
    t.join()

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/944507.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

阿里云-将旧服务器数据与配置完全迁移至新服务器

文章目录 一:创建镜像二:将创建好的镜像复制到新服务器所在的目标地域(如果新服务器与镜像在同一地域就不用进行这一操作)三:将镜像配置到新服务器上四:导出安全组(如果新服务器与旧服务器使用同…

Spark SQL DML语句

【图书介绍】《Spark SQL大数据分析快速上手》-CSDN博客 《Spark SQL大数据分析快速上手》【摘要 书评 试读】- 京东图书 Spark本地模式安装_spark3.2.2本地模式安装-CSDN博客 DML(Data Manipulation Language,数据操作语言)操作主要用来对…

路过石岩浪心古村

周末常去的七彩城堡儿童乐园附近经常有老房子,没想到老房子最多的地方还是浪心古村。而且越看越有历史。 见到一座写着《序西书室》的房子,我最开始以为是一个古代的学校。但是查了百度更加不知道什么意思了哈。‌“序西书室”‌是指《文心雕龙》中的一个…

运行Zr.Admin项目(后端)

1.下载Zr.Admin代码压缩包 https://codeload.github.com/izhaorui/Zr.Admin.NET/zip/refs/heads/main 2.打开项目 我这里装的是VS2022社区版 进入根目录,双击ZRAdmin.sln打开项目 3.安装.net7运行时 我当时下载的代码版本是.net7的 点击安装 点击安装&#xff0…

Wordly Wise 3000 国际背单词01 介绍 + 测词汇量

📚 Wordly Wise 3000 国际背单词01 介绍 测词汇量 🌟 大家好!我们正式启动背Wordly Wise 3000单词,旨在利用国际资源和科学的学练方法,帮助大家更得效地坚持学练单词。我们将通过图文和Video等多种形式与大家分享经验…

HarmonyOS Next 实现登录注册页面(ARKTS) 并使用Springboot作为后端提供接口

1. HarmonyOS next ArkTS ArkTS围绕应用开发在 TypeScript (简称TS)生态基础上做了进一步扩展,继承了TS的所有特性,是TS的超集 ArkTS在TS的基础上扩展了struct和很多的装饰器以达到描述UI和状态管理的目的 以下代码是一个基于…

3.微服务灰度发布落地实践(组件灰度增强)

文章目录 前言调用链示图dubbo服务之间的的调链cloud 服务之间的调用链 网关servlet容器: 标签续传1.定义插件2.实现灰度增强拦截 线程池: 标签续传1.拦截Runnable或Callable,接口增强实现标签续传;Callable 插件定义Runnable 插件定义拦载Callabl或Runnable构造(可共用)拦载ru…

不修改内核镜像的情况下,使用内核模块实现“及时”的调度时间片超时事件上报

一、背景 之前的博客 不修改内核镜像的情况下,使用内核模块实现高效监控调度时延-CSDN博客 里,我们讲了不修改内核镜像高效监控每次的调度时延的方法。这篇博客里,我们对于调度时间片也做这么一个不修改内核镜像的改进。关于调度时间片过长的…

机器视觉中的单线程、多线程与跨线程:原理与应用解析

在机器视觉应用中,程序的运行效率直接影响到系统的实时性和稳定性。随着任务复杂度的提高,单线程处理往往无法满足高性能需求,多线程技术因此被广泛应用。此外,跨线程操作(如在多线程中更新界面或共享资源)…

喜报 | 擎创科技入围上海市优秀信创解决方案

近日,由上海市经信委组织的“2024年上海市优秀信创解决方案”征集遴选活动圆满落幕,擎创科技凭借实践经验优秀的《擎创夏洛克智能预警与应急处置解决方案》成功入选“2024年上海市优秀信创解决方案”名单。 为激发创新活力,发挥标杆作用&…

linux-21 目录管理(一)mkdir命令,创建空目录

对linux而言,对一个系统管理来讲,最关键的还是文件管理。那所以我们接下来就来看看如何实现文件管理。当然,在文件管理之前,我们说过,文件通常都放在目录下,对吧?所以先了解目录,可能…

【Redis】 数据淘汰策略

面试官询问缓存过多而内存有限时内存被占满的处理办法,引出 Redis 数据淘汰策略。 数据淘汰策略与数据过期策略不同, 过期策略针对设置过期时间的 key 删除, 淘汰策略是在内存不够时按规则删除内存数据。 八种数据淘汰策略介绍 no evision&…

一网多平面

“一网多平面”是一种网络架构概念,具体指的是在一张物理网络之上,逻辑划分出“1N”个平面。以下是对“一网多平面”的详细解释: 定义与构成 01一网多平面 指的是在统一的物理网络基础设施上,通过逻辑划分形成多个独立的网络平面…

小程序配置文件 —— 12 全局配置 - pages配置

全局配置 - pages配置 在根目录下的 app.json 文件中有一个 pages 字段,这里我们介绍一下 pages 字段的具体用法; pages 字段:用来指定小程序由哪些页面组成,用来让小程序知道由哪些页面组成以及页面定义在哪个目录,…

MyBatis如何处理延迟加载?

大家好,我是锋哥。今天分享关于【MyBatis如何处理延迟加载?】面试题。希望对大家有帮助; MyBatis如何处理延迟加载? 1000道 互联网大厂Java工程师 精选面试题-Java资源分享网 MyBatis 支持 延迟加载(Lazy Loading&am…

Quartz任务调度框架实现任务动态执行

说明:之前使用Quartz,都是写好Job,指定一个时间点,到点执行。最近有个需求,需要根据前端用户设置的时间点去执行,也就是说任务执行的时间点是动态变化的。本文介绍如何用Quartz任务调度框架实现任务动态执行…

vue3使用video-player实现视频播放(可拖动视频窗口、调整大小)

1.安装video-player npm install video.js videojs-player/vue --save在main.js中配置全局引入 // 导入视频播放组件 import VueVideoPlayer from videojs-player/vue import video.js/dist/video-js.cssconst app createApp(App) // 视频播放组件 app.use(VueVideoPlayer)2…

从入门到精通:Vim 高效文本编辑全面指南

文章目录 前言🧬一、Vim 的编辑哲学:模式分离与高效键盘操作🧬二、基础命令与快捷键:从简单到熟悉🧬三、进阶功能:多文件、分屏与可视化模式🧬四、自定义配置与 .vimrc:打造你的专属…

正则表达式(三剑客之sed)

1.sed工具的使用 1.1 sed工具 1)命令格式:sed -n ‘n’ p filename 1.2 打印某行 1)打印第二行 [rootlocalhost ~]# sed -n 2p /etc/passwd 2)第二行重复打印 [rootlocalhost ~]# sed 2p /etc/passwd 3)所有行全部…

珞珈一号夜光遥感数据地理配准,栅格数据地理配准

目录 一、夜光数据下载: 二、夜光遥感数据地理配准 三、计算夜光数据值 四、辐射定标 五、以表格显示分区统计 五、结果验证 夜光数据位置和路网位置不匹配,虽然都是WGS84坐标系,不匹配!!!不要看到就直接…