使用OpenCV和MediaPipe库——实现人体姿态检测

目录

准备工作如何在Windows系统中安装OpenCV和MediaPipe库?

安装Python

安装OpenCV

安装MediaPipe

验证安装

代码逻辑

整体代码

效果展示


准备工作如何在Windows系统中安装OpenCV和MediaPipe库?

安装Python

    可以通过命令行运行python --version来检查版本号。如果没有安装,可以从Python官方网站下载并安装。

安装OpenCV

  1. 打开命令提示符(Command Prompt)。

  2. 输入以下命令来安装OpenCV-python:

    pip install opencv-python

    如果你也需要OpenCV的额外模块(如SIFT、SURF等),可以运行:

    pip install opencv-contrib-python

安装MediaPipe

安装MediaPipe同样简单,只需要在命令提示符下运行:

pip install mediapipe

验证安装

为了验证OpenCV和MediaPipe是否成功安装,可以在命令提示符中启动Python解释器,然后尝试导入这两个库:

import cv2
import mediapipe as mp
print(cv2.__version__)
print(mp.__version__)

如果打印出了版本号,安装成功。


代码逻辑

  1. 导入必要的库:

    • cv2: OpenCV库,用于处理图像和视频。
    • mediapipe as mp: MediaPipe库,提供了一种简单的方法来访问先进的机器学习模型,这里用于人体姿态估计。
    • time: 用于时间相关的操作,比如计算FPS。
  2. 初始化MediaPipe姿势检测对象:

    • 使用mp_pose.Pose()创建了一个姿势检测器对象,设置了最小检测置信度和跟踪置信度为0.5。
  3. 打开摄像头获取视频流:

    • 使用cv2.VideoCapture(0)打开默认摄像头。
  4. 主循环开始:

    • while cap.isOpened():循环中不断读取摄像头数据。
  5. 处理每一帧图像:

    • 首先检查是否成功读取图像。
    • 然后计算当前帧的FPS。
    • 将BGR格式的图像转换为RGB格式,因为MediaPipe需要RGB格式的输入。
    • 使用姿势检测器对象对图像进行处理,得到关键点位置。
  6. 绘制关键点和连接线:

    • 如果检测到了关键点(results.pose_landmarks),则使用mp_drawing.draw_landmarks()函数在图像上绘制这些关键点及其连接线。
    • 可以自定义关键点和连线的颜色、粗细等属性。
  7. 显示FPS信息:

    • 在图像上显示当前帧的FPS值,帮助用户了解程序运行的流畅度。
  8. 展示结果并监听退出指令:

    • 使用cv2.imshow()展示处理后的图像。
    • 监听键盘事件,当按下'q'键时退出循环,释放资源并关闭所有窗口。


整体代码

import cv2  # 导入 OpenCV 库,用于图像处理和显示
import mediapipe as mp  # 导入 MediaPipe 库,用于姿势检测
import time  # 导入时间模块,用于计算 FPS

# 初始化 MediaPipe 的绘图工具和姿势检测模型
mp_drawing = mp.solutions.drawing_utils  # 用于绘制关键点和连接线
mp_pose = mp.solutions.pose  # 用于姿势检测

# 打开摄像头
cap = cv2.VideoCapture(0)  # 0 表示默认摄像头,如果有多个摄像头可以尝试 1, 2, 等

# 初始化 FPS 计算相关变量
prev_time = 0  # 用于存储上一帧的时间戳

# 使用 MediaPipe 的姿势检测模型
with mp_pose.Pose(
    min_detection_confidence=0.5,  # 检测置信度阈值,高于此值才认为检测到姿势
    min_tracking_confidence=0.5    # 跟踪置信度阈值,高于此值才继续跟踪
) as pose:
    # 进入主循环,持续读取摄像头画面
    while cap.isOpened():
        success, image = cap.read()  # 读取一帧画面
        if not success:  # 如果读取失败(如摄像头断开)
            print("无法读取摄像头画面。")
            break

        # --- 计算 FPS ---
        curr_time = time.time()  # 获取当前帧的时间戳
        dt = curr_time - prev_time  # 计算与上一帧的时间间隔(秒)
        fps = 1 / dt if dt != 0 else 0  # 计算帧率(FPS),避免除以零错误
        prev_time = curr_time  # 更新上一帧的时间戳

        # 将图像从 BGR 格式转换为 RGB 格式(MediaPipe 需要 RGB 格式)
        image_rgb = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)

        # 使用姿势检测模型处理图像
        results = pose.process(image_rgb)

        # 如果检测到姿势关键点,绘制关键点和连接线
        if results.pose_landmarks:
            mp_drawing.draw_landmarks(
                image,  # 要绘制的图像
                results.pose_landmarks,  # 检测到的姿势关键点
                mp_pose.POSE_CONNECTIONS,  # 定义关键点之间的连接线
                landmark_drawing_spec=mp_drawing.DrawingSpec(color=(0, 255, 0), thickness=2),  # 关键点的颜色和粗细
                connection_drawing_spec=mp_drawing.DrawingSpec(color=(0, 0, 255), thickness=2)  # 连接线的颜色和粗细
            )

        # --- 在画面上显示 FPS ---
        fps_text = "FPS: {:.2f}".format(fps)  # 格式化 FPS 值,保留两位小数
        cv2.putText(
            image,  # 要绘制的图像
            fps_text,  # 显示的文本内容
            (10, 30),  # 文本位置(左上角,距离左边 10 像素,距离顶部 30 像素)
            cv2.FONT_HERSHEY_SIMPLEX,  # 字体类型
            1,  # 字体大小
            (0, 255, 0),  # 字体颜色(绿色)
            2  # 字体粗细
        )

        # 显示处理后的图像
        cv2.imshow('Real-Time Pose Detection', image)

        # 检测按键输入,如果按下 'q' 键则退出循环
        if cv2.waitKey(1) & 0xFF == ord('q'):
            break

# 释放摄像头资源
cap.release()

# 关闭所有 OpenCV 窗口
cv2.destroyAllWindows()

效果展示

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/984178.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

React:Axios

axios可以在浏览器和node.js两边跑&#xff0c;可以向服务端发起ajax请求&#xff0c;也可以在node.js里运行&#xff0c;向远端服务发送http请求 Axios中文文档 | Axios中文网 <!DOCTYPE html> <html lang"en"> <head><meta charset"UT…

数据结构第八节:红黑树(初阶)

【本节要点】 红黑树概念红黑树性质红黑树结点定义红黑树结构红黑树插入操作的分析 一、红黑树的概念与性质 1.1 红黑树的概念 红黑树 &#xff0c;是一种 二叉搜索树 &#xff0c;但 在每个结点上增加一个存储位表示结点的颜色&#xff0c;可以是 Red和 Black 。 通过对 任何…

使用 vxe-table 导出 excel,支持带数值、货币、图片等带格式导出

使用 vxe-table 导出 excel&#xff0c;支持带数值、货币、图片等带格式导出&#xff0c;通过官方自动的导出插件 plugin-export-xlsx 实现导出功能 查看官网&#xff1a;https://vxetable.cn gitbub&#xff1a;https://github.com/x-extends/vxe-table gitee&#xff1a;htt…

C# Unity 唐老狮 No.7 模拟面试题

本文章不作任何商业用途 仅作学习与交流 安利唐老狮与其他老师合作的网站,内有大量免费资源和优质付费资源,我入门就是看唐老师的课程 打好坚实的基础非常非常重要: 全部 - 游习堂 - 唐老狮创立的游戏开发在线学习平台 - Powered By EduSoho 如果你发现了文章内特殊的字体格式,…

【够用就好008】开新坑自学esb32烧录进军物联网和嵌入式

见字如面&#xff0c;这里是AKA AIGC创意人竹相左边。 学习使用了三年的AI工具&#xff0c;现在最大的自信就是业余时间可以学习任何自己感兴趣的事&#xff0c;感觉手搓火箭也不是梦。 今天开个新坑&#xff0c;也是逐步探索想要进入的新世界。物联网&#xff08;IoT&#…

51单片机Proteus仿真速成教程——P1-软件与配置+Proteus绘制51单片机最小系统+新建程序模版

前言&#xff1a;本文主要围绕 51 单片机最小系统的绘制及程序模板创建展开。首先介绍了使用 Proteus 绘制 51 单片机最小系统的详细步骤&#xff0c;包括软件安装获取途径、工程创建、器件添加&#xff08;如单片机 AT89C51、晶振、电容、电阻、按键等&#xff09;、外围电路&…

MacOS Big Sur 11 新机安装brew wget python3.12 exo

MacOS Big Sur 11,算是很老的系统了&#xff0c;所以装起来brew有点费劲。 首先安装brew 官网&#xff1a; /bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)" 官网加速&#xff1a; 按照官网的方法&#xff0…

C++算法——差分

1.差分 差分与前缀和的核心思想相同&#xff0c;是预处理&#xff0c;可以在暴力枚举的过程中&#xff0c;快速给出查询的结果&#xff0c;从而优化时间复杂度。 是经典的用空间替换时间的做法。 补充&#xff1a;使得最短跳跃距离尽可能长&#xff0c;遇到类似这样的问题时…

【VBA】WPS/PPT设置标题字体

通过VBA&#xff0c;配合左上角的快速访问工具栏&#xff0c;实现自动化调整 选中文本框的 字体位置、大小、颜色。 配合quicker更加便捷 Sub DisableAutoWrapAndFormat()Dim shp As Shape 检查是否选中了一个形状&#xff08;文本框&#xff09;If ActiveWindow.Selection.Typ…

YOLO 各系列结构整理

目录 2016 You Only Look Once: Unified, Real-Time Object Detection(CVPR) 2017 YOLO9000: Better, Faster, Stronger CVPR 2018 YOLOv3:AnIncrementalImprovemen CVPR YOLO V3-SPP 2020 YOLOv4: Optimal Speed and Accuracy of Object Detection 2021 YOLOV5 2021 YOL…

六十天前端强化训练之第十四天之深入理解JavaScript异步编程

欢迎来到编程星辰海的博客讲解 目录 一、异步编程的本质与必要性 1.1 单线程的JavaScript运行时 1.2 阻塞与非阻塞的微观区别 1.3 异步操作的性能代价 二、事件循环机制深度解析 2.1 浏览器环境的事件循环架构 核心组件详解&#xff1a; 2.2 执行顺序实战分析 2.3 Nod…

Git基础之工作原理

基础概念 git本地有三个工作区域&#xff0c;工作目录 Working Directory&#xff0c;暂存区Stage/Index和资源区Repository/Git Directory&#xff0c;如果在加上远程的git仓库就是四个工作区域 四个区域与文件交换的命令之间的关系 WorkSpace&#xff1a;工作区&#xff0c;就…

【计算机网络】计算机网络的性能指标——时延、时延带宽积、往返时延、信道利用率

计算机网络的性能指标 导读 大家好&#xff0c;很高兴又和大家见面啦&#xff01;&#xff01;&#xff01; 在上一篇内容中我们介绍了计算机网络的三个性能指标——速率、带宽和吞吐量。用大白话来说就是&#xff1a;网速、最高网速和实时网速。 相信大家看到这三个词应该就…

测试大语言模型在嵌入式设备部署的可能性-ollama本地部署测试

前言 当今各种大语言模型百花齐放&#xff0c;为了方便使用者更加自由的使用大模型&#xff0c;将大模型变成如同棒球棍一样每个人都能用&#xff0c;并且顺手方便的工具&#xff0c;本地私有化具有重要意义。 本次测试使用ollama完成模型下载&#xff0c;过程简单快捷。 1、进…

【实战篇】【DeepSeek 全攻略:从入门到进阶,再到高级应用】

凌晨三点,某程序员在Stack Overflow上发出灵魂拷问:“为什么我的DeepSeek会把财务报表生成成修仙小说?” 这个魔性的AI工具,今天我们就来场从开机键到改造人类文明的硬核教学。(文末含高危操作集锦,未成年人请在师父陪同下观看) 一、萌新村任务:把你的电脑变成炼丹炉 …

【Linux学习笔记】Linux基本指令分析和权限的概念

【Linux学习笔记】Linux基本指令分析和权限的概念 &#x1f525;个人主页&#xff1a;大白的编程日记 &#x1f525;专栏&#xff1a;Linux学习笔记 文章目录 【Linux学习笔记】Linux基本指令分析和权限的概念前言一. 指令的分析1.1 alias 指令1.2 grep 指令1.3 zip/unzip 指…

Unity DOTS从入门到精通之 自定义Authoring类

文章目录 前言安装 DOTS 包什么是Authoring1. 实体组件2. Authoring类 前言 DOTS&#xff08;面向数据的技术堆栈&#xff09;是一套由 Unity 提供支持的技术&#xff0c;用于提供高性能游戏开发解决方案&#xff0c;特别适合需要处理大量数据的游戏&#xff0c;例如大型开放世…

linux如何判断进程对磁盘是随机写入还是顺序写入?

模拟工具&性能测试工具&#xff1a;fio fio参数说明&#xff1a; filename/dev/sdb1&#xff1a;测试文件名称&#xff0c;通常选择需要测试的盘的data目录。 direct1&#xff1a;是否使用directIO&#xff0c;测试过程绕过OS自带的buffer&#xff0c;使测试磁盘的结果更真…

olmOCR:高效精准的 PDF 文本提取工具

在日常的工作和学习中&#xff0c;是否经常被 PDF 文本提取问题困扰&#xff1f;例如&#xff1a; 想从学术论文 PDF 中提取关键信息&#xff0c;却发现传统 OCR 工具识别不准确或文本格式混乱&#xff1f;需要快速提取商务合同 PDF 中的条款内容&#xff0c;却因工具不给力而…

Leetcode 刷题记录 06 —— 矩阵

本系列为笔者的 Leetcode 刷题记录&#xff0c;顺序为 Hot 100 题官方顺序&#xff0c;根据标签命名&#xff0c;记录笔者总结的做题思路&#xff0c;附部分代码解释和疑问解答。 目录 01 矩阵置零 方法一&#xff1a;标记数组 方法二&#xff1a;两个标记变量 02 螺旋矩阵…