深度学习在人体动作识别领域的应用:开源工具、数据集资源及趋动云GPU算力不可或缺

人体动作识别检测是一种通过使用计算机视觉和深度学习技术,对人体姿态和动作进行实时监测和分析的技术。该技术旨在从图像或视频中提取有关人体姿态、动作和行为的信息,以便更深入地识别和理解人的活动。

人体动作识别检测的基本步骤包括:

  1. 数据采集:收集包含人体动作的图像或视频数据,这可以通过摄像头、深度传感器或其他传感器来完成。

  2. 预处理:对采集到的数据进行预处理,包括图像去噪、颜色调整等,以确保输入数据质量。

  3. 特征提取:提取图像或视频中的关键特征,例如人体关节点的位置、姿势等信息。

  4. 模型训练:使用深度学习模型,如卷积神经网络(CNN)或循环神经网络(RNN),对提取的特征进行训练,使模型能够识别和学习不同的人体动作。

  5. 实时检测:部署训练好的模型,对实时图像或视频进行检测,识别人体的姿态和动作。

上述步骤通常需要大规模 GPU 计算的支持。

为了更好地支持研究人员和开发者深入研究动作识别、检测、分类技术,本文将介绍一系列相关的开源工具箱、项目以及数据集资源。这些资源的综合使用将为动作相关技术的发展提供全面而有力的支持。

工具箱

MMSkeleton

MMSkeleton 是由香港中文大学多媒体实验室(MMLab)发布的一个基于骨架动作识别的视频分析开源工具箱,拥有领先的在视频中进行人体骨骼识别的能力,支持框架预训练模型,并提供多数据集。

开源地址:https://github.com/open-mmlab/mmskeleton

MMAction2

MMAction2 同样是由 MMLab 发布的一款基于 PyTorch 的视频理解开源工具箱,是 MMAction 的升级版,目前支持四大主流视频理解任务,分别是 Action Recognition、Skeleton based Action Recognition、Spatio-Temporal Action Detection 和 Temporal Action Localization。MMAction2 支持了 28 类视频理解模型 和 22 类视频理解数据集。

开源地址:https://github.com/open-mmlab/mmaction2

PYSKL

PYSKL 是在开源项目 MMAction2 的基础上进行构建的,使用 PYTorch 对骨架数据进行动作识别的工具箱。该工具箱支持多种骨架动作识别算法,包括基于 GCN 和 CNN 方法。

开源地址:https://github.com/kennymckormick/pyskl

数据集

EPIC-KITCHENS-100

EPIC-KITCHENS-100 是一个大规模的有关于厨房内第一视角活动的数据集,也是 Epic-kitchens-55 数据集的扩充版,视频总时长从 55 小时增加到了 100 小时,共包含超过 9 万个动作片段,97 个动词类别和 300 个名词类别。

论文链接:https://arxiv.org/abs/2006.13256

下载地址:https://epic-kitchens.github.io/2023

COIN

COIN 是由清华和美图共同开源的一个大规模视频分析数据集,包含 11827 条教程类视频,涉及日常生活中 12 个领域里的 180 个任务的视频内容。可以用于复杂场景下视频动作时序定位(temporal localization)、视频行为分析与理解问题的研究。

  • 论文链接:https://arxiv.org/abs/1903.02874

  • 下载地址:https://coin-dataset.github.io/

HOLLYWOOD2

HOLLYWOOD2 是一个人类行为动作视频数据集,内含 3669 个剪辑视频,视频总长度约为 20.1 小时,其中包括 12 类不同的人类行为动作,10 个场景,这些视频剪辑内容均来自 69 部好莱坞电影。

动作如:接电话、开车、吃饭、拥抱、接吻等。

场景如:户外、车内、厨房、办公室、商场、酒店等。

下载地址:https://www.di.ens.fr/~laptev/actions/hollywood2/

UCF Sports

UCF Sports 是一个主要关于运动的数据集,收集自 BBC 和 ESPN 的电视新闻,包含 150 段视频剪辑,视频分辨率为 720x480。

运动种类为:Diving、Golf Swing、Kicking、Lifting 、Riding Horse、Running、SkateBoarding、Swing-Bench、Swing-Side、Walking。

下载地址:https://www.crcv.ucf.edu/data/UCF_Sports_Action.php

UCF101

UCF101 数据集收集自 YouTube,是 UCF50 数据集的扩充版,从 50 个动作类别增加到 101 个类别,共 13320 个视频,这些视频都是由用户真实上传的,包含相机运动、各种照明条件、部分遮挡、低质帧等特点。

另外,该数据集主要包括 5 大类动作:人与物体交互,单纯的肢体动作,人与人交互,乐器演奏,体育运动。

下载地址:https://www.crcv.ucf.edu/data/UCF101.php


趋动云作为领先的算力服务提供商,不仅致力于提供灵活而成本可控的算力,同时还具备可扩展的存储解决方案。除此之外,趋动云还为用户提供了丰富多样的数据集资源,包括大规模的动作识别数据集如Kinetics-400UCF101等。

对于像Kinetics-400这样超过 100GB 的数据集,本地下载和训练需耗费大量时间,而在趋动云上,用户只需一键即可使用,极大地提升了用户的使用体验。

总体而言,GPU 算力在 AI 技术的发展中起到了至关重要的作用。它不仅推动了技术的创新,也为AI技术在各个领域的广泛应用奠定了基础。随着 GPU 算力的不断提升,我们可以期待看到更加强大、智能的动作识别技术,为我们的生活带来更丰富、便捷的体验。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/240146.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

web279(s2-001)

目前java小白一个,主要是学学别人的思路 进入题目,登录框一个 抓包也没发现什么东西 网上说是struts2框架 Struts2是用Java语言编写的一个基于MVC设计模式的Web应用框架 判断是不是基于struts2的一些方法: 1.通过页面回显的错误消息来判断…

MySQL一行记录是怎么存储的?

文章目录 MySQL 一行记录是怎么存储的?MySQL 的数据存放在哪个文件?表空间文件结构 InnoDB行格式有哪些Compact行格式varchar(n) 中 n 最大取值为多少?行溢出后,MySQL是怎么处理的? MySQL 一行记录是怎么存储的&#x…

IDEA 出现问题:git提交commit时Perform code analysis卡住解决方案

问题 git提交commit时Perform code analysis卡住很久 解决方案一 1、打开 IntelliJ IDEA,进入 File -> Settings(或者使用快捷键 CtrlAltS)。 2、在弹出的 Settings 窗口中,找到 Version Control -> Commit Dialog 选项…

Flink 有状态流式处理

传统批次处理方法 【1】持续收取数据(kafka等),以window时间作为划分,划分一个一个的批次档案(按照时间或者大小等); 【2】周期性执行批次运算(Spark/Stom等)&#xff1b…

机器学习---Adaboost算法

1. Adaboost算法介绍 Adaboost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然 后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)。Adaboost算法本身…

CSS学习

CSS学习 1. 什么是css?2.css引入方式2.1 内嵌式2.2 外联式2.3 行内式2.4 引入方式特点 3. 基础选择器3.1 标签选择器3.2 类选择器3.3 id选择器3.4 通配符选择器 1. 什么是css? 2.css引入方式 2.1 内嵌式 2.2 外联式 提示: 需要在html文件中link目标样式表; 2.3 行内式 注意:…

【EventBus】EventBus源码浅析

二、EventBus源码解析 目录 1、EventBus的构造方法2、订阅者注册 2.1 订阅者方法的查找过程2.2 订阅者的注册过程1. subscriptionsByEventType 映射:2. typesBySubscriber 映射:2.3 总结订阅者的注册过程 3、事件的发送 3.1 使用Post提交事件3.2 使用p…

【STM32】DMA直接存储器存取

1 DMA简介 DMA(Direct Memory Access)直接存储器存取 可以直接访问STM32的存储器的,包括运行SRAM、程序存储器Flash和寄存器等等 DMA可以提供外设寄存器和存储器或者存储器和存储器之间的高速数据传输,无须CPU干预,节…

【lombok】从easyExcel read不到值到cglib @Accessors(chain = true)隐藏的大坑

背景: 在一次使用easyExcel.read 读取excel时,发现实体类字段没有值,在反复测试后,发现去掉Accessors(chain true)就正常了,为了验证原因,进行了一次代码跟踪 由于调用链路特别长,只列举出部分代码&#x…

二蛋赠书十一期:《TypeScript入门与区块链项目实战》

前言 大家好!我是二蛋,一个热爱技术、乐于分享的工程师。在过去的几年里,我一直通过各种渠道与大家分享技术知识和经验。我深知,每一位技术人员都对自己的技能提升和职业发展有着热切的期待。因此,我非常感激大家一直…

【C 剑指offer】有序整型矩阵元素查找 {杨氏矩阵}

目录 题目内容: 思路: 图形演示: 复杂度分析 C源码: /** *************************************************************************** ******************** ********************* ******…

DWA(dynamic window approach)算法学习

系列文章目录 A*算法学习-CSDN博客 弗洛伊德算法(Floyd)和路径平滑弗洛伊德算法(Smooth Floyd)学习-CSDN博客 D*算法学习-CSDN博客 目录 系列文章目录 前言 搜索空间 —减小速度搜索空间 优化过程 —最大化目标函数 算法实…

《洛谷深入浅出》斯特林数

斯特林数被分为三种,但我们这只介绍两种。即第一类斯特林数,和第二类斯特拉数。 第一类斯特林数指的是: 将n个不同元素,变成m个圆排列的方案数量。第一类斯特林数,分为有符号和无符号。通常我们只研究无符号斯特林数&…

Layui深入

1、代码&#xff1a; <!DOCTYPE html> <html> <head> <meta charset"utf-8"> <title>注册页面</title> <style> .container { max-width: 600px; margin: 0 auto; padding: 20px; …

Proxmox VE 安装 OpenWrt 配置旁路由教程

话不多说&#xff0c;本篇文章将记录如何在 Proxmox VE 环境通过虚拟机安装 OpenWrt 配置旁路由的过程&#xff0c;仅做参考。 PVE 创建虚拟机 名称随意&#xff0c;GuestOS 选择 Linux&#xff0c;不使用任何 iso 镜像。&#xff08;记住你的 VMID&#xff09; 清空将要创建…

超越边界:Mistral 7B挑战AI新标准,全面超越Llama 2 13B

引言 在人工智能领域&#xff0c;模型的性能一直是衡量其价值和应用潜力的关键指标。近日&#xff0c;一个新的里程碑被设立&#xff1a;Mistral AI发布了其最新模型Mistral 7B&#xff0c;它在众多基准测试中全面超越了Llama 2 13B模型&#xff0c;标志着AI技术的一个重大进步…

python实现形态学建筑物指数MBI提取建筑物及数据获取

前言 形态学建筑物指数MBI通过建立建筑物的隐式特征和形态学算子之间的关系进行建筑物的提取[1]。 原理 上图源自[2]。 实验数据 简单找了一张小图片&#xff1a; test.jpg 代码 为了支持遥感图像&#xff0c;读写数据函数都是利用GDAL写的。 import numpy as np import …

静态路由的原理和配置

一.路由器的工作原理 首先我们知道路由器是工作在网络层的&#xff0c;那就是三层设备。网络层的功能主要为&#xff1a;不同网段之间通信、最佳路径选择也就是逻辑地址&#xff08;ip地址&#xff09;寻址、转发数据。 1.路由器是什么 路由器是能将数据包转发到正确的目的地…

【MySQL】MySQL数据库基础--什么是数据库/基本使用/MySQL架构/存储引擎

文章目录 1.什么是数据库2.主流数据库3.基本使用3.1MySQL安装3.2连接服务器3.3服务器管理3.4服务器&#xff0c;数据库&#xff0c;表关系3.5使用案例3.6数据逻辑存储 4.MySQL架构5.SQL分类6.存储引擎6.1什么是存储引擎6.2查看存储引擎6.3存储引擎对比 1.什么是数据库 对于回答…

【vue实战项目】通用管理系统:信息列表,信息的编辑和删除

本文为博主的vue实战小项目系列中的第七篇&#xff0c;很适合后端或者才入门的小伙伴看&#xff0c;一个前端项目从0到1的保姆级教学。前面的内容&#xff1a; 【vue实战项目】通用管理系统&#xff1a;登录页-CSDN博客 【vue实战项目】通用管理系统&#xff1a;封装token操作…