视频行人搜索 (Person Search in Videos)

文章目录

  • 视频行人搜索 (Person Search in Videos)
    • 图像行人搜索
    • 存在问题
    • Video PS 定义
    • MTA-PS数据集
      • First person search dataset in videos
      • Complicated ambient conditions and realistic monitoring scenarios
      • Privacy insensitivity
    • 方法

视频行人搜索 (Person Search in Videos)

MTA-PS: TOWARDS PRACTICAL PERSON SEARCH IN VIDEOS论文已被 ICIP2024 接收。
代码地址:MTA-PS
论文和数据集链接将会更新。

图像行人搜索

Person Search(行人搜索,PS)旨在从自然的、未经裁剪的图像中同时定位和识别目标人物。

存在问题

  • 图像与现实的差距:现有的PS数据集和研究工作大多基于个人图像,在现实世界中的监控场景实用性有限。尽管行人搜索在两个广泛使用的数据集(即 CUHK-SYSU 和 PRW)上取得了显着进展,但它们都仅由图像组成,导致与现实世界视频监控场景的偏差,以及在实际视频监控系统中需要克服更多挑战。

  • 视频相对图像的优势:与静态图像相比,视频提供额外的时间信息,可以更好的克服遮挡形变等图像难以解决的问题,使从视频中搜索目标人物的轨迹更真实、更准确。

  • 视频数据集的缺失:为了促进视频行人搜索的发展,数据集需要提供全面的GT,特别是在所有摄像机上一致的id。这样的数据不仅难以注释,而且可能违反当前或未来的数据保护权利。例如,杜克大学在2014年提出的一个流行的数据集DukeMTMC作为校园监控视频数据集,在2019年因隐私问题而被禁用。

Video PS 定义

给定目标人的查询图像,我们的目标是搜索目标人物在视频图库中出现的位置,并获得目标人物沿视频序列的完整时间轨迹。

MTA-PS数据集

一个标准的基于视频的人物搜索数据集应该满足以下要求:首先,这些摄像机应该在同一个大场景中,摄像机之间有一些重叠。其次,我们需要确保绝大多数人至少出现在两个摄像头中。通过这种方式,我们可以为出现在多个摄像机中的每个人从其中一个摄像机中选择一个帧作为查询。
在这里插入图片描述

First person search dataset in videos

在这里,我们介绍一个新的数据集,名为MTA-PS,这是第一个视频行人搜索数据集。我们的MTA- ps数据集是基于一个大规模的虚拟数据集MTA中的视频帧和身份标签构建的。MTA数据集记录在侠盗猎车手5 (GTA5)虚拟世界的一小部分,提供了高度的真实感和细节。

Complicated ambient conditions and realistic monitoring scenarios

因此,我们新引入的MTA-PS数据集包含295.2K图像帧,7.2M边界框和1.8K身份,这些图像帧来自6台摄像机和41 FPS的60个视频。MTA-PS考虑了重叠和非重叠摄像机、夜间和白天、室内和室外区域以及不同程度的拥挤,这使得数据集更具挑战性。与现有广泛使用的视频数据集相比,我们的MTAPS数据集在各方面覆盖的多样性程度更高,更具挑战性,更接近实际应用场景,如表1所示。我们将MTA-PS数据集的关键特征总结如下。
在这里插入图片描述

Privacy insensitivity

虚拟数据集克服隐私问题。

方法

为了验证视频行人搜索的有效性,并充分利用我们数据集上的时间信息,我们还通过无缝集成人物检测、跟踪和重新识别三个子任务,提出了一个新的框架。
在这里插入图片描述
由于性能优异,我们采用了最近提出的ByteTrack作为我们的基网。首先,将由多个视频组成的视频库馈送到主干。然后,分类头、回归头、IoU头和re-ID头共同工作,得到每帧中每个人的边界框和re-ID特征。然后进行数据关联和运动预测,将视频库中的每个行人边界框进行关联,得到每个人的轨迹和相应的特征。同时,保留视频中每个人的时间特征,并与每个人的re-ID特征融合,得到每个人ID对应的特征。然后,我们计算这些特征与查询人特征之间的相似度。最后,从视频库中提取目标人物在不同摄像机下的运动轨迹。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/700533.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

数字芯片——时钟与复位

关于此次章节我想要探讨的问题是门控时钟的处理(Clock Gating Methodology)和时钟复位策略。在低功耗设计中,门控时钟是结构最简洁,最容易实现的电路结构。如上期所讲的,一个控制信号和时钟逻辑与在一起输出的信号作用…

万界星空科技定制化MES系统,实现数字化生产

一、MES生产管理系统强调三个方面: 1、MES是对整个车间制造过程的优化,而不是单一的解决某个生产瓶颈。 2、MES必须提供实时收集生产过程中数据的功能,并作出相应的分析和处理。 3、MES需要与计划层和控制层进行信息交互,通过企业…

程序员,真有不变的技术和稳定的工作吗?

在程序员这个充满变化和创新的领域,很多人追求“稳定”的工作,认为找到一个合适的公司和岗位就能安心一辈子。然而,技术的快速更新迭代和市场需求的不断变化,使得真正的稳定变得越来越难以捉摸。作为程序员,我们需要反…

C# Winform内嵌窗体(在主窗体上显示子窗体)

在开发Winform项目中,经常会要切换不同的窗体。通常程序都有一个主窗体,在切换窗体时往往需要关闭其他子窗体,这个实例就来介绍MDI主窗体内嵌子窗体的实现方法。 MDI主窗体要设置一个比较重要的属性,IsMdiContainertrue。子窗体的…

【云原生】创建harbor私有仓库及使用aliyun个人仓库

1.安装docker #删除已有dockersystemctl stop docker yum remove docker \docker-client \docker-client-latest \docker-common \docker-latest \docker-latest-logrotate \docker-logrotate \docker-engine #安装docker yum install -y docker-ce-20.10.1…

NLP中的Tokenizer分词器的概念与实现

Tokenizer 在开始学习 NLP 相关知识之前,先要学习一个叫 Tokenizer 的概念,这可谓是所有 NLP 模型开始训练前需要做的一个步骤,那么 Tokenizer 是什么? 在计算机处理一行语句的时候,我们给其输入一个 String&#xff…

Android Media Framework(五)Tunnel Mode

本篇将聚焦Android Tunnel Mode,详细解析组件之间隧道连接过程、数据传递过程、组件销毁过程。通过阅读本篇内容,我们应能对tunneled组件的连接过程和buffer分配过程有所了解。 1、Tunnel Mode介绍 IL Spec详细描述了Tunnel Component的实现方式&#x…

【ArcGISProSDK】OpenItemDialog打开文件对话框

打开单个文件 效果 代码 public async void OpenFunction() {// 获取默认数据库var gdbPath Project.Current.DefaultGeodatabasePath;OpenItemDialog openItemDialog new OpenItemDialog() { Title "打开要素文件",InitialLocation gdbPath,Filter ItemFilte…

Linux 性能优化实战

文章目录 33 | 关于 Linux 网络,你必须知道这些(上)设计高并发架构需要考虑什么?如何理解分布式?如何理解云计算?如何理解微服务?TCP/IP网络分层模型是什么?每一层的功能是什么&…

矩阵练习2

48.旋转图像 规律: 对于矩阵中第 i行的第 j 个元素,在旋转后,它出现在倒数第i 列的第 j 个位置。 matrix[col][n−row−1]matrix[row][col] 可以使用辅助数组,如果不想使用额外的内存,可以用一个临时变量 。 还可以通…

STM32项目分享:智能窗帘系统

目录 一、前言 二、项目简介 1.功能详解 2.主要器件 三、原理图设计 四、PCB硬件设计 1.PCB图 2.PCB板打样焊接图 五、程序设计 六、实验效果 七、资料内容 项目分享 一、前言 项目成品图片: 哔哩哔哩视频链接: https://www.bilibili.c…

基于VLC可见光通信的室内光通信信道信噪比分析matlab仿真

目录 1.算法运行效果图预览 2.算法运行软件版本 3.部分核心程序 4.算法理论概述 5.算法完整程序工程 1.算法运行效果图预览 2.算法运行软件版本 matlab2022a 3.部分核心程序 ..................................................................... % 接收功率计算Pr …

使用spark基于出租车GPS数据实现车辆数量统计以及北京每个城区的车辆位置点数分析

使用spark基于出租车GPS数据实现车辆数量统计以及北京每个城区的车辆位置点数分析 本文将介绍如何使用pyspark以及scala实现的spark分析出租车GPS数据,具体来说,我们将计算每个北京城区内的车辆位置点数,以及统计出租车的数量。我们将使用两…

Vue 3与ESLint、Prettier:构建规范化的前端开发环境

title: Vue 3与ESLint、Prettier:构建规范化的前端开发环境 date: 2024/6/11 updated: 2024/6/11 publisher: cmdragon excerpt: 这篇文章介绍了如何在Vue 3项目中配置ESLint和Prettier以统一代码风格,实现代码规范性与可读性的提升。通过设置规则、解…

49、Flink 的数据源的 SplitReader API 详解

SplitReader API a)概述 核心的 SourceReader API 是完全异步的,但实际上,大多数 Sources 都会使用阻塞的操作,例如客户端(如 KafkaConsumer)的 poll() 阻塞调用,或者分布式文件系统&#xff…

商业智能(BI)期末复习

商业智能(BI)期末复习 商业智能(BI)期末复习 2024/06/17 13:30-15:00 1.工作簿包含工作表 2.tableau是一款轻型BI工具 3.敏捷BI成本比较低 因为可以不建立数据仓库 4.敏捷BI的能带来更高的质量系统 是在用户监督下建立起来的 …

Python易错点总结

目录 多分支选择结构 嵌套选择 用match模式识别 match与if的对比 案例:闰年判断 三角形的判断 用whlie循环 高斯求和 死循环 用for循环 ​编辑continue​编辑 whlie与else结合 pass 序列 列表(有序) 元组(有序&…

高仿imtoken钱包源码/获取助记词/获取私钥/自动归集

高仿imtoken钱包/获取助记词/获取私钥/自动归集 带双端,无纯源码 源码下载:https://download.csdn.net/download/m0_66047725/89379118 更多资源下载:关注我。

【免杀】C2远控-APC注入-进程镂空

目录 进程镂空&傀儡进程(主要过内存扫描)代码 傀儡进程演示如何上线上线演示 APC注入&进程欺骗(主要过内存扫描)同步调用与异步调用代码演示 进程镂空&傀儡进程(主要过内存扫描) 进程镂空(Pro…

16.左侧导航菜单制作

左侧导航菜单制作 1. 修改路由&#xff0c;方便查看页面 index.ts import { RouteRecordRaw, createRouter, createWebHistory } from "vue-router"; import Layout from /layout/Index.vueconst routes: Array<RouteRecordRaw> [{path: /,name: home,comp…