深度视觉目标跟踪进展综述-论文笔记

中科大学报上的一篇综述,总结得很详细,整理了相关笔记。

1    引言

目标跟踪旨在基于初始帧中指定的感兴趣目标( 一般用矩形框表示) ,在后续帧中对该目标进行持续的定位。

基于深度学习的跟踪算法,采用的框架包括相关滤波器、分类式网络、双路网络等。

处理跟踪任务的角度,分为基于匹配思路的双路网络和基于二分类的辨别式跟踪器。

最初的深度跟踪算法聚焦于相关滤波器,通过深度学习的特征+相关滤波器实现。

基于双路网络跟踪算法那,将跟踪视为模板匹配,抗干扰能力较差。

近期基于Transformer的深度跟踪器使用注意力机制,取得了领先的性能。

2    跟踪数据集发展趋势

数据、算法和算力是人工智能最重要的三个要素,是人工智能的三个基石。

3    深度跟踪算法

3.1    深度相关滤波器跟踪

相关滤波器( correlation filter,CF) 通过学习一个具有区分力的滤波器来处理待跟踪的图片,其输出结果为一个响应图,表示目标在后续帧中不同位置的置信度.

在早期的工作中,研究人员探索如何将离线训练好的深度特征(如利用ImageNet预训练的 VGG模型)与相关滤波器进行结合。本质就是将HOG等手工特征替换成神经网络提取的特征。

深度学习提取特征的特点是,高层的语义特征对于目标的抽象表达能力很强,而低层的模型特征擅长刻画目标的纹理、形状等底层信息.

HCF算法的示意图,融合了不同层次的深度特征。

得益于相关滤波器的闭合解,研究人员尝试将滤波器和深度特征提取网络进行联合训练,等于是深度特征从离线获取升级到联合训练。

CFNet算法的架构,就是采用联合训练的模式。

3.2    基于分类的深度跟踪器

基于分类的深度跟踪方法受经典的目标检测框架R-CNN的启发,将目标跟踪任务视为二分类( 目标和背景) 任务。

对每个视频,分别训练独立的分类层(最后一个全连接层)用于区分当前视频域中的目标和干扰物.

3.3双路网络跟踪算法

双路网络框架(SiamFC),此方法利用卷积网络提取目标模板和搜索区域的特征,然后再进性相关操作生成响应图,其中响应图上的峰值点就是目标所在的位置。

在此之后,考虑到SiamFC对目标尺度的回归仍然采用传统缩放形式不能准确地获得目标的尺度信息。

SiamRPN ++解决了边界填充问题,也使用了多层次特征融合的方法。

尽管以上的双路网络方法在视频目标跟踪中取得了很大的成功,但是仍然存在缺陷,缺少在线更新过程.MemTrack、Meta-Tracker、Re2EMA、UpdateNet和GradNet等, 提出了不同的模板更新算法。

3.4基于梯度优化的深度跟踪方法

CREST的该卷积核和搜索图片的特征图进行卷积,可以生成响应图用于目标跟踪,有点模版匹配的味道。

3.5基于Transformer的深度跟踪方法

Transformer的核心模块是注意力机制,可以将全局信息聚合到需要的位置.

4展望

如何设计适合他们的轻量级模型,例如使用神经网络搜索的方式来获得更优的模型结构,以兼顾低内存消耗和高精度具有重要的研究价值。总之就是平衡精度与模型复杂度之间矛盾。

5结论

虽然深度学习算法取得了令人瞩目的成绩,但与此同时带来的跟踪效率限制和模型存储消耗等问题仍需进一步完善.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/349777.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

pcl+vtk(十四)vtkCamera相机简单介绍

一、vtkCamera相机 人眼相当于三维场景下的相机, VTK是用vtkCamera类来表示三维渲染场景中的相机。vtkCamera负责把三维场景投影到二维平面,如屏幕、图像等。 相机位置:即相机所在的位置,用方法vtkCamera::SetPosition()设置。 相…

力扣hot100 腐烂的橘子 BFS 矢量数组 满注释版

Problem: 994. 腐烂的橘子 文章目录 思路复杂度💝 Code 思路 👨‍🏫 参考 复杂度 时间复杂度: O ( n ) O(n) O(n) 空间复杂度: O ( n ) O(n) O(n) 💝 Code class Solution {int[] dx new int[] { 0, 1, 0, -1 };// 行 矢…

如何快速搭建实用的爬虫管理平台

目录 一、前言 二、选择合适的爬虫框架 三、搭建数据库 步骤1 步骤2 步骤3 四、搭建Web服务器 步骤1 步骤2 步骤3 步骤4 五、管理爬虫 六、总结 一、前言 爬虫是互联网数据采集的关键工具,但是随着数据量的增加和需求的多样化,手动运行和管…

SpringMVC-HttpMessageConverter 报文信息转化器

文章目录 HttpMessageConverter一、概念二、RequestBody三、RequestEntity四、 ResponseBody1.返回JSON格式的字符串 五、RestController六、ResponseEntity HttpMessageConverter 一、概念 报文信息转化器,将请求报文转化为Java对象,或将Java对象转化…

【图像分割】【深度学习】Windows10下UNet代码Pytorch实现与源码讲解

【图像分割】【深度学习】Windows10下UNet代码Pytorch实现与源码讲解 提示:最近开始在【医学图像分割】方面进行研究,记录相关知识点,分享学习中遇到的问题已经解决的方法。 文章目录 【图像分割】【深度学习】Windows10下UNet代码Pytorch实现与源码讲解前言UNet模型运行环境搭…

解决 Required Integer parameter ‘uid‘ is not present

1.原因分析 后端没接收到uid可能是前端没传递uid也可能是前端传递了uid,但是传递方式与后端接收方式不匹配,导致没接收到更大的可能是因为后端请求方式错了。比如: 2.解决方案 先确定前端传参方式与后端请求方式是匹配的后端get请求的话…

动态库和静态库的理解 Linux

其实库文件里面的内容就是函数的实现方法,向我们包含的头文件其实就是函数的生命,而我们编译链接程序时会自动加载库文件,最终形成可执行程序。其实我们在编译链接时不仅仅会将文件的库文件加载进来,其实头文件也是需要加载进来的…

C++输入输出流

输入/输出流类:iostream---------i input(输入) o output(输出) stream:流 iostream: istream类:输入流类-------------cin:输入流类的对象 ostre…

企业级大数据安全架构(六)数据授权和审计管理

作者:楼高 本节详细介绍企业级大数据架构中的第六部分,数据授权和审计管理 1.Ranger简介 Apache Ranger是一款被设计成全面掌管Hadoop生态系统的数据安全管理框架,为Hadoop生态系统众多组件提供一个统一的数据授权和管理界面, 管…

品牌突围|内容营销「共创公式」全面讲解

为什么品牌要扎根小红书?除了种草投放,品牌还能做些什么? 在小红书,迎接消费者共创的时代,激活品牌营销的无限潜能。 拥抱多元 在新机遇中预见未来 2023年,各大社交媒体平台涌现出了许多热点&#xff0c…

软件测试工作中需要使用的工具

作为一个测试人员在日常工作中会使用到很多的工具,今天给大家分享一下这些工具。对软件测试、接口、自动化、性能测试和日常文档编写办公有帮助的网站。 接口测试大力推荐国产的接口测试工具:apipost,apipost还是一款很不错的接口文档生产工…

OpenCV图像的基本操作

图像的基本操作(Python) 素材图 P1:die.jpg P2:cool.jpg V:rabbit.mp4, 下载地址 读取展示-图像 import cv2img_1 cv2.imread(./die.jpg) # default cv2.IMREAD_COLOR print("die.jpg shape(imre…

Python 实现自动化测试 dubbo 协议接口

前言 在工作或学习过程中,可能会遇到后端服务里有使用 dubbo 协议实现的接口,dubbo 协议接口的测试方法不同于 http/https 类型的接口,不能简单使用request.post的方法来完成自动化测试。 如果需要对 dubbo 协议的接口进行自动化测试&#…

数据结构篇-02:最小栈

对于这道题,除了 getMin 外的功能,传统的 栈 结构中都有,所以重点在于如何实现 getMin 方法。 有两类方法:使用辅助栈/不使用辅助栈 使用辅助栈的解法一 定义一个 栈 来实现常规功能,另外定义一个栈(最小…

2016年认证杯SPSSPRO杯数学建模A题(第一阶段)洗衣机全过程文档及程序

2016年认证杯SPSSPRO杯数学建模 A题 洗衣机 原题再现: 洗衣机是普及率极高的家用电器,它给人们的生活带来了很大的方便。家用洗衣机从工作方式来看,有波轮式、滚筒式、搅拌式等若干种类。在此基础上,各厂商也推出了多种具体方案…

Flink多流转换(2)—— 双流连结

双流连结(Join):根据某个字段的值将数据联结起来,“配对”去做处理 窗口联结(Window Join) 可以定义时间窗口,并将两条流中共享一个公共键(key)的数据放在窗口中进行配…

软考培训机构哪家比较好?各软考培训机构排名如何?

先放上机构测评图 一、机构情况 (1)主营业务 大多数软考培训机构主要致力于IT培训或者软件行业。这些机构的课程更加专业,因为他们起源于该行业。我相信报考软考的同学大部分也是从事这个行业的。个人认为选择这类机构进行培训会有更多好处…

图片保存后多了个水印?教你如何用华为手机保存无水印图片

对于各类生活App的深度用户来说,有时候碰到实用的生活技巧、攻略,甚至是一张好看的风景照,都会第一时间想要长按把图片保存到手机相册,有时候还会分享给朋友、朋友圈。 但是有些图片在App上显示的时候是干净的,保存下…

day30_回溯总结

文章目录 回溯的问题总结:1. 回溯三部曲:2. 回溯的模板3. 回溯题型4. 回溯的概念:5. 回溯的重点问题:组合和去重。[5.1 组合问题:](https://programmercarl.com/0077.%E7%BB%84%E5%90%88.html)剪枝优化[5.2 去重问题—…

接口自动化中如何完成接口加密与解密?

加密是一种限制对网络上传输数据的访问权的技术。将密文还原为原始明文的过程称为解密,它是加密的反向处理。在接口开发中使用加密、解密技术,可以防止机密数据被泄露或篡改。在接口自动化测试过程中,如果要验证加密接口响应值正确性的话&…