创新性融合丨卡尔曼滤波+目标检测 新突破!

2024深度学习发论文&模型涨点之——卡尔曼滤波+目标检测

卡尔曼滤波是一种递归算法,用于估计线性动态系统的状态。它通过预测和更新两个步骤,结合系统模型和观测数据,来估计系统状态,并最小化估计的不确定性。

在目标检测中,卡尔曼滤波可以用于预测目标下一时刻的位置和速度,然后利用观测数据(如摄像头捕获的图像)来校正预测,从而提高目标跟踪的准确性。

卡尔曼滤波与目标检测的结合可以有效解决跟踪过程中的干扰和遮挡问题,实现在运动较快、干扰较强和有遮挡情况下的高性能跟踪。

我整理了一些卡尔曼滤波+目标检测【论文+代码】合集,需要的同学公人人人号【AI创新工场】自取。

论文精选

论文1:

BoT-SORT: Robust Associations Multi-Pedestrian Tracking

BoT-SORT:稳健关联的多人跟踪

方法

结合运动和外观信息:提出了一种新的稳健跟踪器BoT-SORT,结合了运动和外观信息的优势。

相机运动补偿:引入相机运动补偿机制,以提高跟踪精度。

卡尔曼滤波器状态向量优化:优化卡尔曼滤波器状态向量,以实现更准确的框定位。

IoU和ReID融合:开发了一种新的方法,用于结合IoU距离矩阵和余弦距离矩阵,以实现检测和轨迹之间更稳健的关联。

图片

创新点

性能提升:BoT-SORT在MOT17和MOT20数据集上实现了80.5的MOTA、80.2的IDF1和65.0的HOTA,显著优于其他跟踪器。

相机运动补偿:通过相机运动补偿,提高了跟踪器在动态相机场景下的鲁棒性。

卡尔曼滤波器优化:通过优化卡尔曼滤波器状态向量,提高了框定位的准确性。

关联方法创新:通过IoU和ReID的融合,实现了更稳健的检测和轨迹关联,提高了跟踪的准确性。

图片

论文2:

FishMOT: A Simple and Effective Method for Fish Tracking Based on IoU Matching

FishMOT:基于IoU匹配的简单有效的鱼类跟踪方法

方法

基础模块:基于检测框之间的IoU进行目标关联,以处理鱼类形态变化。

交互模块:结合检测框和鱼类实体的IoU来处理遮挡问题。

重新查找模块:利用时空信息来克服复杂环境中检测器漏检导致的跟踪失败。

图片

创新点

性能提升:FishMOT在MOTA指标上实现了99.93%的准确率,显著优于其他鱼类跟踪方法。

计算复杂度降低:由于不需要复杂的特征提取或每个鱼类的身份分配,FishMOT减少了计算复杂度和内存消耗。

鲁棒性和泛化性:FishMOT在不同环境和鱼类数量下表现出色,显示出良好的鲁棒性和泛化性。

无需Kalman滤波器:FishMOT不需要Kalman滤波器来预测连续帧的检测框,进一步简化了跟踪流程。

图片

论文3:

SearchTrack: Multiple Object Tracking with Object-Customized Search and Motion-Aware Features

SearchTrack:具有对象定制搜索和运动感知特征的多目标跟踪

方法

对象定制搜索:为每个对象创建一个定制的全卷积搜索引擎,通过学习一组特定于对象的动态卷积权重。

运动感知特征:通过卡尔曼滤波器预测对象位置,并将预测的运动编码到运动感知特征中。

点基检测方法:基于CenterNet检测器,通过对象中心点进行检测。

动态搜索器:使用动态生成的卷积核来搜索特定对象。

图片

创新点

性能提升:SearchTrack在KITTI MOTS基准测试中实现了71.5%的HOTA(汽车)和57.6%的HOTA(行人),显著优于其他在线2D方法。

运动信息的重要性:通过将运动信息编码到特征图中,显著提高了关联准确性,特别是在非刚性行人类别中。

计算效率:由于每个帧只需要通过主干网络一次,显著减少了计算时间。

分割分支的协同作用:通过与分割任务的联合训练,跟踪性能得到了显著提升。

图片

论文4:

Multi-Modal Sensor Fusion and Object Tracking for Autonomous Racing

自动驾驶赛车的多模态传感器融合与目标跟踪

方法

模块化后期融合:提出了一种模块化的多模态传感器融合和跟踪方法,用于高速应用。

扩展卡尔曼滤波器(EKF):基于EKF融合异构检测输入以一致地跟踪周围物体。

延迟补偿:提出了一种新颖的延迟补偿方法,以减少感知软件延迟的影响,并输出更新的物体列表。

图片

创新点

鲁棒性验证:在AC@CES 2022的高速真实场景中验证了跟踪算法,证明了其在嵌入式系统上的鲁棒性和计算效率。

异构检测输入融合:能够融合来自不同传感器模态的检测输入,优化了跟踪性能。

延迟补偿效果:通过反向-前向积分实现了感知软件延迟的补偿,显著提高了跟踪精度。

图片


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/938415.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

USB模块布局布线

1、USB接口定义 2、USB模块常规分类介绍 3、USB常用管脚定义图示 4、USB模块布局布线分析 USB3.0高速线因为速度比较高,建议走圆弧线不能走钝角 5、总结 1、CTRL鼠标中间滑轮按下可以看线的长度 2、不懂差分类和规则的设置,可以看本人写的AD基础操作…

SpringCloud系列之分布式配置中心极速入门与实践

[toc] 1、分布式配置中心简介 在实际的项目开发中,配置文件是使用比较多的,很多项目有测试环境(TEST)、开发环境(DEV)、规范的项目还有集成环境(UAT)、生产环境(PROD),每个环境就一个配置文件。 CSDN链接:SpringCloud系列之分布式…

【Vue3学习】setup语法糖中的ref,reactive,toRef,toRefs

在 Vue 3 的组合式 API(Composition API)中,ref、reactive、toRef 和 toRefs 是四个非常重要的工具函数,用于创建和管理响应式数据。 一、ref 用ref()包裹数据,返回的响应式引用对象,包含一个 .value 属性&#xff0…

解决 Git Permission denied 问题

前言 push项目时出现gitgithub.com: Permission denied (publickey). fatal: Could not read from remote repository.Please make sure you have the correct access rights and the repository exists.出现这个问题表示你在尝试将本地代码推送到GitHub时,没有提供…

React的状态管理库-Redux

核心思想:单一数据源、状态是只读的、以及使用纯函数更新状态。 组成部分 Store(存储) 应用的唯一状态容器,存储整个应用的状态树,使用 createStore() 创建。 getState():获取当前状态。dispatch(action)&#xff…

蓝卓总裁谭彰:AI+工业互联网推动制造业数字化转型

近日,新一代工业操作系统supOS6.0在2024中国5G工业互联网大会上重磅发布。 大会期间,工信部新闻宣传中心《人民邮电报》对蓝卓总裁谭彰就“工业互联网人工智能技术融合的思考”“supOS6.0的探索与实践”“未来工业互联网平台的发展方向”展开专题访谈&am…

RabbitMQ消息队列的笔记

Rabbit与Java相结合 引入依赖 <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-amqp</artifactId> </dependency> 在配置文件中编写关于rabbitmq的配置 rabbitmq:host: 192.168.190.132 /…

数据结构:贪吃蛇详解

目录 一.地图的设计 1.字符与坐标&#xff1a; 2.本地化&#xff08;头文件&#xff09;: 3.类项&#xff1a; 4.setlocale函数&#xff1a; &#xff08;1&#xff09;函数原型&#xff1a; &#xff08;2&#xff09;使用&#xff1a; 5.宽字符的打印&#xff1a; &a…

医学AI前沿进展:图像分割以及细胞分割领域的最新研究|文献速递·24-12-17

小罗碎碎念 今天推文和大家分享医学AI领域中&#xff0c;图像分割以及细胞分割方面的三个工作。 首先看一下图像分割以及细胞分割方面&#xff0c;近五年的一个论文发表情况&#xff0c;我们可以看到&#xff0c;这个领域在前几年的热度基本持平&#xff0c;到了24年迎来了一个…

Endnote | 查看文献所在分组

软件版本&#xff1a;Endnote X8 第一种方式&#xff1a; 在文献上右键——记录摘要&#xff0c;即可在弹出页面上看到自定义和智能组的分组情况。 第二种方式&#xff1a; 在菜单栏点击文献——记录摘要&#xff0c;也可以查看分组情况。 注&#xff1a; 新版本的endnote软件…

ElasticSearch 数据聚合与运算

1、数据聚合 聚合&#xff08;aggregations&#xff09;可以让我们极其方便的实现数据的统计、分析和运算。实现这些统计功能的比数据库的 SQL 要方便的多&#xff0c;而且查询速度非常快&#xff0c;可以实现近实时搜索效果。 注意&#xff1a; 参加聚合的字段必须是 keywor…

34. 在排序数组中查找元素的第一个和最后一个位置 二分法

34. 在排序数组中查找元素的第一个和最后一个位置 class Solution { public:vector<int> searchRange(vector<int>& nums, int target) {vector<int> res(2,-1);res[0]findleft(nums,target);if(res[0] -1) return res;res[1] findright(nums,target);…

回型矩阵:JAVA

解题思路&#xff1a; 通过定义四条边界&#xff1b;top,left,right,bottom,来循环&#xff0c;当top>bottom&&left>right的时候循环终止 循环结束的条件&#xff1a; 链接&#xff1a;登录—专业IT笔试面试备考平台_牛客网 来源&#xff1a;牛客网 题目描述…

基于单片机的农田灌溉系统(论文+源码)

1.系统设计 本系统主要实现如下目标&#xff1a; 1&#xff0e;可以实时监测土壤湿度&#xff1b; 2&#xff0e;土壤湿度太低时&#xff0c;进行浇水操作&#xff1b; 3&#xff0e;可以按键设置湿度的触发阈值&#xff1b; 4. 可以实现远程操控 5&#xff0e;可以实现手…

QoS分类和标记

https://zhuanlan.zhihu.com/p/160937314 1111111 分类和标记是识别每个数据包优先级的过程。 这是QoS控制的第一步&#xff0c;应在源主机附近完成。 分组通常通过其分组报头来分类。下图指定的规则仔细检查了数据包头 &#xff1a; 下表列出了分类标准&#xff1a; 普通二…

Python脚本基于Tesseract-OCR实现图文识别

一、了解Tesseract-OCR 开源地址&#xff1a;https://github.com/tesseract-ocr/tesseract Tesseract-OCR 是一个开源的光学字符识别&#xff08;OCR&#xff09;引擎&#xff0c;能够识别图片中的文字并将其转化为可编辑的文本。它最初由惠普公司&#xff08;Hewlett-Packard…

软件集成测试内容和作用简析

在现代软件开发过程中&#xff0c;软件集成测试作为关键的一环&#xff0c;日益受到重视。特别是随着信息技术的快速发展&#xff0c;各类软件系统日益庞大复杂&#xff0c;如何确保系统不同模块的顺畅合作&#xff0c;成为了每个项目成功的重要基础。集成测试是指在软件开发过…

23. 合并 K 个升序链表(java)

题目描述&#xff1a; 给你一个链表数组&#xff0c;每个链表都已经按升序排列。 请你将所有链表合并到一个升序链表中&#xff0c;返回合并后的链表。 示例 1&#xff1a; 输入&#xff1a;lists [[1,4,5],[1,3,4],[2,6]] 输出&#xff1a;[1,1,2,3,4,4,5,6] 解释&#xff…

Vscode搭建C语言多文件开发环境

一、文章内容简介 本文介绍了 “Vscode搭建C语言多文件开发环境”需要用到的软件&#xff0c;以及vscode必备插件&#xff0c;最后多文件编译时tasks.json文件和launch.json文件的配置。即目录顺序。由于内容较多&#xff0c;建议大家在阅读时使用电脑阅读&#xff0c;按照目录…

解决并发情况下调用 Instruct-pix2pix 模型推理错误:index out of bounds 问题

解决并发情况下调用 Instruct-pix2pix 模型推理错误&#xff1a;index out of bounds 问题 背景介绍 在对 golang 开发的 图像生成网站 进行并发测试时&#xff0c;调用基于 Instruct-pix2pix 模型和 FastAPI 的图像生成 API 遇到了以下错误&#xff1a; Model inference er…