实例分割12篇顶会论文及代码合集,含2023最新

同学们,你们觉得视觉经典四个任务中哪个最难?我个人觉得是实例分割

因为它既具备语义分割的特点,需要做到像素层面上的分类,也具备目标检测的一部分特点,即需要定位出不同实例,即使它们是同一种类。

但尽管实例分割的复杂性和挑战性较高,它仍然是计算机视觉领域一个很重要的研究主题,对地理信息系统、医学影像、自动驾驶、机器人等领域有着很重要的应用技术支持作用。

为了帮助同学们学习这一重要主题,今天我就来和大家分享各大顶会中实例分割方向的12篇高分论文,包含今年最新的研究成果,希望能帮助同学们更轻松地理解并掌握实例分割。

论文原文及代码需要的同学看文末

1.PatchDCT: Patch Refinement for High Quality Instance Segmentation 【ICLR2023】

PatchDCT:用于高质量实例分割的Patch细化

简述:PatchDCT是一种用于高质量实例分割的方法,它通过将解码自DCT向量的掩码分解为多个补丁,并使用分类器和回归器对每个补丁进行细化来提高分割质量。在实验中,PatchDCT方法比Mask-RCNN和DCT-Mask方法表现更好,也与其他最先进的方法相当。

2.Recurrent Contour-based Instance Segmentation with Progressive Learning 【TPAMI2023】

渐进式学习的循环轮廓基础实例分割

简述:论文提出了一种名为PolySnake的新颖深度网络架构,用于轮廓基础实例分割。通过迭代和渐进式轮廓细化策略实现了卓越而稳健的分割性能。具体来说,PolySnake引入了循环更新操作符来迭代地估计物体轮廓,并逐渐将其变形朝向物体边界。在每次迭代中,PolySnake为当前轮廓构建了一个语义丰富的表示形式,并将其输入到循环操作符中进行进一步的轮廓调整。

3.Instance Segmentation in the Dark 【IJCV2023】

暗光实例分割

简述:论文发现低光图像中的噪声会引入高频率干扰到神经网络的特征图中,从而降低性能。为了解决这个问题,作者提出了一种新的学习方法,通过自适应加权下采样层、平滑面向卷积块和干扰抑制学习来减少特征噪声。此外,作者还发现使用高比特深度RAW图像可以更好地保留低光场景信息。通过采集现实世界的低光实例分割数据集并利用低光RAW合成管道生成逼真的低光数据,该方法在无需任何图像预处理的情况下实现了令人满意的性能。

4.OpenMask3D:Open-Vocabulary 3D Instance Segmentation 【NeurIPS2023】

开放词汇表的3D实例分割

简述:论文介绍了一种名为OpenMask3D的开放词汇表的3D实例分割方法。现有的3D实例分割方法只能识别预先定义的封闭类别集合中的物体,而OpenMask3D通过学习场景中每个点的可查询特征来解决这一问题。该方法使用基于CLIP的图像嵌入的多视角融合来聚合每个掩码的特征,并通过预测的类无关3D实例掩码指导模型。实验表明,OpenMask3D优于其他开放词汇表方法,尤其是在长尾分布上。

5.ISBNet: a 3D Point Cloud Instance Segmentation Network with Instance-aware Sampling and Box-aware Dynamic Convolution 【CVPR2023】

一种具有实例感知采样和框感知动态卷积的3D点云实例分割网络

简述:该文介绍了一种新的无聚类3D实例分割方法ISBNet,它将实例表示为内核并通过动态卷积解码实例掩码。该方法采用实例感知最远点采样策略来高效地生成高召回率和有区别性的内核,并利用局部聚合层编码候选特征。此外,作者还展示了在动态卷积中预测和利用3D轴对齐边界框可以进一步提高性能。

6.Betrayed by Captions: Joint Caption Grounding and Generation for Open Vocabulary Instance Segmentation 【ICCV2023】

开放词汇实例分割的联合标题基础和生成

简述:作者提出了一种名为Caption Grounding and Generation(CGG)的框架,用于开放词汇实例分割,以扩展分割模型来分类和分割新的实例级别类别。CGG通过仅关注匹配对象名词的基础损失函数提高学习效率,并引入标题生成头提供额外的监督和上下文建模。实验结果表明,基础和生成组件相互补充,显著提高了新类别的分割性能。

7.DVIS: Decoupled Video Instance Segmentation Framework 【ICCV2023】

解耦的视频实例分割框架

简述:论文介绍了一种名为DVIS的解耦视频实例分割框架,将VIS分为三个子任务:分割、跟踪和细化。作者引入了一个新颖的引用跟踪器和时序细化器来构建DVIS框架,以解决现有方法在复杂和长视频上表现不佳的问题。DVIS在VIS和VPS上都取得了新的最先进的性能,并具有轻量级的优点,允许在单个GPU上进行高效训练和推理。

8.FastInst: A Simple Query-Based Model for Real-Time Instance Segmentation 【CVPR2023】

一种用于实时实例分割的简单查询模型

简述:论文提出了一种用于实时实例分割的简单查询模型框架FastInst,它可以在不使用非最大抑制(NMS)的情况下以端到端的方式执行,并在COCO测试集上达到超过40的AP和32.5 FPS的实时速度。作者提出了三个关键设计:实例激活引导查询、双路径更新策略和真实掩码引导学习,这些设计使得我们可以使用更轻量级的像素解码器和更少的Transformer解码器层,同时实现更好的性能。

9.E2EC: An End-to-End Contour-based Method for High-Quality High-Speed Instance Segmentation【CVPR2022】

一种基于端到端轮廓的高质量高速实例分割方法

简述:E2EC是一种全新的端到端轮廓基础的实例分割方法,它通过使用可学习的轮廓初始化、多方向对齐标签采样和动态匹配损失,实现了高质量的高速实例分割。在这种方法中,首先应用了一种新的可学习轮廓初始化架构来替代手动设计的轮廓初始化,该架构包括一个轮廓初始化模块用于构建更明确的学习目标,以及一个全局轮廓变形模块,可以更好地利用所有顶点的特征。其次,该方法还提出了一种名为多方向对齐的新型标签采样方案,以降低学习难度。最后,为了提高边界细节的质量,动态匹配预测的地面真实顶点对,并提出了相应的动态匹配损失函数。

10.Mask Transfiner for High-Quality Instance Segmentation【CVPR2022】

基于Transformer的高质量实例分割方法

简述:Mask Transfiner是一种用于高质量实例分割的方法,它将图像区域表示为四叉树,并使用Transformer处理易出错的节点。该方法可以以低计算成本预测高度准确的实例掩码,并在三个基准测试中优于当前实例分割方法。

11.SoftGroup for 3D Instance Segmentation on Point Clouds 【CVPR2022】

用于点云的三维实例分割SoftGroup

简述:作者提出了一种新的三维实例分割方法SoftGroup,它通过自底向上的软分组和自上而下的细化来解决现有方法中的问题。现有的最先进方法通常先进行语义分割,然后将每个点与单个类别相关联,但这些硬预测在执行语义分割时会产生误差,导致预测的实例与地面真实值之间的重叠度低,以及大量的误报。SoftGroup允许每个点与多个类别相关联,以减轻语义预测错误带来的问题,并通过学习将误报实例分类为背景来抑制误报实例。

12.OGC: Unsupervised 3D Object Segmentation from Rigid Dynamics of Point Clouds 【NeurIPS2022】

基于点云刚体动力学的无监督三维物体分割

简述:论文介绍了一种名为OGC的无监督三维物体分割方法,可以从原始点云中同时识别多个三维物体。该方法利用动态运动模式作为监督信号来自动发现刚体对象,不需要大量的人工注释来进行完全监督。该方法由三个主要组件组成:对象分割网络、辅助的自我监督场景流估计器和核心的对象几何一致性组件。通过精心设计一系列损失函数,该方法有效地考虑了多对象刚体一致性和对象形状不变性在时间和空间尺度上的影响。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“实例分割”领取论文原文及源码

码字不易,欢迎大家点赞评论收藏!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/185670.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Docker 的基本概念和优势,以及在应用程序开发中的实际应用

Docker是一种轻量级的虚拟化技术,可以将应用程序及其依赖项打包在一个容器中,并在不同的计算机上运行。以下是Docker的基本概念和优势: 基本概念: 镜像(Image):一个只读的文件,包含…

Unity中Shader的Standard材质解析(二)

文章目录 前言一、我们对 Standard 的 PBR 的 GI 进行解析1、我们先创建一个PBR的.cginc文件,用于整理用到的函数2、然后在Standard的Shader中引用该cginc文件 二、依次整理函数到该cginc文件中我们来看一下PBR中GI的镜面反射做了些什么 二、最终代码.cginc代码&…

98、Text2Room: Extracting Textured 3D Meshes from 2D Text-to-Image Models

简介 github 利用预训练的2D文本到图像模型来合成来自不同姿势的一系列图像。为了将这些输出提升为一致的3D场景表示,将单目深度估计与文本条件下的绘画模型结合起来,提出了一个连续的对齐策略,迭代地融合场景帧与现有的几何形状&#xff0…

【C/PTA —— 11.函数2(课外实践)】

C/PTA —— 11.函数2(课外实践) 一.函数题6-1 计算A[n]1/(1 A[n-1])6-2 递归实现顺序输出整数6-3 自然数的位数(递归版)6-4 分治法求解金块问题6-5 汉诺塔6-6 重复显示字符(递归版)6-7 显示平行四边形(右)(递归版) 二.编程题7-2 N阶楼梯上楼问题 一.函数…

React项目中发生空白但不报错的原因分析和解决?

文章目录 前言组件渲染问题状态管理问题异步操作问题代码错误但未抛出异常如果我们使用的是chorme浏览器的话,可以下载一个开发者工具,例如下图:代码审查使用调试工具日志和输出检查外部依赖异步操作终极大法,不到万不得已不可以使…

Twincat使用:EtherCAT通信扫描硬件设备链接PLC变量

EtherCAT通信采用主从架构,其中一个主站设备负责整个EtherCAT网络的管理和控制,而从站设备则负责在数据环网上传递数据。 主站设备可以是计算机、工控机、PLC等, 而从站设备可以是传感器、执行器、驱动器等。 EL3102:MDP5001_300_CF8D1684;…

【LM358AD运放方波振荡器可控输出幅值】2022-2-25

缘由仿真如何缩小方波振荡电路方波幅值?-有问必答-CSDN问答

C#,《小白学程序》第六课:队列(Queue)其二,队列的应用,编写《实时叫号系统》

医院里面常见的《叫号系统》怎么实现的&#xff1f; 1 文本格式 /// <summary> /// 下面定义一个新的队列&#xff0c;用于演示《实时叫号系统》 /// </summary> Queue<Classmate> q2 new Queue<Classmate>(); /// <summary> /// 《小白学程序…

笔记:内网渗透流程之信息收集

信息收集 首先&#xff0c;收集目标内网的信息&#xff0c;包括子网结构、域名信息、IP地址范围、开放的端口和服务等。这包括通过主动扫描和渗透测试工具收集信息&#xff0c;以及利用公开的信息源进行信息搜集。 本机信息收集 查看系统配置信息 查看系统详细信息&#xf…

单链表的反转?太细了哥们!细到离谱!

单链表的反转&#xff08;面试常出&#xff09;&#xff1a; ​ 单链表的反转&#xff0c;可以通过很多种方法实现。包括迭代法&#xff0c;递归法&#xff0c; 迭代法&#xff1a; 定义三个指针&#xff1a;prev、current和next&#xff0c;它们分别表示前一个节点、当前节点…

【黑马甄选离线数仓day04_维度域开发】

1. 维度主题表数据导出 1.1 PostgreSQL介绍 PostgreSQL 是一个功能强大的开源对象关系数据库系统&#xff0c;它使用和扩展了 SQL 语言&#xff0c;并结合了许多安全存储和扩展最复杂数据工作负载的功能。 官方网址&#xff1a;PostgreSQL: The worlds most advanced open s…

中国企业500强的排名也在不断变化。面对不确定性的挑战,企业如何应对?

随着全球经济的不断发展和变化&#xff0c;中国企业500强的排名也在不断变化。面对不确定性的挑战&#xff0c;企业如何应对&#xff1f;在本文中&#xff0c;挖数据平台将提供数据源探讨中国企业500强在应对不确定性方面的突围与变革。 一、数据挖掘与分析 从2006年到2023年&…

【科普知识】什么是步进电机?

德国百格拉公司于1973年发明了五相混合式步进电机及其驱动器&#xff0c;1993年又推出了性能更加优越的三相混合式步进电机。我国在80年代以前&#xff0c;一直是反应式步进电机占统治地位&#xff0c;混合式步进电机是80年代后期才开始发展。 步进电机是一种用电脉冲信号进行…

CAN实验

CAN 寄存器 HAL库函数 代码 #include "./BSP/CAN/can.h"CAN_HandleTypeDef g_can1_handle; CAN_TxHeaderTypeDef g_can1_txheader; CAN_RxHeaderTypeDef g_can1_rxheader;/* STM32F103 TS1 8 TS2 7 BRP 3 波特率&#xff1a;36000 / [(9 8 1) * 4] 500Kbps …

数据结构-树-二叉树-堆的实现

1.树概念及结构 树是一种 非线性 的数据结构&#xff0c;它是由 n &#xff08; n>0 &#xff09;个有限结点组成一个具有层次关系的集合。 把它叫做树是因 为它看起来像一棵倒挂的树&#xff0c;也就是说它是根朝上&#xff0c;而叶朝下的 。 有一个特殊的结点&#xff…

[chroot+seccomp逃逸] THUCTF2019 之 固若金汤

题目分析 附件为一个源码, 其中注释我都写好了, 主要就讲关键的知识点. #define _GNU_SOURCE#include <stdio.h> #include <stdlib.h> #include <fcntl.h> #include <string.h> #include <errno.h> #include <sched.h> #include <uni…

【蓝桥杯省赛真题47】Scratch小猫踩球 蓝桥杯scratch图形化编程 中小学生蓝桥杯省赛真题讲解

目录 scratch小猫踩球 一、题目要求 编程实现 二、案例分析 1、角色分析

flutter之graphic图表自定义tooltip

renderer graphic中tooltip的TooltipGuide类提供了renderer方法&#xff0c;接收三个参数Size类型&#xff0c;Offset类型&#xff0c;Map<int, Tuple>类型。可查到的文档是真的少&#xff0c;所以只能在源码中扒拉例子&#xff0c;做符合需求的修改。 官方github示例 …

【TypeScript】常见数据结构与算法(二):链表

文章目录 链表结构&#xff08;LinkedList&#xff09;链表以及数组的缺点数组链表的优势 什么是链表?封装链表相关方法源码链表常见面试题237-删除链表中的节点206 - 反转链表 数组和链表的复杂度对比 链表结构&#xff08;LinkedList&#xff09; 链表以及数组的缺点 链表…

数据库-MySQL之数据库必知必会10-13章

第10章 创建计算字段 拼接字段 使用Concat()函数 执行算术计算 示例&#xff1a;从 Products 表中返回 prod_id、prod_price 和 sale_price。sale_price 是一个包含促销价格的计算字段。提示&#xff1a;可以乘以 0.9&#xff0c;得到原价的 90%&#xff08;即 10%的折扣&…