【计算机视觉 | 目标检测 | 图像分割】arxiv 计算机视觉关于目标检测和图像分割的学术速递(7 月 31 日论文合集)

文章目录

  • 一、检测相关(9篇)
    • 1.1 Semi-Supervised Object Detection in the Open World
    • 1.2 Multi-layer Aggregation as a key to feature-based OOD detection
    • 1.3 Non-invasive Diabetes Detection using Gabor Filter: A Comparative Analysis of Different Cameras
    • 1.4 Local and Global Information in Obstacle Detection on Railway Tracks
    • 1.5 Implicit neural representation for change detection
    • 1.6 Anatomy-Aware Lymph Node Detection in Chest CT using Implicit Station Stratification
    • 1.7 Small, but important: Traffic light proposals for detecting small traffic lights and beyond
    • 1.8 End-to-end Remote Sensing Change Detection of Unregistered Bi-temporal Images for Natural Disasters
    • 1.9 Detecting Morphing Attacks via Continual Incremental Training
  • 二、分割|语义相关(3篇)
    • 2.1 OAFuser: Towards Omni-Aperture Fusion for Light Field Semantic Segmentation of Road Scenes
    • 2.2 One-shot Joint Extraction, Registration and Segmentation of Neuroimaging Data
    • 2.3 Scale-aware Test-time Click Adaptation for Pulmonary Nodule and Mass Segmentation

一、检测相关(9篇)

1.1 Semi-Supervised Object Detection in the Open World

开放世界中的半监督目标检测

https://arxiv.org/abs/2307.15710

在这里插入图片描述
用于半监督对象检测的现有方法假设存在于训练和未标记数据集中的固定类集合,即,分发(ID)数据。当这些技术部署在开放世界中时,这些技术的性能显著降低,这是由于未标记数据和测试数据可能包含在训练期间未看到的对象,即,分布外(OOD)数据。我们在本文中探讨的两个关键问题是:我们能发现这些OOD样本吗?如果能,我们能从中学习吗?考虑到这些因素,我们提出了开放世界半监督检测框架(OWSSD),它可以有效地检测OOD数据以及从ID和OOD数据中学习的半监督学习管道。我们介绍了一个集成的OOD检测器组成的轻量级自动编码器网络只训练ID数据。通过广泛的评估,我们证明了我们的方法与最先进的OOD检测算法相比具有竞争力,并且还显着提高了开放世界场景中的半监督学习性能。

1.2 Multi-layer Aggregation as a key to feature-based OOD detection

多层聚合是基于特征的OOD检测的关键

https://arxiv.org/abs/2307.15647

在这里插入图片描述
深度学习模型很容易受到在训练阶段未观察到的输入图像变化的干扰,从而导致不可预测的预测。检测这样的分布外(OOD)图像在医学图像分析的背景下是特别关键的,其中可能的异常的范围是非常宽的。最近,出现了一类新的方法,基于对训练模型的中间特征的分析。这些方法可分为2组:单层方法,其考虑在固定的、仔细选择的层处获得的特征图,以及多层方法,其考虑由模型生成的特征图的集合。虽然有希望,这些算法的适当比较仍然缺乏。在这项工作中,我们比较了各种基于特征的OOD检测方法的OOD(20种)的大光谱,代表约7800三维MRI。我们的实验揭示了两种现象。首先,多层方法始终优于单层方法,其倾向于具有取决于异常类型的不一致行为。第二,OOD检测性能高度依赖于底层神经网络的架构。

1.3 Non-invasive Diabetes Detection using Gabor Filter: A Comparative Analysis of Different Cameras

基于Gabor滤波的糖尿病无创检测:不同摄像机的对比分析

https://arxiv.org/abs/2307.15480

在这里插入图片描述
本文比较和探讨了移动终端的相机和笔记本电脑相机的性能作为方便的工具,用于捕获图像的非侵入性检测糖尿病(DM)使用面部块纹理特征。年龄在20至79岁之间的参与者被选择用于数据集。使用12 MP和7 MP移动相机以及笔记本电脑相机在正常照明条件下拍摄照片。提取的面部块进行分类,使用k-最近邻(k-NN)和支持向量机(SVM)。捕获100个图像,预处理,使用Gabor滤波,并迭代。该系统的性能进行了测量的准确性,特异性和灵敏度。使用具有100个图像的SVM,从12 mp后置摄像头实现了96.7%准确度、100%灵敏度和93%特异性的最佳性能。

1.4 Local and Global Information in Obstacle Detection on Railway Tracks

轨道障碍物检测中的局部信息和全局信息

https://arxiv.org/abs/2307.15478

在这里插入图片描述
铁路上可靠的障碍物检测可以帮助防止导致受伤和潜在损坏或训练的碰撞。不幸的是,通用对象检测器没有足够的类来考虑所有可能的场景,并且以铁路上的对象为特征的数据集很难获得。我们建议利用浅层网络学习铁路分割正常铁路图像。网络的有限接受域防止了过度自信的预测,并允许网络专注于铁路环境的局部非常独特和重复的模式。此外,我们通过学习幻觉无障碍图像来探索全局信息的受控包含。我们评估我们的方法在一个自定义的数据集,具有人工增强的障碍物的铁路图像。我们提出的方法优于其他基于学习的基线方法。

1.5 Implicit neural representation for change detection

用于变化检测的隐式神经表示法

https://arxiv.org/abs/2307.15428

在这里插入图片描述
由于不匹配的空间支持和采集系统噪声,检测在同一地理区域在两个不同时间采集的一对3D机载LiDAR点云中发生的变化是一项具有挑战性的任务。最近尝试检测点云的变化是基于监督的方法,这需要大量的标记数据在现实世界中的应用程序中不可用。为了解决这些问题,我们提出了一种无监督的方法,包括两个部分:用于连续形状重建的神经场(NF)和用于分类变化的高斯混合模型。NF提供了一种网格不可知的表示,以编码具有不匹配的空间支持的双时间点云,其可以被正则化以增加高频细节并减少噪声。在任意空间尺度下比较每个时间戳处的重建,导致检测能力的显著增加。我们将我们的方法应用于城市蔓延的模拟LiDAR点云的基准数据集。该数据集提供了具有不同分辨率,输入模式和噪声水平的不同挑战性场景,允许将我们的方法与当前最先进的方法进行多场景比较。我们在这个数据集上拥有以前的方法,在联合度量的交集中有10%的保证金。此外,我们将我们的方法应用于现实世界的情况下,以确定非法挖掘(抢劫)的考古遗址,并确认他们从现场专家的调查结果相匹配。

1.6 Anatomy-Aware Lymph Node Detection in Chest CT using Implicit Station Stratification

隐式站分层在胸部CT解剖感知淋巴结检测中的应用

https://arxiv.org/abs/2307.15271

在这里插入图片描述
在放射学图像中发现异常淋巴结对于诸如癌症转移分期和放射治疗计划的各种医疗任务是非常重要的。淋巴结(LN)是散布在全身的小腺体。它们根据其解剖位置被分组或定义到各种LN站。不同站点中的LN的CT成像外观和背景显著不同,这对自动化检测,特别是对病理性LN提出了挑战。出于这种观察,我们提出了一种新的端到端的框架,以提高LN检测性能,利用他们的站信息。我们设计了一个多头探测器,使每个头专注于区分某些站点的LN和非LN结构。伪站标签由LN站分类器生成,作为训练期间的多任务学习的形式,因此我们在推断期间不需要另一个显式LN站预测模型。我们的算法进行了评估82例肺癌和91例食管癌患者。所提出的隐式站分层方法在两个数据集上分别将每名患者2个假阳性的胸部淋巴结的检测灵敏度从65.1%提高到71.4%和从80.3%提高到85.5%,这显著优于各种现有的最先进的基线技术,例如nnUNet、nnDetection和LENS。

1.7 Small, but important: Traffic light proposals for detecting small traffic lights and beyond

小,但重要:用于检测小交通灯和更远的交通灯的交通灯建议

https://arxiv.org/abs/2307.15191

在这里插入图片描述
交通灯检测是自动驾驶汽车和驾驶员辅助系统背景下的一个具有挑战性的问题。虽然大多数现有的系统在大型交通灯上产生了良好的效果,但检测小型和小型交通灯往往被忽视。这里的一个关键问题是CNN中固有的下采样,导致用于检测的低分辨率特征。为了缓解这个问题,我们提出了一个新的交通灯检测系统,包括一个新的交通灯建议生成器,利用一般对象的建议生成,细粒度的多尺度功能的结果,并注意有效的处理。此外,我们设计了一个新的检测头分类和细化我们的建议。我们评估我们的系统上三个具有挑战性的,公开可用的数据集,并将其与六种方法进行比较。结果显示,小型和微型交通灯至少有12.6美元的大幅改善,以及所有大小的交通灯的强劲结果。

1.8 End-to-end Remote Sensing Change Detection of Unregistered Bi-temporal Images for Natural Disasters

自然灾害未配准双时相图像端到端遥感变化检测

https://arxiv.org/abs/2307.15128

在这里插入图片描述
基于遥感图像的变化检测是遥感领域的一个重要研究方向。深度网络在检测双时遥感图像的变化方面取得了显著的成功,并在各个领域得到了应用。在自然环境日益恶化、自然灾害频繁发生的情况下,利用遥感图像准确、快速地识别灾区受损建筑物具有重要意义。本文的目的是研究变化检测专门为自然灾害。考虑到变化检测研究中使用的现有公共数据集是注册的,这与双时间图像不匹配的实际场景不一致,本文介绍了一种未注册的端到端变化检测合成数据集,称为xBD-E2 ECD。此外,我们提出了一个端到端的变化检测网络命名为E2 ECDNet,它采取未注册的双时间图像对作为输入,并同时产生流场预测结果和变化检测预测结果。值得注意的是,我们的E2 ECDNet还支持注册图像对的变化检测,因为注册可以被视为非注册的特殊情况。此外,本文重新定义了正确预测一个积极的情况下,并引入了基于邻域的变化检测评估指标的标准。实验结果表明,显着的改善。

1.9 Detecting Morphing Attacks via Continual Incremental Training

通过连续增量训练检测变形攻击

https://arxiv.org/abs/2307.15105

在这里插入图片描述
数据传输和存储的限制限制了组成单个数据集(也利用不同的数据源)以执行基于批处理的训练过程的可能性的场景,使得鲁棒模型的开发特别具有挑战性。我们假设,最近的持续学习(CL)范式可能是一个有效的解决方案,使增量训练,甚至通过多个网站。实际上,CL的一个基本假设是,一旦模型被训练,旧数据就不能再用于连续的训练迭代,原则上可以删除。因此,在本文中,我们研究了在这种情况下不同的持续学习方法的性能,模拟了每次有新的数据块(即使是可变大小的数据块)可用时都会更新的学习模型。实验结果表明,一个特定的CL方法,即学习不忘记(LwF),是一个最好的性能算法。然后,我们研究了它在变形攻击检测和对象分类任务中的使用和参数化,特别是关于可用的新训练数据量。

二、分割|语义相关(3篇)

2.1 OAFuser: Towards Omni-Aperture Fusion for Light Field Semantic Segmentation of Road Scenes

OAFuser:面向全口径融合的道路场景光场语义分割

https://arxiv.org/abs/2307.15588

在这里插入图片描述
光场摄像机可以提供丰富的角度和空间信息,以增强图像语义分割,用于自动驾驶领域的场景理解。然而,光场摄像机广泛的角度信息包含了大量冗余数据,这对于智能汽车有限的硬件资源来说是压倒性的。此外,不适当的压缩导致信息损坏和数据丢失。为了挖掘有代表性的信息,我们提出了一个全孔径融合模型(OAFuser),它利用密集的上下文从中心视图和发现的角度信息,从子孔径图像生成一个语义一致的结果。为了避免网络传播过程中的特征丢失,同时简化光场相机的冗余信息,我们提出了一个简单而非常有效的子孔径融合模块(SAFM),以嵌入子孔径图像到角度特征,而无需任何额外的存储器成本。此外,为了解决视点间空间信息不匹配的问题,我们提出了中心角校正模块(CARM)实现了特征再排序,防止了由于信息不对称而造成的特征遮挡。我们提出的OAFuser在UrbanLF-Real和-Syn数据集上实现了最先进的性能,并在UrbanLF-Real Extended数据集上在mIoU中创造了84.93%的新记录,增益为+4.53%。OAFuser的源代码将在https://github.com/FeiBryantkit/OAFuser公开。

2.2 One-shot Joint Extraction, Registration and Segmentation of Neuroimaging Data

神经影像数据的一次联合提取、配准和分割

https://arxiv.org/abs/2307.15198

在这里插入图片描述
脑图像的提取、配准和分割是神经影像学研究中必不可少的预处理步骤。目的是从原始成像扫描中提取大脑(即,提取步骤),将其与目标脑图像(即,配准步骤)并标记解剖脑区域(即,分段步骤)。传统的研究通常集中在开发单独的方法,在监督设置中的提取,配准和分割任务。这些方法的性能在很大程度上取决于训练样本的数量和专家进行目视检查以进行纠错的程度。然而,收集体素级标签并对高维神经图像(例如,3D MRI)在许多医学研究中昂贵且耗时。在本文中,我们研究了问题的一次性联合提取,注册和分割的神经影像数据,它只利用一个标记的模板图像(又名。图谱)和一些未标记的原始图像用于训练。我们提出了一个统一的端到端的框架,称为JERS,共同优化的提取,注册和分割任务,允许他们之间的反馈。具体来说,我们使用一组提取,注册和分割模块来学习提取掩码,变换和分割掩码,其中模块通过自我监督相互连接和相互加强。在真实世界数据集上的实验结果表明,我们提出的方法在提取,配准和分割任务中表现出色。我们的代码和数据可以在https://github.com/Anonymous4545/JERS上找到

2.3 Scale-aware Test-time Click Adaptation for Pulmonary Nodule and Mass Segmentation

用于肺结节和肿块分割的尺度感知测试时间点击自适应

https://arxiv.org/abs/2307.15645

在这里插入图片描述
肺结节和肿块是肺癌筛查中的重要影像学特征,在临床诊断中需要仔细处理。尽管基于深度学习的医学图像分割取得了成功,但对各种大小的结节和肿块病变的鲁棒性能仍然具有挑战性。在本文中,我们提出了一个多尺度神经网络与规模意识的测试时间适应,以解决这一挑战。具体来说,我们引入了一个自适应的规模意识的测试时间点击适应方法的基础上毫不费力地获得病变点击测试时间线索,以提高分割性能,特别是对于大病变。所提出的方法可以无缝集成到现有的网络。在开源和内部数据集上的广泛实验一致地证明了所提出的方法在一些CNN和基于Transformer的分割方法上的有效性。我们的代码可在https://github.com/SplinterLi/SaTTCA上获得。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/58698.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

ABAP 自定义搜索功能 demo1

ABAP 自定义搜索功能 demo1 效果: 双击选中行则为选中对应发票 实现 1定义 定义屏幕筛选参数 SELECTION-SCREEN BEGIN OF SCREEN 9020. SELECT-OPTIONS:s1_belnr FOR rbkp-belnr, s1_gjahr FOR rbkp-gjahr, s1_lifnr FOR rbkp-lifnr, s1_erfna FOR rbkp-erfnam, …

详解AMQP协议

目录 1.概述 1.1.简介 1.2.抽象模型 2.spring中的amqp 2.1.spring amqp 2.2.spring boot amqp 1.概述 1.1.简介 AMQP,Advanced Message Queuing Protocol,高级消息队列协议。 百度百科上的介绍: 一个提供统一消息服务的应用层标准高…

插入排序算法

插入排序 算法说明与代码实现&#xff1a; 以下是使用Go语言实现的插入排序算法示例代码&#xff1a; package mainimport "fmt"func insertionSort(arr []int) {n : len(arr)for i : 1; i < n; i {key : arr[i]j : i - 1for j > 0 && arr[j] > …

深入理解负载均衡原理及算法

1. 前言 在互联网早期,网络还不是很发达,上网用户少,流量相对较小,系统架构以单体架构为主。但如今在互联网发达的今天,流量请求动辄百亿、甚至上千亿,单台服务器或者实例已完全不能满足需求,这就有了集群。不论是为了实现高可用还是高性能,都需要用到多台机器来扩展服…

react中hooks分享

一. HOOKS是什么 在计算机程序设计中&#xff0c;钩子一词涵盖了一系列技术&#xff0c;这些技术用来通过拦截函数调用、消息或在软件组件之间传递的事件来改变或增加操作系统、应用程序或其他软件组件的行为。处理这些被截获的函数调用、事件或消息的代码称为“hook”。 在r…

【Python】PySpark 数据计算 ⑤ ( RDD#sortBy方法 - 排序 RDD 中的元素 )

文章目录 一、RDD#sortBy 方法1、RDD#sortBy 语法简介2、RDD#sortBy 传入的函数参数分析 二、代码示例 - RDD#sortBy 示例1、需求分析2、代码示例3、执行结果 一、RDD#sortBy 方法 1、RDD#sortBy 语法简介 RDD#sortBy 方法 用于 按照 指定的 键 对 RDD 中的元素进行排序 , 该方…

细讲一个 TCP 连接能发多少个 HTTP 请求(一)

一道经典的面试题是从 URL 在浏览器被被输入到页面展现的过程中发生了什么&#xff0c;大多数回答都是说请求响应之后 DOM 怎么被构建&#xff0c;被绘制出来。但是你有没有想过&#xff0c;收到的 HTML 如果包含几十个图片标签&#xff0c;这些图片是以什么方式、什么顺序、建…

Arthas GC日志-JVM(十八)

上篇文章说jvm的实际运行情况。 Jvm实际运行情况-JVM&#xff08;十七&#xff09; Arthas介绍 因为arthas完全是java代码写的&#xff0c;我们直接用命令启动&#xff1a; Java -jar arthas-boot.jar 启动成功后&#xff0c;选择我们项目的进程。 进入我们可用dashboard…

django实现部门表的增删改查界面

1、前期准备 部署好mysql数据库&#xff0c;创建好unicom数据库下载好bootstap的插件下载好jquery的插件下载好mysqlclient-1.4.6-cp36-cp36m-win_amd64.whl的安装包&#xff0c;根据python的版本下载 2、创建项目 在pycharm中创建项目 在pycharm的终端创建虚拟环境 py -m v…

【Docker】Docker安装Elasticsearch服务的正确方式

文章目录 1. 什么是Elasticsearch2. Docker安装Elasticsearch2.1 确定Elasticsearch的版本2.2. Docker安装Elasticsearch2.3. 给Elasticsearch安装中文分词器IKAnalyzer&#xff08;可选&#xff09; 点击跳转&#xff1a;Docker安装MySQL、Redis、RabbitMQ、Elasticsearch、Na…

Django使用uwsgi+nginx部署,admin没有样式解决办法

Django使用uwsginginx部署,admin没有样式解决办法 如果使用了虚拟环境则修改nginx.conf文件中的/static/路径为你虚拟环境的路径&#xff0c;没有使用虚拟环境则改为你python安装路径下的static server {listen 8008;server_name location; #改为自己的域名&#xff0c;没域名…

mybatisplus实现自动填充 时间

mybatisplus实现自动填充功能——自动填充时间 数据库表中的字段 创建时间 (createTime)更新时间 (updateTime) 每次 增删改查的时候&#xff0c;需要通过对Entity的字段&#xff08;createTime&#xff0c;updateTime&#xff09;进行set设置&#xff0c;但是&#xff0c;每…

途乐证券|俄罗斯宣布9月削减石油出口量

当地时间周四&#xff0c;美股兜售潮仍在持续&#xff0c;三大股指连续第二个交易日团体收跌。到收盘&#xff0c;道指跌落0.19%&#xff0c;标普500指数跌落0.25%&#xff0c;纳指跌幅为0.10%。 美国ISM7月非制造业PMI下滑 数据面上&#xff0c;美国供应办理协会ISM周四发布的…

电力巡检无人机助力迎峰度夏,保障夏季电力供应

夏季是电力需求量较高的时期&#xff0c;随着高温天气的来临&#xff0c;风扇、空调和冰箱等电器的使用量也大大增加&#xff0c;从而迎来夏季用电高峰期&#xff0c;电网用电负荷不断攀升。为了保障夏季电网供电稳定&#xff0c;供电公司会加强对电力设施设备的巡检&#xff0…

mmap函数详解

1、什么是mmap mmap是一种内存映射文件的方法&#xff0c;即将一个文件或者其它对象映射到进程的地址空间&#xff0c;实现文件磁盘地址和进程虚拟地址空间中一段虚拟地址的一一对映关系。 实现这样的映射关系后&#xff0c;进程就可以采用指针的方式读写操作这一段内存&#x…

Android入门教程||Android 架构||Android 应用程序组件

Android 架构 Android 操作系统是一个软件组件的栈&#xff0c;在架构图中它大致可以分为五个部分和四个主要层。 Linux内核 在所有层的最底下是 Linux - 包括大约115个补丁的 Linux 3.6。它提供了基本的系统功能&#xff0c;比如进程管理&#xff0c;内存管理&#xff0c;设…

Android 面试题 应用程序结构 十一

&#x1f525; Framework主要包含以下模块 &#x1f525; ActivityManagerService 这是一个Activity的管理者&#xff0c;负责管理所有Activity的生命周期。WindowManagerService 它是手机屏幕的的管理者&#xff0c;管理着屏幕的详细情况&#xff0c;所有对屏幕的操作最终都…

express学习笔记4 - 热更新以及express-boom

我们每次改动代码的时候都要重启项目&#xff0c;现在我们给项目添加一个热更新 npm install --save-dev nodemon # or using yarn: yarn add nodemon -D 在package.json添加一行代码 "dev": "nodemon ./bin/www" 重启项目 然后随便做改动&#xff…

【初阶C语言】学会结构体

1.结构体类型的声明 2.结构体初始化 3.结构体成员访问 4.结构体传参 前言&#xff1a;结构是一些值的集合&#xff0c;这些值称为成员变量。结构的每个成员可以是不同类型的变量。 一、结构体类型的声明 1.结构的声明 结构体声明的模板&#xff1a; struct tag {member-li…

Java版工程行业管理系统源码-专业的工程管理软件-em提供一站式服务

​ Java版工程项目管理系统 Spring CloudSpring BootMybatisVueElementUI前后端分离 功能清单如下&#xff1a; 首页 工作台&#xff1a;待办工作、消息通知、预警信息&#xff0c;点击可进入相应的列表 项目进度图表&#xff1a;选择&#xff08;总体或单个&#xff09;项目…