2024年显著性检测论文及代码汇总(1)

ACM MM

Distortion-aware Transformer in 360° Salient Object Detection

code
Abstacrt:现有的方法无法处理二维等矩投影引起的畸变。本文提出了一个基于Transformer的模型,即DATFormer。首先,引入两个畸变自适应模块。其一是畸变映射模块,预处理全局畸变特征;其二是畸变自适应注意力块,减少多尺度特征的局部畸变。然后,为利用360°数据的独特特征,本文提出一个可学习的关系矩阵,作为位置嵌入的一部分,进一步提高性能。
在这里插入图片描述

ICASSP

Zero-Shot Co-salient Object Detection Framework

code
Abstacrt:本文构建了第一个Zero-Shot的协同显著性检测框架,无需训练即可利用这些模型。在该框架中引入两个新模块:组提示生成模块GPG、协同显著性图生成模块CMP
在这里插入图片描述

IEEE TIP

Rethinking Object Saliency Ranking: A Novel Whole-flow Processing Paradigm

code
Abstacrt:本文提出了一个显著性排序范式。首先,由于GT图的构建缺乏理论依据,其显著性物体排序不合理。其次,由于现有的显著性排序模型遵循多任务范式,而不同的任务之间有冲突且难以权衡,因此显著性排序模型受到挑战。最后,现有的基于回归的显著性排序模型依赖于基于实例掩码的显著性排序,导致模型过于复杂。模型需要大量的数据才准确,且难以有效实现。针对这三方面问题,本文探讨其产生原因,提出显著性排序任务的全流程处理范式。
在这里插入图片描述

NeurIPS

What Do Deep Saliency Models Learn about Visual Attention?

code
Abstacrt:本文提出一个分析框架,阐述显著性模型被学习的隐式特征,隐式特征对显著性模型的贡献的解释和量化。本文将隐式特征分解为与语义属性明确对齐的可解释基,将显著性预测重述为一种加权组合。本团队从不同角度进行广泛分析,包括语义的正权重和负权重、训练数据和框架设计的影响、微调的渐进影响和SOTA模型的常见失败案例。此外,本团队通过研究不同场景下的视觉注意力特征,以展示该框架的有效性,例如自闭症谱系障碍ADS的非典型注意力、情绪刺激下的注意力和随时间变化的注意力。
在这里插入图片描述

WACV

3SD: Self-Supervised Saliency Detection With No Labels

code
Abstacrt:最近的研究表明,从分类任务中提取的特征提供了重要的显著性线索,例如目标的结构和语义信息。本文提出了一个自监督模型,即3SD,利用这一思想,通过在显著性检测的同时,为自监督分类任务添加一个分支,以获得类激活图CAMCAM与边缘图用于生成伪GT。具体来说,本文提出一种用于分类任务的基于多图像pacth对比学习。相比于在整张图像上进行分类的朴素学习,带有对比损失的multi-patch分类提升了CAM的质量。
在这里插入图片描述

数据集

NeurIPS

DVSOD: RGB-D Video Salient Object Detection

code
Abstacrt:为更好地实现多模态的信息融合,本团队构建了DViSal数据集,以推动RGB-D视频显著性检测领域(DVSOD)的进一步研究。该数据集具有237个全标注的RGB-D视频,包括对象和实例级标注,边界框和涂鸦。
在这里插入图片描述

WACV

Salient Object Detection for Images Taken by People With Vision Impairments

Dataset
Abstacrt:本文构建了一个新的数据集,即VizWiz-SalientObject,使用视觉受损的人拍摄的图像。与7个现有的数据集相比,VizWiz-SalientObject是目前最大的数据集(即32,000张人工标注的图像)并包含独特特征。
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/335249.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【Spring Boot 3】【Redis】基本数据类型操作

【Spring Boot 3】【Redis】基本数据类型操作 背景介绍开发环境开发步骤及源码工程目录结构 背景 软件开发是一门实践性科学,对大多数人来说,学习一种新技术不是一开始就去深究其原理,而是先从做出一个可工作的DEMO入手。但在我个人学习和工…

tidb Cloud 连接spring boot 项目

一、 免费试用tidbitcloud TiDB Cloud Documentation | PingCAP Docs 1.github账号登录 2.创建集群 3.点击对应集群cludter0 导入数据 导入 本地导入只支持csv文件,其他导入需要AWZ账号使用S3云存储 二、连接spingboot项目 选择java,复制下面的jd…

前台vue配置

前台 vue环境 1.傻瓜式安装node: 官网下载:https://nodejs.org/zh-cn/2.安装cnpm: >: npm install -g cnpm --registryhttps://registry.npm.taobao.org3.安装vue最新脚手架: >: cnpm install -g vue/cli注:如果2、3步报错,清除缓…

美团RASP大规模研发部署实践总结

01 背景 RASP 是 Runtime Application Self-Protection(运行时应用自我保护)的缩写,是一种应用程序安全技术。RASP 技术能够在应用程序运行时检测并阻止应用级别的攻击。随着云计算和大数据的发展,应用程序安全越来越受到重视。其…

总结网络中的一些基本概念

1. IP地址 描述一个设备在网络上的位置,而且计算机是通过数字来描述IP地址的。例如(生活中的地址) 2. 端口号 描述一个主机上的哪个应用程序,有了IP可以确定主机,但是一个主机上可能有很多程序在使用网络,…

CloudPanel RCE漏洞复现(CVE-2023-35885)

0x01 产品简介 CloudPanel 是一个基于 Web 的控制面板或管理界面,旨在简化云托管环境的管理。它提供了一个集中式平台,用于管理云基础架构的各个方面,包括虚拟机 (VM)、存储、网络和应用程序。 0x02 漏洞概述 由于2.3.1 之前的 CloudPanel 具有不安全的文件管理器 cook…

Docker技巧汇总

Docker技巧汇总 前言使用流程安装配置镜像管理创建并运行容器使用容器/常用命令导出和导入查看元数据挂载数据卷端口映射/转发VS Code连接Docker 前言 Docker 是一个开源的应用容器引擎,可以让开发者打包他们的应用以及依赖包到一个轻量级、可移植的容器中&#xf…

go语言(八)---- map

map的声明方式有以下三种。 package mainimport "fmt"func main() {//第一种声明方式//声明map1是一个map类型,key是String,value是Stringvar myMap1 map[string] stringif myMap1 nil {fmt.Println("myMap1 是一个空map")}//在使…

AI时代—ChatGPT-4.5的正确打开方式

前言 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家:https://www.captainbed.cn/z ChatGPT体验地址 文章目录 前言4.5key价格泄漏ChatGPT4.0使用地址ChatGPT正确打开方式最新功能语音助手存档…

Python初识——小小爬虫

一、找到网页端url 打开浏览器,打开百度官方网页点击图片,打开百度图片 鼠标齿轮向下滑,点击宠物图片 进入宠物图片网页,在网页空白处点击鼠标右键,弹出的框中最下方显示“检查”选项,点击(我是…

搭建一个JavaWeb项目流程详解

搭建一个JavaWeb项目流程 本文致力于,让编程者一步步明白书写一个JavaWeb项目应该做些什么,梳理清楚流程框架,需要的jar包,同时手写了一个分页工具类也在其中,让你在编程中更加丝滑。 1.src\main\java\com\einmeer\qia…

springboot中一些注解

springboot中一些注解 1:项目启动时会去扫描启动的注解,一般是启动时就想要被加载的方法: 2:springBoot中MSApplication启动类的一些其他注解: EnableAsync:这是一个Spring框架的注解,它用于开启方法异步调用的功能。当…

【MySQL自身的性能优化】InnoDB 的 Buffer Pool

这里写目录标题 一、引入缓存的重要性二、InnoDB 的 Buffer Pool1. Buffer Pool 内部组成2. free 链表管理空闲页3. flush 链表管理脏页4. LRU 链表提高缓存命中那咱需要咋地解决预读问题呢?那咱需要咋地解决 Buffer Pool 污染问题呢? 5. 脏页什么时候被…

pyqt5+python子域名扫描程序

import sysfrom PyQt5 import uic from PyQt5.QtWidgets import * #requests库内置了不同的方法来发送不同类型的http请求 import requests#BS主要功能是从网页抓取数据,提供一些简单的、python 式的函数用来处理导航、搜索、修改分析树等功能 from bs4 import Beau…

WebSocket协议、与HTTP对比

WebSocket 也可前往本人的个人网站进行阅读 WebSocket 和 HTTP WebSocket和HTTP协议一样,都是基于TCP协议实现的应用层协议。 HTTP协议通常是单边通信,主要用于传输静态文档、请求-响应通信,适用于Web浏览器加载网页、API调用等。然而Web…

NX二次开发获取圆弧的四个象限点

我是用来用来画水路线框的UF_MODL_ask_curve_points()可以按弧长或者弧度获取曲线的等分点,取PI/2的圆弧,即将圆弧四等分,你也可以取任意等分点。 int GetArcPoint(tag_t arc_tag,double point[4][3]) {if(arc_tag0)r…

KubeSphere 核心实战之二【在kubesphere平台上部署redis】(实操篇 2/4)

文章目录 1、登录kubesphere平台2、redis部署分析3、redis容器启动代码4、kubesphere平台部署redis4.1、创建redis配置集4.2、创建redis工作负载4.3、创建redis服务 5、测试连接redis 在kubesphere平台上部署redis应用都是基于redis镜像进行部署的,所以所有的部署操…

DRmare Music Converter - 一款高效的音乐转换工具,让您的音乐无处不在!

DRmare Music Converter是一款专业的音乐转换工具,旨在帮助用户更方便地管理和享受音乐。无论您是使用Mac还是Windows操作系统,DRmare Music Converter都能为您提供高效、便捷的音乐转换体验。 DRmare Music Converter支持多种音频格式的转换&#xff0…

伊恩·斯图尔特《改变世界的17个方程》波动方程笔记

主要是课堂的补充(yysy,我觉得课堂的教育模式真有够无聊的,PPT、写作业、考试,感受不到知识的魅力。 它告诉我们什么? 小提琴琴弦上某个小段的加速度,与相邻段相对于该段的平均位移成正比。 为什么重要&…

Studio One2024免费版下载及入门教程分享

众所周知,Studio One是一个专业的音频编辑软件,近几年随着音视频剪辑越来越火,Studio One也逐渐被人们所熟知。最近,就有许多小伙伴私信我,寻求Studio One的入门教程。 这不,今天小编就给大家带来了音频剪…