【Attention(0)】卷首语,从“SEAttention注意力效果秒杀CBAM”聊到“Transformer”

Attention 注意力是一个非常有价值的机制,例如我们耳熟能详的 SE attention。我们常常看到这样的标题《YOLOv8,注意力, SEAttention注意力,效果秒杀CBAM》

其实,CBAM 是一种“卷积神经网络注意力模块”(Convolutional Block Attention Module, CBAM)。这也是一篇论文《CBAM: Convolutional Block Attention Module》。CBAM旨在自动学习输入特征图的空间和通道注意力权重,从而更好地捕捉图像中的局部信息和全局上下文。CBAM包括两个主要组成部分: 空间注意力模块和通道注意力模块。它们可以作为插件,轻松地集成到现有的 CNNQ 架构中,以提高性能。
在这里插入图片描述

SEAttention 也是非常有名的。在2023 的CVPR 的激光3D板块的论文《BEV-SAN: Accurate BEV 3D Object Detection via Slice Attention Networks》也在用,还改进到了很好的效果呢。SE是指"Squeeze-and-Excitation",通过两个步骤来实现注意力机制:压缩和激励。是一种用于增强卷积神经网络(CNN)的注意力机制。核心思想是在卷积神经网络中引入一个全局的注意力机制,以自适应地学习每个通道的重要性。在压缩步骤中,SE网络会对每个通道的特征图进行全局池化,将其压缩成一个标量。在激励步骤中,SE网络会通过一个全连接层,将压缩后的特征向量转换为一个权重向量,用于对每个通道的特征图进行加权。通过引入SE模块,CNN可以自适应地学习每个通道的重要性,从而提高模型的表现能力。SE网络在多个图像分类任务中取得了很好的效果,并被广泛应用于各种视觉任务中。

在这里插入图片描述
在这里插入图片描述
这是论文中对 inception 和resnet 的SE插入。
在这里插入图片描述
注意力机制并不是一个新的概念。计算机视觉领域很早就有关于显著性(自底向上的注意力)的研究,物体检测中常用的由粗到精策略也可以看作是一种注意力(自顶向下的硬注意力)。

神经网络中的注意力机制一般都是指自顶向下的,或者说任务/数据驱动的软注意力机制,包括通道注意力,空间注意力,分支注意力,自注意力和交叉注意力等。

Transformer中的自注意力和BEV感知中的交叉注意力是目前研究较多的两种注意力机制。前者常用于视觉感知中的特征提取,而后者常用于多传感器感知中的特征层融合。

本版本的目录设置:

【Attention(1)】注意力机制(attention mechanism)是解决信息超载问题的主要手段的一种资源分配方案:两种分类:自上而下和自下而上
【Attention(2)】 自上而下的会聚式注意力,注意力机制怎么运行的?自注意力是什么,为何会产生?多头注意力机制是什么?

【Attention(3)】【QKV的注意力机制】 主要思路(笔记)

【Attention(4)】【QKV的自注意力机制】 主要思路(笔记)
【Attention(5)】【注意力机制】CBAM: Convolutional Block Attention Module空间和通道两个维度依次推断出注意力权重(还没发出来)
【Attention(6)】【注意力机制】DANet空间和通道双重注意力Dual Attention Network for Scene Segmentation(还没发出来)
【Attention(7)】 南航提出AFF:注意力特征融合,即插即用!可用于分类、检测和分割等(还没发出来)
【Attention(8)】CV-Attention注意力【算子总结】(还没发出来)
【Attention(9)】【CNN-attention机制】Squeeze-and-Excitation Networks(SENet)通过压缩与激励实现特征强化,最简单最易实现的SE模块
【Attention(10)】RNN->Seq2Seq->Attention->Self-Attention->Transformer
【Attention(11)】经典Attention架构:Bahdanau Attention Mechanism 和Luong Attention

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/522657.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

The Sandbox:在NFT Paris 2024引领数字文艺复兴

我们的欧洲、中东和非洲(EMEA)总部位于法国巴黎,我们的创始人也是土生土长的法国人,因此 The Sandbox 一直与 "光之城 "有着紧密的联系。近年来,巴黎日益成为 Web3 创新的中心,NFT 艺术氛围日益浓…

动态规划刷题(算法竞赛、蓝桥杯)--线段(线性DP)

1、题目链接&#xff1a;P3842 [TJOI2007] 线段 - 洛谷 | 计算机科学教育新生态 (luogu.com.cn) #include <bits/stdc.h> using namespace std; const int N20010; int a[N][2],f[N][2]; //a[i][0]表示l[i],a[i][1]表示r[i] int dis(int a,int b){return abs(a-b); } int…

企业级开源路由系统VyOS-构建和使用

介绍 VyOS是一个基于Linux的企业级路由器操作系统&#xff0c;被许多公司和个人用来驱动物理网络设备&#xff0c;如路由器和防火墙。它有一个统一的命令行界面来管理其所有的网络相关功能&#xff08;和Juniper Junos操作很像&#xff09;。VyOS使用Debian GNU/Linux作为其基…

【JAVASE】带你了解instanceof和equals的魅力

✅作者简介&#xff1a;大家好&#xff0c;我是橘橙黄又青&#xff0c;一个想要与大家共同进步的男人&#x1f609;&#x1f609; &#x1f34e;个人主页&#xff1a;再无B&#xff5e;U&#xff5e;G-CSDN博客 1.instanceof instanceof 是 Java 的保留关键字。它的作用是测试…

自动化高并发批量抓取京东平台商品数据(内附接入key密钥API响应示例)

通过API接口&#xff08;接入key&#xff0c;密钥&#xff09;&#xff0c;可以获取商品的标题、价格、图片、描述等详细信息。 参数说明 通用参数说明 version:API版本key:调用key,测试key:test_api_keysecret:调用secret,测试secret:(不用填写)cache:[yes,no]默认yes&#x…

Java Netty个人对个人私聊demo

一、demo要求 1&#xff09;编写一个Netty个人对个人聊天系统&#xff0c;实现服务器端和客户端之间的数据简单通讯&#xff08;非阻塞&#xff09; 2&#xff09;实现单人对单人聊 3&#xff09;服务器端&#xff1a;可以监测用户上线&#xff0c;离线&#xff0c;并实现消…

【游戏逆向】游戏全屏捡物的实现

0x0前言&#xff1a; 在角色对战类中&#xff0c;拾取怪物掉落的装备是一项必备的工作&#xff0c;由于装备位置掉落的不确定性&#xff0c;玩家想要拾取离角色距离较远的装备需要一定的时间&#xff0c;这一段时间往往会影响游戏的评分或是玩家的心态&#xff0c;基于此&…

【经典算法】LeetCode25:K 个一组翻转链表(Java/C/Python3,Hard)

#算法 目录 题目描述思路及实现方式一&#xff1a;递归思路代码实现Java 版本C 语言版本Python3 版本 复杂度分析 方式二&#xff1a;迭代和原地反转思路代码实现Java 版本C 语言版本Python3 版本 复杂度分析 总结相似题目 标签&#xff1a;链表、递归 题目描述 给你链表的头…

接口日志配置表

表&#xff1a;ZTALL_LOGCFG ZE_ENABLED XFIELD ZE_LOGGING XFIELD ZE_NOTRANS XFIELD ZE_IFURL TEXT255 MANDT MANDT CLNT 3 0 0 客户端 SYSID SYST_SYSID CHAR 8 0 0 ABAP 系统字段&#xff1a;SAP 系统的名称 IFSNR ZE_IFSNR CHAR 30 0 0 接口编号(系统ID流水号…

线程安全--深入探究线程等待机制和死锁问题

꒵˂͈꒱ write in front ꒰˃͈꒵˂͈꒱ ʕ̯•͡˔•̯᷅ʔ大家好&#xff0c;我是xiaoxie.希望你看完之后,有不足之处请多多谅解&#xff0c;让我们一起共同进步૮₍❀ᴗ͈ . ᴗ͈ აxiaoxieʕ̯•͡˔•̯᷅ʔ—CSDN博客 本文由xiaoxieʕ̯•͡˔•̯᷅ʔ 原创 CSDN 如需转…

9亿用户、估值300亿美元,「暗黑版微信」决定上市

自 2017 年以来&#xff0c;Telegram 的创始人帕维尔•杜罗夫&#xff08;Pavel Durov&#xff09;就从没有接受过任何公共采访。直到不久前&#xff0c;这位神秘的亿万富翁接受了英国《金融时报》的采访&#xff0c;他向外界释放出了一个信号——Telegram 正在谋求 IPO。 根据…

Springboot相关知识-图片描述(学习笔记)

学习java过程中的一些笔记&#xff0c;觉得比较重要就顺手记录下来了~ 目录 一、前后端请求1.前后端交互2.简单传参3.数组集合传参4.日期参数5.Json参数6.路径参数7.响应数据8.解析xml文件9.统一返回类10.三层架构11.分层解耦12.Bean的声明13.组件扫描14.自动注入 一、前后端请…

《Java面试自救指南》(专题三)数据库

文章目录 一条sql语句的查询流程有哪些数据库存储引擎&#xff0c;各自的区别数据库的三大范式事务的四大特性&#xff08;含隔离级别&#xff09;MySQL四种隔离机制的底层实现&#xff08;如何解决幻读 &#xff09;MySQL有哪几种锁&#xff0c;分别怎么实现数据库中有哪些索引…

Leetcode-Hot 100题目分类

哈希 &#xff08;以空间换时间&#xff09; 1 两数之和 原始的暴力破解的方法&#xff1a; class Solution {public int[] twoSum(int[] nums, int target) {/** 暴力破解的方法 */int[] result new int[2];int length nums.length;for(int i 0;i<length;i){for(int j…

企业计算机服务器中了locked勒索病毒怎么办,locked勒索病毒解密流程步骤

网络技术的不断发展为企业的生产运营提供了极大便利&#xff0c;也让企业的生产效率大大提高&#xff0c;但网络是一把双刃剑&#xff0c;给给企业的数据安全问题带来严重威胁。近期&#xff0c;云天数据恢复中心接到浙江某商贸公司的求助&#xff0c;企业计算机服务器遭到了lo…

使用 Azure OpenAI、知识图 FalkorDB 和 LlamaIndex 构建医疗保健聊天机器人

原文地址&#xff1a;building-a-mental-health-qa-chatbot-using-falkordb-knowledge-graph-and-llamaindex 介绍 知识图谱是一种将数据转换为机器可以理解的知识的模型&#xff0c;它比传统数据管理系统更能够捕获数据的语义性质和含义。知识图谱通过结构化地表示实体、属性…

docker部署小霸王游戏

下载镜像 docker pull registry.cn-beijing.aliyuncs.com/wuxingge123/jsnes:1.0.0docker-compose部署 vim docker-compose.yml version: 3 services:jsnes:container_name: jsnesimage: registry.cn-beijing.aliyuncs.com/wuxingge123/jsnes:1.0.0ports:- 8082:80restart: …

ArduPilot无人船(车)故障保护设置

故障保护 无人船&#xff08;车&#xff09;支持三种故障保护机制&#xff0c;如下所述。 一、遥控器故障保护&#xff08;也称油门故障保护&#xff09; 如果用户的遥控器和无人船&#xff08;车&#xff09;上的接收机之间的连接丢失至少FS_TIMEOUT秒&#xff0c;则会触发此…

07 | Swoole 源码分析之 Channel 通道模块

原文首发链接&#xff1a;Swoole 源码分析之 Channel 通道模块 大家好&#xff0c;我是码农先森。 引言 通道&#xff0c;用于协程间通讯&#xff0c;支持多生产者协程和多消费者协程。底层自动实现了协程的切换和调度。 通道与 PHP 的 Array 类似&#xff0c;仅占用内存&am…

中科大发布Agent-FLAN,微调提升Agent能力

随着大语言模型&#xff08;LLMs&#xff09;在各种自然语言处理任务中取得巨大成功&#xff0c;将这些模型作为智能代理&#xff08;agents&#xff09;使用时&#xff0c;它们与基于API的模型相比仍有不小的差距。如何将代理能力有效地整合到通用的LLMs中&#xff0c;成为了一…