傅里叶变换+注意力机制!CCF-A离你并不遥远!

今天给大家推荐一个,创新Top且热度持续攀升的方向:傅里叶变换+注意力机制!

傅里叶变换能够捕捉到频域的特征,而注意力机制则能使模型专注任务相关信息。两者结合,不仅能提升模型的性能和效率,还能增强模型的解释性,以及解决特定问题(应对噪声干扰、处理长程依赖)。且在时间序列预测、多模态融合、图像处理等诸多任务中都已验证。

因此,其在NeurIPS、AAAI等顶会,都是“红人”;而作为新思路,当前还在发展期,还不算卷,可挖掘创新空间很大。比如优化计算效率、增强泛化性、与生物等其他学科或者场景交叉……

为让大家能够开拓视野,获得更多灵感启发,我给大家准备了12种前沿创新思路和源码,一起来看!

论文原文+开源代码需要的同学看文末

论文:GA: Fourier-Guided Attention Network for Crowd Count Estimation
内容

该论文提出了一种名为FGA的新型注意力机制,用于人群计数任务。FGA通过结合快速傅里叶变换(FFT)和空间/通道注意力机制,高效地捕捉多尺度信息,包括全局模式和局部特征。该模块采用双路径架构:一条路径通过FFT处理全局特征,另一条路径通过传统卷积和通道注意力处理半全局和局部特征能够在多个基准数据集上显著提升性能,降低均方误差(MSE)和平均绝对误差(MAE)。

论文:Rethinking Fourier Transform from A Basis Functions Perspective for Long-term Time Series Forecasting
内容

该论文提出了一种名为FBM的新方法,用于长期时间序列预测(LTSF)。FBM从基函数的角度重新思考傅里叶变换,将频率分量的实部和虚部视为分层频率水平下的余弦和正弦基函数的系数。该方法通过傅里叶基展开混合时域和频域特征,解决了现有傅里叶方法中存在的“不一致起始周期”和“不一致序列长度”问题。

论文:Deep Fourier-embedded Network for RGB and Thermal Salient Object Detection
内容

该论文提出了一种基于快速傅里叶变换(FFT)的深度网络模型DFENet,用于RGB和热成像(RGB-T)图像中的显著目标检测(SOD)。该模型通过三个关键模块克服了现有Transformer模型计算复杂度高和预测与真值之间频率差异的问题:模态协调感知注意力模块(MPA)用于融合RGB和热成像模态;频率分解边缘感知块(FEB)用于澄清目标边缘;傅里叶残差通道注意力块(FRCAB)用于优先处理高频信息。

论文:GAFNet: A Global Fourier Self Attention Based Novel Network for multi-modal downstream tasks
内容

该论文提出了一种名为GAFNet的新型网络架构,专为多模态下游任务设计。GAFNet通过引入全局傅里叶自注意力模块(GAF模块),将图像和文本等多种模态信息融合到一个统一的潜在空间中,解决了多模态学习中模态间异构性的问题,在CrisisMMD数据集的多模态分类任务和COCO数据集的图像生成任务上达到了新的最佳性能,并在图像-文本检索任务上取得了具有竞争力的结果。

 关注下方《人工智能学起来》

回复“傅里叶注意”获取全部论文+开源代码

码字不易,欢迎大家点赞评论收藏

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/977503.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【学习笔记】计算机网络(四)

第4章 网络层 文章目录 第4章 网络层4.1 网络层的几个重要概念4.1.1 网络层提供的两种服务虚电路服务(Virtual Circuit Service)数据报服务(Datagram Service) 4.1.2 网络层的两个层面 4.2 网际协议 IP - IPv44.2.1 虚拟互连网络4…

Ollama部署本地大模型DeepSeek-R1-Distill-Llama-70B

文章目录 一、下模二、转模1. 下载转换工具2. 安装环境依赖3. llama.cpp1. 转换脚本依赖2. llama.cpp安装依赖包3. llama.cpp编译安装4. 格式转换 三、Ollama部署1. 安装启动Ollama2. 添加模型3. 测试运行 一、下模 #模型下载 from modelscope import snapshot_download model…

【GPT】从GPT1到GPT3

every blog every motto: Although the world is full of suffering, it is full also of the overcoming of it 0. 前言 从GPT1 到GPT3 1. GPT1 论文: https://s3-us-west-2.amazonaws.com/openai-assets/research-covers/language-unsupervised/lan…

stm32使用(无线串口)实现收发、判断数据+DMA(HAL库)

目录 前言: 1. 用CubeMX配置串口DMA所需要的环境 (1)打开CubeMAX,点击红框 (2)查找stm32F103C8T6的芯片 (3)配置SYS (4)配置RCC时钟 (5&am…

QT入门--QMainWindow

从上向下依次是菜单栏,工具栏,铆接部件(浮动窗口),状态栏,中心部件 菜单栏 创建菜单栏 QMenuBar* mybar1 menuBar(); 将菜单栏放到窗口中 setMenuBar(mybar1); 创建菜单 QMenu *myfilemenu mybar1-…

重构清洁想象,石头科技首创五轴仿生机械手打破传统清洁边界

2月25日,主题为“重构清洁想象”的石头科技2025发布会在上海天文馆正式召开。石头科技清洁产品BU总裁钱启杰在会上宣布,石头科技正式成为上海天文馆授权合作伙伴,希望借助航天科技到家庭科技的跨越,进一步简化家庭清洁工作&#x…

Amazon Outposts:构建混合云的安全堡垒,让数据安全“零距离”

在数字化转型的浪潮中,企业纷纷拥抱混合云架构以兼顾敏捷性与本地化需求。然而,如何确保数据在本地与云端的无缝流转中始终安全可控,成为企业面临的核心挑战。Amazon Outposts 作为AWS推出的混合云解决方案,不仅将原生AWS服务延伸…

详解Redis如何持久化

引言 本文介绍了 Redis 的两种持久化方式:RDB 和 AOF。RDB 按时间间隔快照存储,AOF 记录写操作。阐述了它们的配置、工作原理、恢复数据的方法、性能与实践建议,如降低 fork 频率、控制内存等,还提到二者可配合使用,最…

【Ambari】Ranger KMS

目录 一、Ranger KMS介绍 二、KMS基于Ranger插件安装 一、Ranger KMS介绍 Ranger KMS是把数据存储入后台数据库中。通过Ranger Admin可以集中化管理KMS服务。 Ranger KMS有三个优点 l Key management Ranger admin 提供了创建,更新,删除密钥的Web UI…

vscode设置终端复制快捷键(有坑!!!)

vscode的编辑页面和终端的复制粘贴快捷键是不一样的。 vscode的终端复制快捷键为ctrlshiftC,当然,自己可以自定义设置 vscode设置终端复制快捷键(有坑!!!)_vs code 不能复制-CSDN博客文章浏览…

angular舒尔特方格

说明:我计划用angular实现舒尔特方格的功能,必须是动态的,比如33,55,9*9,而且无论是什么样式的,都必须保持正方形,然后还有时间监听,计算用户完成方格的时间,…

提升数据洞察力:五款报表软件助力企业智能决策

概述 随着数据量的激增和企业对决策支持需求的提升,报表软件已经成为现代企业管理中不可或缺的工具。这些软件能够帮助企业高效处理数据、生成报告,并将数据可视化,从而推动更智能的决策过程。 1. 山海鲸报表 概述: 山海鲸报表…

DistilQwen2.5发布:通义千问蒸馏小模型再升级

01 引言 因高计算成本和复杂性,在例如移动设备和边缘计算场景等资源有限的环境中,限制了大语言模型的普及。如何在保留模型性能的同时提高计算效率并降低部署成本,已成为研究和工业界必须面对的关键挑战。 在此背景下,我们正式…

VS2022配置FFMPEG库基础教程

1 简介 1.1 起源与发展历程 FFmpeg诞生于2000年,由法国工程师Fabrice Bellard主导开发,其名称源自"Fast Forward MPEG",初期定位为多媒体编解码工具。2004年后由Michael Niedermayer接任维护,逐步发展成为包含音视频采…

【前端基础】Day 1 HTML

总结: 1. Web标准的构成 2. 基本标签 目录 1. Web标准的构成 2. 基本标签 2.1快捷键 2.2.1标题标签 2.2.2段落和换行标签 2.2.3文本格式化标签 2.2.4div和span标签 2.3.1 图像标签和路径 2.3.2路径 2.3.3超链接标签 2.4注释标签 2.5特殊字符 1. Web标准…

Android Realm数据库使用与集成指南

本地存储storage集成创建Realm数据模型插入和更新数据模型数据查询统计数据分页查询处理表数据删除操作总结Realm 是一款专为移动端和嵌入式场景设计的高性能、跨平台的 对象数据库(NoSQL),由 MongoDB 团队维护。它的核心思想是将数据模型直接映射到对象(如 Java/Kotlin、S…

(九)趣学设计模式 之 桥接模式!

目录 一、 啥是桥接模式?二、 为什么要用桥接模式?三、 桥接模式的实现方式四、 桥接模式的优缺点五、 桥接模式的应用场景六、 总结 🌟我的其他文章也讲解的比较有趣😁,如果喜欢博主的讲解方式,可以多多支…

Day8 蓝桥杯acw讲解

首先先给大家看一道这个题, 我真的是太喜欢y总了,如果大家也是最近在准备蓝桥杯或者计算机相关的比赛,但是得加一个前提就是必须最好基础真的很好,要不然其实买了课,也没啥太大的用处,其实就可以以我本人举…

谷云科技iPaaS×DeepSeek:构建企业智能集成的核心底座

2025年,DeepSeek大模型的爆发式普及,正引领软件行业实现 “智能跃迁”。从代码生成到系统集成,从企业级应用到消费级产品,自然语言交互能力已成为新一代软件的核心竞争力。据行业分析,超60%的软件企业已启动大模型适配…

java面试项目介绍,详细说明

金三银四少走弯路,Java岗面试冲刺,你与大厂只差这篇文章包括面试准备,帮助大家少走弯路,成功入职大厂,并快速成长落地。 祝大家拿到满意的offer!(把许愿的offer发在评论区,一定会实现的) 主要从四大方面:掌握的主要知识、算法、项目、简历 掌握的主要知识 下面是我看过的资料和…