Game-On论文阅读

异质性是多模态研究中最重要的关注点

文章目录

  • Abstract
  • 1. Introduction
  • 2. Related Work
    • 2.1 多模态假新闻检测 **以往的研究方法**
    • 2.2 GNNs在多模态研究中的地位
    • 3. 方法论
    • 3.1 视觉和文本特征编码器
    • 3.2 共享多模态空间和多模态图构建
    • 3.3 图注意层
    • 3.4 假新闻检测器
  • 4. 实验与结果
    • 4.1 数据集
    • 4.2 实现细节
    • 4.3多模态的baseline总结
    • 4.4 实验结果
    • 4.5 消融研究
  • 5. 总结
  • 参考文献
  • 代码注解
    • 文本单模态Graph
    • 文本单模态评估结果

1、梯度裁剪+dropout实现梯度爆炸问题

2、全连接图的问题:如果使用多模态的是全连接,那经过GAT以后的每个结点的特征是不是都一样了,这样GAME-ON是如何解决的{看代码~}

Abstract

社交媒体在当今时代有着越来越大的影响力。在这些平台上传播的假新闻对我们的生活产生了破坏性和破坏性的影响。此外,由于多媒体内容比文本数据更能提高帖子的可见性,因此已经观察到多媒体经常被用于创建虚假内容。大量以前的多模态工作试图解决在识别虚假内容时对异构模态进行建模的问题。然而,这些工作有以下局限性:

(1)在模型的后期阶段,通过在模态上使用简单的连接运算符来对模态间关系进行低效编码,这可能导致信息丢失;(2)在小而复杂的现实生活中的多模态数据集上训练具有非常深的神经网络,且它具有不成比例数量的参数,这导致过拟合的可能性更高

为了解决这些局限性,我们提出了GAME-ON,这是一种基于图神经网络的端到端可训练框架,允许不同模态内和跨模态的粒度交互,以学习更强大的数据表示,用于多模态假新闻检测。我们使用两个公开的假新闻数据集,Twitter和微博,进行评估。我们的模型在Twitter上的表现平均优于11%,在微博上保持了2.6%的竞争力,同时使用的参数比最佳可比的最先进baseline少65%。

1. Introduction

多模态的重要性

无论新闻的真实性 ,社交媒体的快速发展为信息的传播创造了一个完美的环境。然而,如果对传播的信息没有任何质量控制,假新闻会产生深远的后果**[Zhao et al.,2015年]。例如,2016年美国总统大选期间假新闻的影响[Bovet and Makse,2019],众多“神话”的传播,以及关于COVID-19大流行的误导性信息[Melki et al.,2021; Sharma等人,2021年]。特别是假新闻发起者,使用在文本中添加视觉信息的策略来制作更具吸引力和争议性的帖子来欺骗用户[Verstraete等人,2021年]。因此,在考虑多模态数据的同时检测假新闻至关重要。

先前采用方法:迁移学习、交叉注意力网络融合不同模态

最近,研究人员对多模态假新闻检测领域的兴趣越来越大。已经提出了各种基于深度学习的架构[Khattar等人,2019; Wang等人,2018年]。此外,迁移学习策略在识别假新闻方面越来越受欢迎[Singhal et al.,2019; Singhal等人,2020年]。研究人员还专注于通过以复杂模型为代价使用交叉注意力网络融合不同模态 来进行模态间交互[Wu et al.,2021 a; Qian等人,2021年]。

先前工作方法的缺点:1、简单concat导致信息丢失;2、无法明确多模态数据中出现的异质性差距;3、复杂模型导致的过拟合问题

对于异质性差距的说明:摘自论文《Deep Multimodal Representation Learning: A Survey》:由于来自不同模式的特征向量最初位于不相等的子空间中,与相似语义相关联的向量表示将是完全不同的。这种现象被称为异质性差距—>多模态特征值及其规模的差异】

以前的工作的缺点是使用复杂的模型的不同模态的融合效率低下。在模型中的稍后点使用简单的连接来融合模态,特别地,可能导致信息丢失。此外,以前利用级联运算符对多式的concat关系进行编码的工作未能明确解决多模态数据中出现的异质性差距[Peng和Qi,2019]。即使是试图解决上述问题的研究也使用了具有大量参数的复杂模型[Qian等人,2021],这可能会导致更高的过拟合几率。

使用Graphs背后的动机:
在这里插入图片描述

图1:GAME-On框架的图构造pipline概述。(A)给定一个多模式帖子(新闻样本),取自Twitter数据集,我们为两种模式提取单独的完全连通图。(B)从图像中找到目标并提取其特征表示vi。( C )对于文本图,我们首先对文本进行标记化,并提取其特征表示ti

考虑一个包含文本和视觉内容的多模态帖子(见图1)。在文本的情况下(图1(c)),由于每个单词都很重要,并且为了检测假新闻而与其他单词相连,我们创建了一个文本单模态的图。具体来说,节点表示每个词的embedding,其中包括语义(文本作为一个整体)和语法级(单词作为一个整体)表示,而图中的表示embedding之间的关系。从而,表示单个文本(模态)的多个节点。所有节点之间存在连接,以 避免任何信息丢失。类似地,在图像的情况下(图1(B)),很明显,图像中的每个提取对象都与另一个对象相连接,覆盖图像的语义(图像作为一个整体)和细粒度(对象级)表示。因此, (i)为每个模态(节点)提取细粒度和全局表示有助于模型以图的方式更有效地学习真实世界数据中模态内和模态之间的复杂关系(边),以及 (ii)通过不同模态节点之间的直接和间接连接增加交互的实例有助于减少由不同模态节点的分布不一致引起的异质性差距,语义相似的模式。

图神经网络的发展

图神经网络(GNN)已经彻底改变了许多领域,包括网络科学,语义取证,健康,视觉对话,并在许多任务上取得了优异的性能。此外,在当代多模态表示学习工作中,只有少数人采用了这些强大的GNN技术[Mai et al.,2020; Chen和Zhang,2020; Han等人,2020; Sabir等人,2021; Jiang等人,2020; Arya等人,2019年]。然而,这些作品要么引入对离群值敏感的基于张量分解的方法,要么利用单独的阶段进行模态间和模态内编码。因此,与我们提出的框架不同,前者引入了不必要的复杂性,而后者不能同时建模模态间和模态内的关系。虽然我们的论文重点是多模态假新闻检测作为其应用,我们的框架也可以推广到其他多媒体任务。

【离群值的定义:离群点是指一个数据与其他数据相比,其数值过高或过低。例如,在一个高中班级里,几乎所有的学生都在18岁左右,然而有一个学生的年龄是35岁。离群值会扭曲模型,导致训练时间延长,准确性降低,性能变差。例如,RMSE损失函数对离群值很敏感,在有离群值的情况下会大得多,所以损失函数会试图根据这些离群值来调整模型,甚至牺牲其他样本。】

在这里插入图片描述

【张量分解的定义:张量通常是动态增长的,它的增长通常可以用三种形式来实现:1、维度的增长;2、维度中数据的增长;3、观测数据的增长;现实情况下,往往由于采集数据工具(如采集交通数据的传感器)的故障以及其他异常情况导致数据中往往存在部分缺失值,对这些缺失值的修补称之为“补全”,张量领域的缺失值修复即张量补全。张量补全是根据已有数据对缺失值的影响和低秩假设实现缺失值补全,主要分为两类方法:一种是基于张量补全中给定的秩和更新因子;一种是直接最小化张量秩并更新低秩张量】

基于以前文献中关于多模态假新闻检测的空白和GNN最近的成功,我们工作的主要贡献如下:

模型框架

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/219966.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Linux的IO模型——阻塞IO

当要读数据recvfrom时,其实就需要两个阶段,一是将硬盘数据读到内核缓冲区,二是将内核缓冲区数据拷贝到用户缓冲区。而阻塞IO就是在两个阶段中用户进程都必须阻塞等待。

2024年天津财经大学珠江学院专升本专业课《管理学原理》考试大纲

天津财经大学珠江学院2024年高职升本科专业课考试《管理学原理》考试大纲 一、本大纲系天津财经大学珠江学院2024年高职升本科《管理学原理》课程考试大纲。所列考试范围出自徐碧琳主编的教材《管理学原理(第二版)》,机械工业出版社&#xff…

一篇吃透大厂面试题,2024找工作一帆风顺。

🏆作者简介,普修罗双战士,一直追求不断学习和成长,在技术的道路上持续探索和实践。 🏆多年互联网行业从业经验,历任核心研发工程师,项目技术负责人。 🎉欢迎 👍点赞✍评论…

企业持续绿色创新水平数据集(1999-2022年)

参考何郁冰(2017)的做法,计算持续创新水平。将绿色专利申请的前后期对比来反映创新的持续程度。创新持续性企业在第t-1与t年间的专利申请量之和较第t-2与t-1年间的专利申请量之和的环比增长率,再…

【广州华锐互动】VR沉浸式体验铝厂安全事故让伤害教育更加深刻

随着科技的不断发展,虚拟现实(VR)技术已经逐渐渗透到各个领域,为我们的生活带来了前所未有的便捷和体验。在安全生产领域,VR技术的应用也日益受到重视。 VR公司广州华锐互动就开发了多款VR安全事故体验系统&#xff0c…

python 堆与栈

【一】堆与栈 【 1 】简介 栈(stack),有些地方称为堆栈,是一种容器,可存入数据元素、访问元素、删除元素,它的特点在于只能允许在容器的一端(称为栈顶端指标,英语:top&a…

基于混沌算法的图像加密解密系统

1.研究背景与意义 项目参考AAAI Association for the Advancement of Artificial Intelligence 研究背景与意义: 随着信息技术的迅猛发展,图像的传输和存储已经成为现代社会中不可或缺的一部分。然而,随着互联网的普及和信息的快速传播&am…

什么是CAS, 什么是AQS

文章目录 什么是CAS, 什么是AQSCASAQS 什么是CAS, 什么是AQS CAS AQS AQS 全称是AbstractQueuedSynchronizer, 是juc 下一个核心的抽象类,用于构建各种同步器和锁 比如我们熟悉的 ReentrantLock、ReadWriteLock、CountDownLatch等等是基于AQS. 首先在…

单机无锁线程安全队列-Disruptor

Disruptor 1、基本介绍 说到队列,除了常见的mq中间件,java中也自带线程安全的BlockingQueue,但是BlockingQueue通过在入队和出队时加锁的方式避免并发操作,性能上会大打折扣。 而Disruptor是一个线程安全、低延迟、吞吐量高的队…

波奇学C++:类型转换和IO流

隐式类型转换 int i0; double pi; 强制类型转换 int* pnullptr; int a(int)p; 单参数构造函数支持隐式类型转换 class A { public:A(string a):_a(a){} private:string _a; }; A a("xxxx"); //"xxx" const char* 隐式转换为string 多参数也可以通过{…

深入理解强化学习——马尔可夫决策过程:占用度量-[基础知识]

分类目录:《深入理解强化学习》总目录 文章《深入理解强化学习——马尔可夫决策过程:贝尔曼期望方程-[基础知识]》中提到,不同策略的价值函数是不一样的。这是因为对于同一个马尔可夫决策过程,不同策略会访问到的状态的概率分布是…

园区规划技术要点

(一)技术点介绍 1.WLAN:无线局域网WLAN(Wireless Local Area Network)是一种无线计算机网络,使用无线信道代替有线传输介质连接两个或多个设备形成一个局域网LAN(Local Area Network&#xff09…

【亲测有效,超详细】收到微信小程序限期完成微信认证通知怎么处理?微信小程序年审认证都需要哪些资料?

背景:近期部分微信小程序管理员最近收到了年审认证通知如下图 微信官方通知 微信小程序认证流程 第一步:登录微信公众平台 网址:微信公众平台 第二步:登录进入后会看到年审通知弹窗,点击去年审 第二步:登…

java中Random随机数使用和生成随机数的多个示例

在 Java 中,我们可以使用 java.util.Random 类生成伪随机数。伪随机数的特性是,虽然它们看起来是随机的,但实际上它们是由一个固定的算法生成的。只要我们提供相同的种子,这个算法就会生成相同的数字序列。 首先,我们…

HarmonyOS开发基础(一)

HarmonyOS开发基础(一) // :装饰器:用来装饰类结构、方法、变量 Entry // Entry:标记当前组件为入口组件 Component // Component:标记为自定义组件 // struct:自定义组件,可复用的…

winform使用串口通信读取压力传感装置(CFM)的数据

一、简介 目的:获取CFM的 “hi” 报文,解析出如下数据并绘制波形图。 实现:使用c#打开CFM串口,发送 02 00 02 4C 49 0D 请求到串口,CFM就会不断返回不同类型的报文,我解析的是 “hi” 报文(至…

2477. 到达首都的最少油耗 : 逐步讲解最低油耗求解思路

题目描述 这是 LeetCode 上的 「2477. 到达首都的最少油耗」 ,难度为 「中等」。 Tag : 「DFS」 给你一棵 n 个节点的树(一个无向、连通、无环图),每个节点表示一个城市,编号从 0 到 n - 1,且恰好有 n - 1 …

全网最新最牛的Appium自动化:Appium常用操作之TouchAction操作

TouchAction操作 Appium的辅助类,主要针对手势操作,比如滑动、长按、拖动等。其原理是将一系列的动作放在一个链条中,然后将该链条传递给服务器。服务器接受到该链条后,解析各个动作,逐个执行。 TouchAction类支持的动…

解决:docx.opc.exceptions.PackageNotFoundError: Package not found at ‘xxx’

解决:docx.opc.exceptions.PackageNotFoundError: Package not found at ‘xxx’ 文章目录 解决:docx.opc.exceptions.PackageNotFoundError: Package not found at ‘xxx’背景报错问题报错翻译报错位置代码报错原因解决方法今天的分享就到此结束了 背景…

深度学习TensorFlow2基础知识学习前半部分

目录 测试TensorFlow是否支持GPU: 自动求导: 数据预处理 之 统一数组维度 定义变量和常量 训练模型的时候设备变量的设置 生成随机数据 交叉熵损失CE和均方误差函数MSE 全连接Dense层 维度变换reshape 增加或减小维度 数组合并 广播机制&#…