Masked Relation Learning for DeepFake Detection

一、研究背景
1.现有deepfake检测方法大多关注于局部伪影或面部不协调,较少挖掘局部区域间的关系。
2.现有关系挖掘类的工作往往忽略了关系信息的传播。
3.遮挡建模在减轻信息冗余的同时促进高级语义信息(诱导性偏差较小)的挖掘,有助于提升网络的泛化性能。

二、研究动机
1.Deepfake技术会单独操纵视频中的每一帧,伪造结果缺乏时间连贯性。基于视频的检测技术更加关注相邻帧之间的时间不连贯性和时空不一致性,可降低对空间伪影的依赖并提升泛化性能。
2.将关系特征作为一种泛化模式可以提升检测性能,但大量的冗余关系信息会阻碍信息的表达。遮挡建模能减少信息的冗余,迫使模型习得更具泛化性的内在特征。

三、研究目标
从区域级关系中学习通用的鉴别性特征,减轻对视觉伪影的依赖。

四、技术路线

  • 本文将deepfake检测任务定义为图分类问题,每个面部区域作为一个图的结点,并对结点间的关系进行建模。
  • 对部分关系进行屏蔽,减少冗余并促进模型对全局结构的感知
  • 实现在无监督的情况下定位面部伪造区域。
    在这里插入图片描述

1.时空注意力模块(STA):
学习不同面部区域的注意力特征。

  • 将特征图 F 0 t F_{0}^t F0t转换为注意力图 F A t F_{A}^t FAt
  • 用注意力图强调特征图得到注意力特征图 F t F^t Ft
  • 对注意力特征图进行平均归一化得到注意力特征向量 V t V^t Vt
    在这里插入图片描述
  • 设置正交多样性损失 L o d L_{od} Lod使不同注意力特征向量关注不同面部信息
  • T为视频片段划分数量, V t ∈ R N ∗ C V^t\in \mathbb{R}^{N*C} VtRNC N N N为注意力头数量, I I I为单位阵
  • (4)使不同注意力头的输出差异尽可能大
    在这里插入图片描述
  • 设置时间一致性损失 L t c L_{tc} Ltc,使每个注意力头在时间维度上追踪各自区域
  • (5)使相邻帧之间的注意力向量保持一致
    在这里插入图片描述

2.遮挡关系学习模块(MRL):
屏蔽部分区域间的相关性以减少信息冗余,以此促进对本质特征的学习并捕获全局视角下的不规则关系。

  • 最小屏蔽策略:计算门限值 q q q p p p为预定义参数
    在这里插入图片描述

  • 随机屏蔽策略:根据伯努利分布采样 η \eta η
    在这里插入图片描述

  • 利用TGCN捕获不规则关系:TGCN由GCN和GRU构成

  • 在这里插入图片描述

  • 对特征关系图进行图卷积计算
    在这里插入图片描述

  • 对隐藏层进行图卷积计算
    在这里插入图片描述

  • 更新隐藏层
    在这里插入图片描述
    3.特征分类
    在这里插入图片描述
    4.损失函数
    在这里插入图片描述
    5.算法流程
    在这里插入图片描述
    在这里插入图片描述
    五、实验结果
    Although our method has sub-optimal performance on FF++(HQ), it outperforms state-of-the-art approaches on detecting
    unseen deepfake datasets. Strong generalization ability is one of the pursuits of deepfake detection. Our method effectively promotes the generalization ability of detectors.
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    Hereby we localize the fake regions by Grad-CAM in Fig. 9. We observe that our method can highlight the fake regions of
    manipulated faces. For instance, NeuralTextures only modifies the mouth region
    在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/147943.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

小型洗衣机哪个牌子好用又耐用?性价比高的内衣洗衣机测评

大多数的用户对自己的内衣、内裤的卫生非常注重,而往往许多的用户都会选择自己手工清洗,但是单靠手工洗只是表面的污渍,并不能完全去除贴身衣物上的各种细菌。现在通过内衣裤感染到细菌真的是越来越多,所以我们对内衣裤的清洗频次…

LeetCode——OJ题之二叉树【上】

✏️✏️✏️今天给大家分享几道二叉树OJ题! 😛😛😛希望我的文章能对你有所帮助,有不足的地方还请各位看官多多指教,大家一起学习交流! 动动你们发财的小手,点点关注点点赞&#xff…

企业设备巡检的痛点和解决方案

在设备巡检过程中,企业常面临多种痛点。首先,信息管理不足是一个关键问题,企业往往缺乏全面、准确的设备信息记录,这导致巡检工作缺乏针对性和效率。其次,巡检流程的非标准化使得巡检结果出现不一致,重要的…

ssm+vue的物流配送管理系统(有报告)。Javaee项目,ssm vue前后端分离项目

演示视频: ssmvue的物流配送管理系统(有报告)。Javaee项目,ssm vue前后端分离项目 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站。 项目介…

机器学习-搜索技术:从技术发展到应用实战的全面指南

在本文中,我们全面探讨了人工智能中搜索技术的发展,从基础算法如DFS和BFS,到高级搜索技术如CSP和优化问题的解决方案,进而探索了机器学习与搜索的融合,最后展望了未来的趋势和挑战,提供了对AI搜索技术深刻的…

机器学习基础之《回归与聚类算法(7)—无监督学习K-means算法》

一、什么是无监督学习 1、没有目标值—无监督学习 一家广告平台需要根据相似的人口学特征和购买习惯将美国人口分成不同的小组,以便不同的用户采取不同的营销策略。 Airbnb需要将自己的房屋清单分组成不同的社区,以便用户能更轻松地查阅这些清单&#x…

chatGPT真的会改变我们的生活吗?

先不说生活影响有多大,工作职场影响很大,现在在职场,随处可见Chat GPT的身影 OpenAI 开发的 ChatGPT 和类似的人工智能工具在短时间内不会取代我们的工作。但是,在科技、媒体等许多行业中,它们可以帮助员工更好、更快地…

正版软件|Soundop 专业音频编辑器,实现无缝的音频制作工作流程

关于Soundop Soundop 音频编辑器 直观而专业的音频编辑软件,用于录制、编辑、混合和掌握音频内容。 Soundop 是一款适用于 Windows 的专业音频编辑器,可在具有高级功能的直观灵活的工作区中录制、编辑和掌握音频并混音轨道。音频文件编辑器支持波形和频谱…

企业云盘:作用和特点全解析

一、什么是企业云盘? 企业云盘是基于云计算理念推出的企业数据网络存储和管理解决方案,利用互联网后台数据中心的海量计算和存储能力为企业提供数据汇总分发、存储备份和管理等服务。 简单来讲,企业云盘其实就是企业网盘,是一种为…

一则DNS被重定向导致无法获取MySQL连接处理

同事反馈xwik应用端报java exception 获取MySQL连接超时无法连接到数据库实例 经过告警日志发现访问进来的IP地址数据库端无法被解析,这里可以知道问题出现在Dns配置上了 通过以上报错检查/etc/resolve.conf 发现namesever 被重定向设置成了114.114.114.114 域名 …

如何用AI交互数字人打造数智文旅?

随着旅游业不断发展壮大,景区的功能不断扩展、业态不断延伸、硬件不断升级,但如何利用自身文旅资源打造差异化、数智化文旅景点,吸引游客与市民成为一大经营痛点。 而AI交互数字人的出现,可以极大地将文旅资源以可视化、具象化的…

资讯 | 图扑应邀出席“数字孪生•筑梦末来”数字工程论坛

2023"数字孪生 筑梦未来"数字工程论坛于 11 月 8 日在杭州拉开帷幕。该论坛是由中国电建集团华东勘测设计研究院有限公司发起创办全国性“工程IT”高端交流平台活动。 图扑软件作为受邀参展企业之一,有幸与诸位专家学者、参展客户共同领略数字化发展的成…

洗内裤的小洗衣机买啥牌子的?口碑好的迷你洗衣机推荐

迷你洗衣机是一种小型的家用洗衣设备,主要是由于其小巧便携而且实用性高的特点,非常适用于小户型家庭、单身人士、学生宿舍等场所,如今随着迷你洗衣机在市场上越来越受到消费者的青睐。那么,迷你洗衣机哪个牌子好用又不贵呢&#…

职场新人,如何提高自我管理能力?

作为职场新人,一定要学会个人管理。 入职三个月多,我总结了一个经验,作为职场新人,我越加觉得自我管理重要性。 在职场一个普遍的现象:在领导眼里,同样的问题在老职员身上不是问题,在新员工身…

【华为OD题库-022】阿里巴巴找黄金宝箱(IV)-java

题目 一贫如洗的椎夫阿里巴巴在去砍柴的路上,无意中发现了强盗集团的藏宝地,藏宝地有编号从0-N的子,每个箱子上面有一个数字,箱子排列成一个环,编号最大的箱子的下一个是编号为0的箱子。请输出每个箱子贴的数字之后的第…

冰点还原精灵Deep Freeze for mac版

Deep Freeze是一种系统恢复软件,它可以保护计算机系统免受恶意软件和不必要的更改。它的基本功能是在计算机重启后恢复到原始状态,即使用户进行了任何更改也不例外。 Deep Freeze主要用于公共场所的计算机,如图书馆、学校实验室和互联网咖啡馆…

卡尔曼滤波器第 2 部分 - 贝叶斯滤波器

一、说明 这是卡尔曼滤波器系列的第二部分,我们在概念和代码方面对卡尔曼滤波器进行了基于示例的理解。在第一部分中,我们对卡尔曼滤波器有了直观的理解,然后是基于数值的 Alpha-Beta 滤波器(构成卡尔曼滤波器的基础)的…

时分复用(Time Division Multiplexing, TDM)介绍(同步时分复用、异步时分复用(统计时分复用))

文章目录 时分复用技术: 原理与应用概述1. 时分复用的基本原理1.1 定义和工作方式1.2 同步与异步时分复用 2. 时分复用的技术特点2.1 优点2.2 缺点 3. 时分复用的应用3.1 电信网络3.2 数字视频广播3.3 光纤通信 4. 时分复用模拟代码参考文献总结 时分复用技术: 原理与应用 概述…

使用VC++设计程序:对于一幅256级灰度图像,求其一元熵值、二维熵值

数字图像处理–实验二B图像的一维熵与二维熵算法 本文主要是对图像进行一维熵以及二维熵的计算,下面附有实现的代码 文章目录 数字图像处理--实验二B图像的一维熵与二维熵算法一、 实验内容二、 一维熵1. 一维熵的定义2. 一维熵的C代码实现 三、 二维熵1. 二维熵的定…