基于深度学习的表情动作单元识别综述

  1. 论文标题:基于深度学习的表情动作单元识别综述

  2. 作者:邵志文1,2,周 勇1,2,谭 鑫3,马利庄3,4,刘 兵1,2,姚 睿1,2

  3. 发表日期:2022 年8 月

  4. 阅读日期 :2023 年 11 月 30

  5. 研究背景:
    基于深度学习的表情动作单元识别是计算机视觉与情感计算领域的热点课题 . 每个动作单元描述了一种人脸局部表情动作,其组合可定量地表示任意表情. 当前动作单元识别主要面临标签稀缺、特征难捕捉和标签不均衡3个挑战因素. 基于此,本文将已有的研究分为基于迁移学习、基于区域学习和基于关联学习的方法,对各类代表性方法进行评述和总结 . 最后,本文对不同方法进行了比较和分析,并在此基础上探讨了未来动作单元识别的研究方向.
    在这里插入图片描述
    在这里插入图片描述在这里插入图片描述

  6. 方法和性质
    基于迁移学习、基于区域学习和基于关联学习的方法

  7. 研究结果

  8. 创新点

  9. 数据
    在这里插入图片描述

  10. 结论

  11. 挑战
    标签稀缺、特征难捕捉和标签不均衡3个挑战因素

  12. 研究展望
    (1)已有基于迁移学习的工作尚无法有效地解决标签稀缺性挑战. 未来可以采取融合多种策略的方式:①将具有AU标签的样本作为源样本,利用GAN将无标签目标样本的表情编辑为源表情,则其具有源样本的AU标签,这些新生成的目标样本提高了训练数据的多样性;②利用最新的人脸配准开源库对样本标注特征点,同时结合具有整体表情标签的数据集,挖掘特征点、整体表情与 AU 间关联性,促进 AU 识别;③将自监督学习、有监督学习、域适应多种方法综合起来,利用自监督学习从无标签样本中学习 AU 本质属性的特征表示,利用有监督学习从具有 AU 标签的样本中学习AU识别模型,利用域适应使得其他域训练的模型可以被应用于当前域.
    (2)当前的 AU 识别模型在对多个 AU 同时预测时仍易于偏向提升出现频率较高AU的精度,以及偏向将AU预测为不出现,标签不均衡性依然严重限制着AU识别的精度. 可选的解决方案为:①利用GAN进行数据扩增,尽量使所生成的数据集在每个AU的出现与不出现频率、不同AU间的出现频率方面保持均衡;②借鉴已有的处理长尾分布等不均衡数据的方法,对不均衡的 AU标签分布进行建模,充分挖掘不同AU间的关联关系.
    (3)现有的工作主要关注受控环境,更接近实际应用场景的非受控AU识别的相关研究仍较少. 未来可从以下角度切入非受控环境的研究:①研究受控域到非受控域的AU迁移方法,利用具有AU标签的受控域数据集生成新的非受控域样本,扩增非受控域训练数据;②提高方法对不同头部姿态的鲁棒性,可以定位3D的人脸特征点、构造UV 映射、计算3D人脸表面的测地距离,这些辅助信息都可以加到深度神经网络中,在输入、中间的特征提取或者后置处理环节提升 AU识别的精度;③利用特征解耦方法将光照、姿态、遮挡等信息从 AU 特征中分离,实现光照无关、姿态无关、遮挡无关的AU识别.
    (4)当前的 AU 数据集具有样本规模小且多样性低、标签稀缺且不均衡、缺乏非受控样本等不足 . 未来可以构建一个规模大、样本多样性丰富、AU 标注全面的非受控环境数据集. 由于对AU进行人工标注的成本很高,在标注的过程中,可以基于主动学习(ActiveLearning)[94~96],从一个具有人工标注的小训练集开始,训练模型并对未标注样本进行预测,然后基于预测结果选择信息最丰富、存在出现频率较低AU的未标注样本进行人工标注,再将新标注的样本加入训练集并更新模型,重复上述步骤直至被训练的模型在测试集上的性能已收敛或已满足精度要求,这样可以保证有限的标注成本用在最需要的样本上.

  13. 重要性

  14. 写作方法:

  • 多模态:多种数据结合
  • 传统和深度学习方法各 3 个
    在这里插入图片描述
  • 换式降重
  • 为什么没有采取啥啥啥,因为…
  • GAN生成对抗网络🌟
  • 图,加分
    在这里插入图片描述
  • 自适应也很火,感受野,EMD,
  • 经典套话
    在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/203010.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Docker 下载加速

文章目录 方式1:使用 网易数帆容器镜像仓库进行下载。方式2:配置阿里云加速。方式3:方式4:结尾注意 Docker下载加速的原理是,在拉取镜像时使用一个国内的镜像站点,该站点已经缓存了各个版本的官方 Docker 镜…

【攻防世界-misc】CatCatCat

1.下载附件并解压至桌面, 包含一张图片,一个txt文件,将图片复制到kali桌面上,使用strings命令查看该图片内容是否包含flag字符,得到的内容是密码为:catflag 在查看txt文件时,可以看到在文件名命…

Linux常用基础命令及重要目录,配置文件功能介绍

目录 一,Linux常用必备基础命令 1,网络类命令 2,文件目录类命令 3,操作类命令 4,关机重启命令 5,帮助命令 6,查看显示类命令 7,命令常用快捷键 二,Linux重要目录…

论文阅读——SEEM

arxiv: 分割模型向比较灵活的分割的趋势的转变:封闭到开放,通用到特定、one-shot到交互式。From closed-set to open-vocabulary segmentation,From generic to referring segmentation,From one-shot to interactive segmentati…

手敲myarraylist,深入了解其运行逻辑

1、自定义MyArrayList类 该类里面基本有两个属性,一个是用来存放数据的数组,另外一个是用来描述已经存放数据的数量。同时设置arraylist表的默认长度为10;代码如下: public class MyArrayList {private int[] elem;private int u…

【HTML】VScode不打开浏览器实时预览html

1. 问题描述 预览HTML时,不想打开浏览器,想在VScode中直接实时预览 2. 解决方案 下载Microsoft官方的Live Preview 点击预览按钮即可预览

图面试专题

一、概念 和二叉树的区别:图可能有环 常见概念 顶点(Vertex): 图中的节点或点。边(Edge): 顶点之间的连接线,描述节点之间的关系。有向图(Directed Graph)&…

力扣题:字符的统计-12.1

力扣题-12.1 [力扣刷题攻略] Re:从零开始的力扣刷题生活 力扣题1:451. 根据字符出现频率排序 解题思想:统计字符出现的个数,进行排序即可 class Solution(object):def frequencySort(self, s):""":type s: str:…

Spine深入学习 —— 换装

Spine深入学习————换装 数据对象和实例对象的关系与区别 数据对象是无状态的,可在任意数量的骨架实例间共用。有对应实例数据的数据对象类名称以“Data”结尾,没有对应实例数据的数据对象则没有后缀,如附件、皮肤及动画。 实例对象有许…

UWB高精度定位系统项目源码

在现代社会中,精准定位技术对于各行各业都至关重要。为了满足对高精度定位的需求,超宽带(Ultra-Wideband, UWB)技术应运而生。UWB高精度定位系统以其出色的定位精度和多样化的应用领域而备受关注。本文将深入探讨UWB高精度定位系统…

机器学习:DBSCAN算法(效果比K-means好)

基本概念 核心对象:以点为圆心半径为r的圆,如果圈里面的样本点大于给定的阈值(minPts),那么这个点就叫做核心点 直接密度可达:点p在q为圆心的圆内 密度可达: p1与p2直接密度可达,p2与p3直接密度可达&…

基于社区电商的Redis缓存架构-缓存数据库双写、高并发场景下优化

基于社区电商的Redis缓存架构 首先来讲一下 Feed 流的含义: Feed 流指的是当我们进入 APP 之后,APP 要做一个 Feed 行为,即主动的在 APP 内提供各种各样的内容给我们 在电商 APP 首页,不停在首页向下拉,那么每次拉的…

通达OA inc/package/down.php接口未授权访问漏洞复现 [附POC]

文章目录 通达OA inc/package/down.php接口未授权访问漏洞复现 [附POC]0x01 前言0x02 漏洞描述0x03 影响版本0x04 漏洞环境0x05 漏洞复现1.访问漏洞环境2.构造POC3.复现 0x06 修复建议 通达OA inc/package/down.php接口未授权访问漏洞复现 [附POC] 0x01 前言 免责声明&#x…

el-row错位问题解决

<el-row type"flex" style"flex-wrap:wrap">

突破界限:R200科研无人车,开辟研究新天地

提到科研无人车&#xff0c;大家可能首先想到的是其在自动驾驶和其他先进技术领域的应用。然而&#xff0c;随着科技的不断进步&#xff0c;科研无人车已经在智慧城市建设、商业服务、地质勘探、环境保护、农业技术革新、灾害应急和自动化服务等多个领域发挥着至关重要的作用。…

股东信息API:如何通过API获取企业股东构成的全貌

前言 在当今数字化时代&#xff0c;信息的获取和分析变得至关重要&#xff0c;特别是对于投资者和企业决策者而言。股东信息是企业治理中一个关键的方面&#xff0c;了解企业的股东构成有助于投资决策、风险管理以及业务战略的制定。本文将探讨股东信息API&#xff0c;介绍如何…

unity UI特效遮罩

using System.Collections; using System.Collections.Generic; using UnityEngine;/**UI特效遮罩 1.需要将ScrollRect 的遮罩Mask 换为 2D Mask2.将特效的Render里面的 Masking 设置为*/ public class UIParticleMaskControll : MonoBehaviour {// Start is called before …

全网最细图解知识蒸馏(涉及知识点:知识蒸馏训练过程,推理过程,蒸馏温度,蒸馏损失函数)

一.是什么&#xff1f; 把一个大的模型(定义为教师模型)萃取&#xff0c;蒸馏&#xff0c;把它浓缩到小的模型(定义为学生模型)。即&#xff1a;大的神经网络把他的知识教给了小的神经网络。二.为什么要用知识蒸馏把大模型学习到的东西迁移到小模型呢呢&#xff1f; 因为大的…

需求不明确的情况下,测试该如何处理?

当需求不明确的情况下&#xff0c;测试团队可以采取以下措施来处理&#xff1a; 1. 与项目团队进行沟通&#xff1a;测试团队应与项目团队密切合作&#xff0c;与业务分析师、产品经理等相关人员进行沟通&#xff0c;以获取更多的需求细节和背景信息。通过与相关方的交流&…

力扣日记11.30-【二叉树篇】平衡二叉树

力扣日记&#xff1a;【二叉树篇】平衡二叉树 日期&#xff1a;2023.11.30 参考&#xff1a;代码随想录、力扣 110. 平衡二叉树 题目描述 难度&#xff1a;简单 给定一个二叉树&#xff0c;判断它是否是高度平衡的二叉树。 本题中&#xff0c;一棵高度平衡二叉树定义为&#…