探索手势能够识别在训练数据中未观察到的情绪

介绍

论文地址:https://arxiv.org/pdf/2202.10571.pdf
基于人工智能的情感识别研究领域是各个领域不可或缺的,如机器人和情感计算,并在语音中使用面部表情和手势来实现人们提出了各种方法来识别一个人的情绪。然而,这些基于机器学习的情感识别算法的主要挑战之一是建立情感分类算法所需的大量的标记数据集

为了解决这些问题,人们提出了一些方法,并开发了各种方法,以纳入有人提出了零点学习,并开发了各种方法。在本文中,我们提出了一个新的零点框架,即SC-AAE,在从手势中识别情绪方面明显优于现有方法。介绍。

SC-AAE的概述

SC-AAE的模型概述如下图所示。

该方法采用一系列由T(时间步骤)×V(节点)×3(位置坐标)组成的手势,并使用**完全监督的手势情感识别(FS-GER)**情感识别算法生成特征向量。

然后,它包括在对抗性自动编码器架构的基础上,学习所见类(训练中使用的情绪类)和****未见类(训练中未使用的情绪类)之间的映射。

零距离学习

首先,本节介绍了本文中多次提到的零点学习。零点学习是机器学习的一个研究领域,是一种预测训练数据中从未出现过的标签的方法

例如,在学习狗和猫的图像时,普通的机器学习方法利用狗和猫的标签,而零点学习则是通过类别而不是标签进行分类。具体来说,通过将狗和猫的标签转换为多个维度的特征向量,而不是单一的数字,就有可能识别出意义接近的词,并推断出训练中没有使用的数据之间的关系,例如在训练中没有观察到的马的向量,但与狗比猫更接近有可能。

通过使用这种方法,本文旨在使用由从手势中观察到的情绪组成的 "**看见 "类(Relief, Shape, Pride)**进行训练,以及 "看不见 "类(Joy,厌恶、中立),由验证期间未从手势中观察到的情绪组成。

完全监督的手势情感识别(FS-GER)。

接下来,该方法中用于特征提取的情感识别算法,即完全监督的手势情感识别(FS-GER),这是该方法中用于特征提取的情感识别算法。

下面是FS-GER的整体视图。

这个网络的输入是。T(时间步长)×V(节点)×3(位置坐标)的姿势序列,由于手势是一个周期性的姿势序列,空间时间图卷积网络(ST-GCN)捕捉输入手势的空间和时间特征(ST-GCN)。

情感特征,即在预处理中从手势中提取的情感特征向量,然后被添加到通过1×1卷积层得到的128维向量中。

现有的研究表明,来自手势的情感特征与情感识别问题相关,情感特征包括两个特征

  • 姿势特征:从成对的关节之间的距离以及所涉及的三个关节形成的角度和面积中提取。
  • 运动特征:包括手势期间相关关节的加速度

然后,这个特征向量通过全连接层和Softmax层,生成用于情感分类的标签。

语言嵌入

该方法使用现有的word2vec方法来提取关于情绪的300维特征向量。

使用这个向量表示,可以确定数据中所有情绪之间的接近程度**(=相关性)和差异程度(=差异性**)。

在这种方法中,一组情绪可以表达如下

其中,{ei}∈ℝ300是情感词之间的word2vec表示,而两种特定的情绪通过欧几里得距离联系起来。

通过FS-GER和Language Embedding获得的特征向量被传递给独立的Discriminators并用于训练。

FS-GER的性能

为了确认FS-GER的性能,本文在以下条件下将其与现有的情感识别方法进行了比较和验证。

  • 以数据中的所有身体关节作为输入条件,从头开始训练网络。
  • 使用情绪化的身体表达数据库(EBEDB)作为数据集
    • EBEDB包括在演员讲述某些台词时对自然运动身体姿态的3D动作捕捉。
  • 这时,从数据集中的11个情感类中构建了6个 "看见 "类和5个 "看不见 "类并进行分类。

每种方法的分类精度如下。

该表证实,该方法比现有方法的分类精度高7-18%。

对我们的 "零距离 "框架的评估

接下来,该方法的零点框架,即SC-AAE,与现有方法进行了比较。

用于验证的评估指标,谐波平均值,是看到的和看不到的类别的分类准确性的谐波平均值,在这个指标上可以看出,目前的方法,SC-AAE,取得了比现有方法好25-27%的数字。

此外,现有方法还报告了以下其他问题

  • CADA-VAE(Schonfeld等人,2019年)在对情绪进行分类时,无法创建未见类的关键特征
  • 在f-CLSWGAN(Xian等人,2018)中,GANs是以图像分类为条件的,但模式崩溃很明显
  • 为动作识别任务建立的CVAE-ZSL(Mishra等人,2018年)不能为情感识别产生稳健的特征

上述问题在SC-AAE中没有出现,并且通过与现有研究的比较验证,证实了该方法的有效性。

总结

情况如何?在这篇文章中,我们介绍了一个使用手势作为输入的情感识别的新模型。一个新的零点框架,SC-AAE。SC-AAE,这是一个新的零散的框架。

尽管这种方法的有效性在与现有研究的比较验证中得到了确认,但以下问题仍有待于解决

  • 模型中使用的word2vec是一个通用的语言嵌入模型,并不是专门针对情感识别的,因此不能捕捉到心理和情感多样性的所有方面
  • 需要纳入更多的情感模式,如语音和眼动,以实现更强大的分类。

是否会出现一种能够解决这些问题并进一步提高分类准确性的方法,还有待观察。本文所介绍的模型的结构细节可以在本文中找到,有兴趣的朋友可以参考一下。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/873707.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

C语言 | Leetcode C语言题解之第391题完美矩形

题目: 题解: /* 参照官方答案题解: 1.小矩形面积之和等于大矩形区域面积 2.矩形区域内部顶点出现次数只能是2次或4次(边界四个顶点只能出现一次) */ typedef struct {int x;int y; } Coordinate;typedef struct {Coor…

JavaWeb(后端)

Spring-MVC Spring MVC(Model-View-Controller)是Spring框架中的一个模块,用于构建基于MVC设计模式的Web应用程序。Spring MVC将应用程序分为三个主要部分: Model:负责处理数据和业务逻辑。View:负责展示…

Rancher 与 Kubernetes(K8s)的关系

1. 简介 1.1 Kubernetes 作为容器编排平台 Kubernetes 是一个开源平台,用于自动化部署、扩展和管理容器化的应用。它提供了容器调度、自动伸缩、健康检查、滚动更新等功能。 例子:假设您有一个微服务架构的应用程序,需要运行在多个节…

单例的饿汉式,懒汉式的线程安全问题

1 单例的饿汉式 对象在类加载的时候就创建了,线程安全,速度块,但是浪费空间, public class Hungry {//唯一对象private static final Hungry HUNGRY new Hungry();byte byte1[]new byte[1024];byte byte2[]new byte[1024];byte…

openSSL 如何降版本

文章目录 前言openSSL 如何降版本1. 卸载2. 安装新的openssl版本3. 验证 前言 如果您觉得有用的话,记得给博主点个赞,评论,收藏一键三连啊,写作不易啊^ _ ^。   而且听说点赞的人每天的运气都不会太差,实在白嫖的话&…

DDS-数据分发服务

目录 1.ROS2架构 2.DDS概念 参考资料 1.ROS2架构 在ROS 2(Robot Operating System 2)中,系统通常由以下几个核心部分组成,它们共同构成了ROS 2的架构和功能: Plumbing(管道): 这个术语在ROS …

Oracle OCP认证值得考吗? 需要门槛吗?

随着数据量的爆炸性增长和企业对数据依赖性的提升,对数据库专业人士的需求也在不断上升。OCP认证,作为Oracle公司提供的权威认证之一,长期以来被视为数据库专业人士技能和知识水平的重要标志。 但随着技术的发展和认证种类的增多,…

快速解决git am冲突

前言 当希望通过git am xxxx.patch,添加一些代码修改,如果代码版本相差较大,就可能产生冲突。 这种必须要我们手动修改冲突内容。 解决过程 1. git am 尝试打入patch补丁 git am 0004-patch.patch2. git apply --reject生成冲突文件 执行…

uniapp设置微信小程序的交互反馈

链接:uni.showToast(OBJECT) | uni-app官网 (dcloud.net.cn) 设置操作成功的弹窗: title是我们弹窗提示的文字 showToast是我们在加载的时候进入就会弹出的提示。 2.设置失败的提示窗口和标签 icon:error是设置我们失败的logo 设置的文字上…

keil安装及运行第一个stm32程序

前言 记录如何安装keil软件及运行第一个stm32程序 目录 一、keil开发环境搭建 0.keil是什么 1.keil下载 2.keil软件安装 3.安装芯片支持包 4.破解激活 二、keil工程结构 1.创建目录结构 2.新建工程 3.配置项目 (1).例程准备 (2).工程目录管理 (3).选项配置 4.例…

渗透测试学习资源

burp学院 https://portswigger.net/burp/documentation/desktop/getting-started https://portswigger.net/web-security/ hacker101学院 https://www.hacker101.com/ https://github.com/bugcrowd/bugcrowd_university 如何白嫖自学网络安全技术,最稳最推荐的网…

CGAL 概念模型及Traits 概述

CGAL 概念模型及Traits 本节释了概念Concepts 、模型Models以及Traits类的含义。 CGAL Concepts and Models 概念Concepts是对类型的一组要求,即它具有特定的嵌套类型、特定的成员函数或具有特定的以该类型为参数的自由函数。概念的模型 Models是一个满足概念需求…

购买磨轮平衡机时应该注意什么问题和技巧

在购买磨轮平衡机时,您应该注意以下几个关键点: 平衡精度 平衡精度是衡量平衡机性能的核心指标,直接影响到不平衡量的检测与校准的准确性,从而决定磨轮的振动和噪声水平。高精度的平衡机能显著减少振动和噪声,提高磨…

IEEE投稿模板翻译

>将这一行替换为您的稿件id号(双击此处编辑)< IEEE 期刊和会议论文的撰写准备&#xff08;2022&#xff09; 第一作者 A. 作者&#xff0c;IEEE成员&#xff0c;第二作者 B. 作者&#xff0c;第三作者 C. 作者 Jr.&#xff0c;IEEE成员 摘要—本文档为IEEE会刊、期刊和…

推荐一个Python流式JSON处理模块:streaming-json-py

每天&#xff0c;我们的设备、应用程序和服务都在生成大量的数据流&#xff0c;这些数据往往大多是以JSON格式存在的。 如何高效地解析和处理这些JSON数据流是一大挑战。今天&#xff0c;我要为大家介绍一个能极大简化这一过程的利器&#xff1a;streaming-json-py streaming…

负载均衡调度器--LVS

文章目录 集群和分布式集群分布式 LVS介绍LVS特点LVS工作原理LVS集群架构 LVS集群中的术语CIPVIPRSDIPRIP LVS集群的工作模式NAT模式DR模式DR的工作原理DR的特点:DR的网络配置1.配置负载均衡器2.配置后端服务器lo接口的作用 3.测试连接&#xff1a; DR的典型应用场景 TUN模式 L…

新电脑Win11系统想要降级为Win10怎么操作?

前言 现在的电脑大部分都是Windows 11系统&#xff0c;组装机还好一些&#xff0c;如果想要使用Windows 10&#xff0c;只需要在安装系统的时候选择Windows 10镜像即可。 但是对于新笔记本、厂商的成品机、一体机来说&#xff0c;只要是全新的电脑&#xff0c;基本上都是Wind…

评论的组件封装

主评论的人在数组第一层级&#xff0c;回复的评论都在children里面 【{ name:"张三" idGenerator: 475403892531269 info_Conmment":"今天天气晴朗&#x1f600;" children:[ { mainIdGenerator:475388950118469 name:"张三" name1&#x…

揭秘世界上那些同时横跨两大洲的国家

我们在《世界人口过亿的一级行政区分布》盘点全球是那些人口过亿的一级行政区。 现在我们介绍五个横跨两州的国家&#xff0c;并整理七大洲和这些国家的KML矢量数据分析分享给大家&#xff0c;如果你需要这些数据&#xff0c;请在文末查看领取方式。 世界上横跨两大洲的国家 …

2024全开源彩虹晴天多功能系统源码/知识付费系统/虚拟商城系统 完美可用带教程

源码简介&#xff1a; 2024最新彩虹晴天多功能系统源码&#xff0c;知识付费虚拟商城&#xff0c;完美可用&#xff0c;无需授权、国内外服务器皆可搭建、无论是不是备案域名也都可以部署、可以商业运营。 这个源码实用&#xff0c;它不仅完美可用&#xff0c;而且完全免F&am…