情感识别——情感计算的模型和数据集调查

概述

情感计算指的是识别人类情感、情绪和感觉的工作,已经成为语言学、社会学、心理学、计算机科学和生理学等领域大量研究的主题。

本文将概述情感计算的重要性,涵盖思想、概念和方法。

情感计算是皮卡德于 1997 年提出的一个想法,此后出现了许多应用。在许多社交媒体平台上,情感计算被认为有助于理解人们的想法。许多研究人员还认为情感计算系统对于发展以人为本的人工智能和人类智能非常重要

目前已研究出三种主要的人类情绪识别方法

情感识别主要有三种类型:视觉情感识别(VER)、听觉/语音情感识别(AER/SEER)和生理情感识别(PER)。在机器学习方面,这些都是大量研究的主题。除此之外,混合现实(XR)技术(如 VR)被认为能够改善人们的主观情感体验,并已开展了多项相关研究。

论文地址:https://arxiv.org/abs/2305.07665

情绪识别研究

本节将介绍情感识别研究的各种实例,包括机器学习和深度学习

基于文本的情感识别

有一些基于文本的情感识别方法,其中许多采用了基于统计或知识的方法。例如,人们已经开发出一些方法,可对在线社交媒体和电子商务系统中用户生成的大量文本数据进行情感分类。

随着深度学习技术的出现,从文本数据中自动提取特征并端到端地训练分类器现已成为可能。下表总结了利用深度学习和机器学习进行基于文本的情感识别的研究

语音情感识别

此外,还有识别语句等数据和识别情绪的方法。这也主要是基于机器学习和深度学习的方法,如支持向量机和神经网络等技术。下表列出了基于语音的情感识别研究。至于神经网络的类型,有使用 CNN 和 RNN 的例子。

基于视觉信息的情绪识别

此外,还有利用图像和视频从面部表情图像识别情绪的方法。下表对此进行了总结。我们可以看到,所使用的基本技术包括 CNN、注意力和自动编码器。此外,我们还可以看到有多种可用的数据集。

数据集

本节将介绍用于基于文本、听觉和视觉的情感识别的数据集。

文本数据集

多域情感数据库(MDS)包含来自亚马逊评论的 100,000 多个短语,分为正面和负面。IMDB 是一个广泛使用的数据集,包含 25 000 条电影评论,每条评论都用于训练和测试

基于听觉信息的数据集

语句和语音数据库分为两类:一类使用刻意说出的语音,另一类使用从自然语句中提取的语音。前者包括柏林情绪语音数据库(Emo-DB)。但问题是,故意说出的语句往往比自然语句更夸张,因此提出了后一种数据库来解决这一问题

基于视觉信息的数据集

在实验室收集的面部表情情绪识别数据集中,有一些古老的例子。例如,JAFFE 收集了七种不同面部表情的图像数据。最近,数据集的规模越来越大,例如数据集 FER2013,其中包含通过图像检索自动收集的约 35 000 张人脸图像。该数据集包含约 35 000 张通过图像检索自动收集的人脸图像,其中的表情都是人工标注的。下图展示了各种数据集的示例

情感识别技术面临的挑战

以前基于机器学习的情感识别模型存在难以跨领域共享的问题,因为特征表征是针对特定任务和特定领域创建的,但随着最近基于深度学习的情感识别模型的出现,这些问题正在被克服。

一般认为,基于 CNN 的方法在处理静态图像时有效,而基于 RNN 的方法在处理时间序列数据时有效,在处理面部表情图像和生理数据时是一种有效的深度学习技术。此外,还使用了其他深度学习技术,如对抗学习、注意力方法和自动编码器。这些深度学习技术可以自动学习许多特征,但面临的挑战是,与机器学习方法相比,它们在从生理数据中识别情绪方面并没有显示出明显的改进

最后,对情感计算研究中尚未解决的问题总结如下

  • 建立技术,更准确、更有把握地识别情绪。
  • 建立大型、多样化的标签数据集。
  • 制定用于标签的统一情感分类标准。
  • 建立稳健且可解释的机器学习模型
  • 建立个性化情感识别模型

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/568070.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

一个 cuda shared library 的通用Makefile

0. 文件结构 device 模版函数放在 library/dev/include/*.cuh 模版的实例化和调用封装在 library/dev/*.cu 针对主机代码调用dev 函数而提供的头文件放在 library/dev/*.h, 也就是*.cu中主机函数的声明; 业务逻辑放置在 lib/src/*.cpp中,调用library/…

OpenWRT磁盘扩容(PVE虚拟机方案)

官方扩容指导文档 PVE给虚拟机磁盘扩容 给虚拟机磁盘扩容,选中OpenWRT的硬盘,随后选择调整大小 输入增量大小,即增加多少磁盘空间给硬盘。这里我选择增加4G 进入OpenWRT控制台界面安装一些linux常用查看磁盘的工具(也可以通过网…

Tensorflow2.0笔记 - BatchNormalization

本笔记记录BN层相关的代码。关于BatchNormalization,可以自行百度,或参考这里: 一文读懂Batch Normalization - 知乎神经网络基础系列: 《深度学习中常见激活函数的原理和特点》《过拟合: dropout原理和在模型中的多种应用》深度…

Web前端 JavaScript笔记7

js的执行机制 js是单线程 同步:前面一个任务执行结束之后,执行后一个 异步:异步任务,引擎放在一边,不进入主线程,而进入任务队列的任务 js通过浏览器解析,浏览器靠引擎解析 回调函数同步任务执行…

17.Nacos与Eureka区别

Nacos会将服务的提供者分为临时实例和非临时实例。默认为临时实例。 临时实例跟eureka一样,会向注册中心报告心跳监测自己是否还活着。如果不正常了nacos会剔除临时实例。(捡来的孩子) 非临时实例,nacos会主动询问服务提供者是否…

【YOLOv8改进[注意力]】YOLOv8添加DAT(Vision Transformer with Deformable Attention)助力涨点

目录 一 DAT 二 YOLOv8添加DAT助力涨点 1 总体修改 2 配置文件 3 训练 其他 一 DAT 官方论文地址:https://openaccess.thecvf.com/content/CVPR2022/papers/Xia_Vision_Transformer_With_Deformable_Attention_CVPR_2022_paper.pdf Transformers最近在各种视…

BBS前后端混合项目--01

总路由 # urls.py """BBS1 URL ConfigurationThe urlpatterns list routes URLs to views. For more information please see:https://docs.djangoproject.com/en/3.2/topics/http/urls/ Examples: Function views1. Add an import: from my_app import views2…

上网行为管理软件有哪些?三款常用上网行为管理软件评测

互联网的普及,企业和个人对于网络安全和信息保护的需求越来越高。为了确保网络环境的安全和稳定,上网行为管理软件应运而生。本文将对三款常用的上网行为管理软件进行评测,分别是域智盾、Splunk Enterprise Security和安企神。 1、域智盾 域…

什么是正向代理和反向代理

正向代理和反向代理是两种不同的代理服务器配置方式,它们在代理的方向和作用上有所不同。 一、正向代理(Forward Proxy) 代表客户端发送请求到其他服务器的代理服务器。客户端将请求发送给正向代理服务器,然后由正向代理服务器代…

Facebook的区块链应用深度分析

去中心化身份验证的意义 在当今数字化社会中,身份验证的重要性不言而喻。对于Facebook这样的大型社交媒体平台来说,确保用户的身份真实性和数据的安全性是至关重要的。传统的中心化身份验证方式存在一定的安全风险和可信性问题,而去中心化身…

Midjourney是什么?Midjourney怎么用?怎么注册Midjourney账号?国内怎么使用Midjourney?多人合租Midjourney拼车

Midjourney是什么 OpenAI发布的ChatGPT4引领了聊天机器人的竞争浪潮,随后谷歌推出了自己的AI聊天机器人Bard,紧接着微软推出了Bing Chat,百度也推出了文心一言,这些聊天机器人的推出,标志着对话式AI技术已经达到了一个…

windows系统下python解释器安装

一. 简介 本文简单学习一下python开发学习中,所使用到的 python解释器的下载安装。后面再学习下载安装python的 IDE开发工具,这里要安装的python的 IDE开发工具为 PyCharm。 二. Windows系统下python解释器与IDE开发工具下载安装 1. python解释器下载…

大型集团企业 怎么实现多区域文件交换?

很多大型集团企业,都会在全国各地,甚至海外,都设立分支机构,还有银行、邮政这类机构,都会在全国各地设立多个支行和网点,所以在日常经营过程中,都会存在多区域文件交换的场景。 大型集团企业在进…

嵌入式Linux八股(三)——计算机基础

三、计算机基础 01.操作系统 01.进程几种状态 02.锁 互斥锁:互斥锁是一种用于线程同步的工具,能够保证同一时刻只有一个线程可以访问共享资源。如果一个线程已经取得了互斥锁,其他尝试获得该锁的线程将会被阻塞,直到第一个线程…

Spring与SpringBoot在配置读取方式上的区别

1. 问题说明 将Springboot项目中自定义的一个扩展工具类移植到Spring框架项目中的时候发现一个问题。在springboot中application.yml中的配置内容可以从Environment中获取,但是在spring中context:placeholder对应的配置文件中的配置却无法从Environment中获取。为了…

Power BI 如何创建页面导航器?(添加目录按钮/切换页面按钮)

Power BI 中页导航是什么? 在Power BI中,页导航(Page Navigation)是指在报告中创建多个页面(页),然后允许用户在这些页面之间进行导航的功能。 如下图所示,页导航的选项和报告中的…

每日两题 / 438. 找到字符串中所有字母异位词 238. 除自身以外数组的乘积(LeetCode热题100)

438. 找到字符串中所有字母异位词 - 力扣&#xff08;LeetCode&#xff09; 记录p串每个字符出现次数 维护与p串等长的滑动窗口&#xff0c;记录其中每个字符的出现次数 每次滑动后将当前次数与p串的次数比较即可 class Solution { public:vector<int> findAnagrams(s…

软件项目经理需要具备这 11 个能力

当前软件开发技术更新换代越来越快&#xff0c;各种项目实施管理思想也日新月异&#xff0c;作为一个软件项目经理&#xff0c;需要具备这 11 种能力&#xff1a; 1. 项目管理能力 了解项目管理的基本原则和方法&#xff0c;包括制定项目计划、资源分配、风险管理、问题解决和…

JAVA:Kettle 强大的开源ETL工具

请关注微信公众号&#xff1a;拾荒的小海螺 1、简述 Kettle&#xff08;Pentaho Data Integration&#xff09;&#xff1a;强大的开源ETL工具Kettle&#xff0c;又称作Pentaho Data Integration&#xff0c;是一款流行的开源ETL&#xff08;Extract, Transform, Load&#x…

【Unity实战】值得关注的Addressable新特性

如果您是最近起的Unity项目且有用到Addressable作为内容管理&#xff0c;你可能需要注意一下1.21.15版本的变化&#xff1a; [1.21.15] - 2023-08-03 Fixed an issue where using binary catalogs causes a crash on Android with ARM7.DownloadDepedenciesAsync no longer l…