MER 2024 第二届多模态情感识别挑战赛

      多模态情感识别是人工智能领域的一个活跃研究课题。它的主要目标是整合多种模态来识别人类的情绪状态。当前的工作通常为基准数据集假设准确的情感标签,并专注于开发更有效的架构。然而,现有技术难以满足实际应用的需求。

     清华大学陶建华教授联合中国科学院自动化研究所连政,帝国理工学院Björn W. Schuller,奥卢大学赵国英,南洋理工大学Erik Cambria联合在IJCAI2024上举办多模态情感识别挑战赛MER24,并在ACM MM2024上组织多模态与可靠性情感计算研讨会MRAC24。这两项活动旨在联合情感计算领域的研究人员,深入探讨最新研究进展和未来发展方向,促进这项技术在真实场景中的落地应用。

       去年MER2023,专注于三个主题:多标签学习、噪声鲁棒性和半监督学习。今年MER2024除了扩大数据集的大小,引入了一个新的开放式词汇情绪识别赛道MER-OV。这个赛道的主要考虑是现有数据集通常固定标签空间,并使用多数投票来增强注释者的一致性,但这个过程可能限制了模型描述微妙情绪的能力。在这个赛道中,我们鼓励参与者生成任意数量的标签,在任何类别中,目标是尽可能准确地描述情绪状态

1、三个赛道

1.1 MER-SEMI(半监督学习赛道)

目标:这个赛道的目标是探索和改进半监督学习策略,以便更好地利用未标记数据来提高情绪识别的性能。

挑战:在实际应用中,获取大量带有情绪标签的数据是困难且成本高昂的。半监督学习是一种减少对标记数据依赖的方法。

方法:参与者被鼓励使用未标记数据以及有限的标记数据来训练他们的模型,并探索有效的半监督学习技术。

评估:评估主要基于模型在未标记数据集上的表现,以及其泛化能力。

样本:包含1169个已标注样本和115595个未标注样本。

1.2 MER-NOISE(噪声鲁棒性赛道)

目标:这个赛道旨在提高情绪识别系统对于噪声的鲁棒性,特别是在音频和视觉数据中常见的噪声类型。

挑战:真实世界的数据往往伴随着各种噪声,如背景噪音和图像模糊,这些噪声可能会影响情绪识别的准确性。

方法:参与者需要开发能够抵御或减少噪声影响的模型,可能涉及数据增强、降噪技术或其他创新方法。

评估:评估将基于模型在含有噪声的数据集上的表现,特别是音频加性噪声和图像模糊噪声。

样本:包含1170个已标注样本和115595个未标注样本。

1.3 MER-OV(开放式词汇情绪识别赛道)

目标:这个赛道的目的是推动情绪识别技术的发展,使其能够识别和描述更细微、更开放的情绪状态,而不仅仅局限于预定义的离散情绪类别。

挑战:传统的情绪识别数据集通常限制在少数几个情绪标签上,这限制了模型识别更丰富情绪状态的能力。

方法:参与者被鼓励生成任意数量的标签,尝试以最准确的方式描述情绪状态。这可能涉及使用大型语言模型(LLMs)或其他先进的自然语言处理技术。

评估:评估将基于模型生成的标签的准确性和多样性,以及其对情绪状态的描述能力。

样本:332个开放式情感标注样本

2、挑战数据集

2.1 MER2023数据集

  • 包含4个子集:Train&Val、MER-MULTI、MER-NOISE和MER-SEMI
  • Train&Val包含大量已标注的样本
  • MER-MULTI和MER-NOISE包含噪声样本
  • MER-SEMI包含大量未标注的样本

2.2 MER2024数据集

MER2024是MER2023的扩展版本,通过以下方式进行了扩展:

  • 将MER2023中的所有已标注样本合并到Train&Val,使其样本量更大;
  • 收集更多未标注样本,构建了MER-SEMI和MER-NOISE两个子集;
  • 从Train&Val中选取332个样本进行开放式情感标注,构建了MER-OV子集;
  • MER-SEMI包含1169个已标注样本,同时包含115595个未标注样本;
  • MER-NOISE包含1170个已标注样本,同时包含115595个未标注样本;
  • MER-OV包含332个开放式情感标注样本。

要下载数据集,参与者需要填写最终用户许可协议(EULA)。它要求参与者仅将此数据集用于学术研究,不得编辑或上传到互联网。对于 MER-SEMI 和 MER-NOISE,每个团队需要提交 6 个候选标签(即担忧、快乐、中性、愤怒、惊讶和悲伤)中最有可能的离散标签。对于 MER-OV,每个团队可以提交任何类别中的任意数量的标签。同时要求参与者不能为 MER-OV 使用闭源模型(例如 GPT )

3、评估指标

针对不同的赛道,制定了相应的评估指标来衡量参与者模型的性能。以下是对各个赛道评估指标的详细介绍:

3.1 MER-SEMI 和 MER-NOISE 评估指标

对于这两个赛道,主要使用了两个广泛用于情绪识别的评估指标:

准确率(Accuracy):这是最直观的性能指标,表示模型正确预测情绪类别的比例。对于多标签情绪识别,准确率可能需要针对每个标签分别计算,然后取平均值。

加权平均 F 分数(Weighted Average F-score, WAF):考虑到情绪类别可能存在不平衡的情况,加权平均 F 分数是一种更为公平的评估指标。它结合了精度(Precision)和召回率(Recall),并根据每个类别的支持数量进行加权,以确保所有类别在评估中具有相同的重要性。

3.2 MER-OV 评估指标

对于开放式词汇情绪识别赛道,由于标签空间是开放的,传统的分类指标(如准确率和召回率)不再适用。因此,定义了以下集级别(set-level)的评估指标:

集级别准确率(Set-Level Accuracy):这个指标衡量的是预测情绪标签集合与真实标签集合之间的匹配程度。具体来说,它计算两个集合交集的大小与预测集合大小的比例。

集级别召回率(Set-Level Recall):与集级别准确率相对应,集级别召回率衡量的是预测集合与真实标签集合交集的大小与真实标签集合大小的比例。

平均值(Avg):为了最终排名,MER-OV 赛道选择集级别准确率和集级别召回率的平均值作为最终的评估指标。

计算公式为:

4、关键日期

2024.4.30

MER24数据及基线开放

2024.6.30

MER24结果提交开放

2024.7.10

MER24结果提交截止

2024.7.19

MRAC24论文提交截止

2024.8.5

MRAC24论文接收通知

5、相关网址

Baseline paper: https://arxiv.org/abs/2404.17113
Baseline code: MERTools/MER2024 at master · zeroQiaoba/MERTools · GitHub

官网:MER24@IJCAI and MRAC24@ACM MM

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/651777.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

在大厂工作还有哪些好处?

昨晚和好朋友聊天,聊到了这个在大厂工作的利弊,很多想换工作的同学或者准备校招的大学生可能会有疑虑,到底是进小公司好呢?还是进大公司好? 相比之下,大厂抗风险能力更强,内部员工的发展也更稳定…

Antd Vue项目引入TailwindCss之后出现svg icon下移,布局中的问题解决方案

目录 1. 现象: 2. 原因分析: 3. 解决方案: 写法一:扩展Preflight 写法二: 4. 禁用 Preflight 1. 现象: Antd Vue项目引入TailwindCss之后出现svg icon下移,不能对齐显示的情况&#xff0…

数据集006:中药材识别数据集(含数据集下载链接)

数据集简介: 中药材共5类 900张图片 分别是百合 枸杞 党参 槐花 金银花 部分代码: def get_data_list(target_path,train_list_path,eval_list_path):生成数据列表#存放所有类别的信息class_detail []#获取所有类别保存的文件夹名称data_list_pat…

区间预测 | Matlab实现GRU-Attention-KDE核密度估计多置信区间多变量回归区间预测

区间预测 | Matlab实现GRU-Attention-KDE核密度估计多置信区间多变量回归区间预测 目录 区间预测 | Matlab实现GRU-Attention-KDE核密度估计多置信区间多变量回归区间预测效果一览基本介绍程序设计参考资料 效果一览 基本介绍 1.Matlab实现GRU-Attention-KDE门控循环单元注意力…

基于EV54Y39A PIC-IOT WA的手指数量检测功能开发(MPLAB+ADC)

目录 项目介绍硬件介绍项目设计开发环境及工程参考总体流程图硬件基本配置光照传感器读取定时器检测逻辑 功能展示项目总结 👉 【Funpack3-2】基于EV54Y39A PIC-IOT WA的手指数量检测功能开发 👉 Github: EmbeddedCamerata/PIC-IOT_finger_recognition 项…

图解 BERT 模型

节前,我们星球组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学. 针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。 汇总合集&…

PHP:集成Xunsearch生成前端搜索骨架

如果是安装宝塔,我们在集成xunsearch的时候就会比较简单,后面我们在介绍其他的接入方式; 首先我们进入到宝塔管理后台:【软件商店】-【输入xun】-【点击xunsearch】直接安装即可 安装成功之后,会自动在www/server中创…

Qt | QTabBar 类(选项卡栏)

01、上节回顾 Qt | QStackedLayout 类(分组布局或栈布局)、QStackedWidget02、简介 1、QTabBar类直接继承自 QWidget。该类提供了一个选项卡栏,该类仅提供了一个选项卡, 并没有为每个选项卡提供相应的页面,因此要使选项卡栏实际可用,需要自行为每个选项卡设置需要显示的页…

Android刮刮卡自定义控件

效果图 刮刮卡自定义控件 import android.content.Context; import android.graphics.Bitmap; import android.graphics.Canvas; import android.graphics.Color; import android.graphics.Paint; import android.graphics.Path; import android.graphics.PorterDuff; import …

基于SpringBoot设计模式之结构型设计模式·适配器模式

文章目录 介绍开始使用委托的适配器(媒体播放器)架构图定义被适配者定义需求接口定义适配者 使用继承的适配器(手机充电接口)架构图定义被适配者定义需求接口定义适配者 测试样例 总结优点缺点 介绍 在程序世界中,经常…

4,八种GPIO模式

资料来源:【STM32基础学习】八种GPIO模式总结-云社区-华为云 (huaweicloud.com) 【STM32基础学习】八种GPIO模式总结-云社区-华为云 (huaweicloud.com) 【STM32基础学习】八种GPIO模式总结-云社区-华为云 (huaweicloud.com) 仅作个人自学笔记,如有冒犯&#xf…

版本匹配指南:PyTorch版本、Python版本和pytorch_lightning版本的对应关系

版本匹配指南:PyTorch版本、Python版本和pytorch_lightning版本的对应关系 🌈 欢迎莅临我的个人主页👈这里是我静心耕耘深度学习领域、真诚分享知识与智慧的小天地!🎇 🎓 博主简介: 我是高斯…

《征服数据结构》双向链表

摘要: 1,双链表的介绍 2,双链表的用途 3,双链表的节点插入和删除 1,双链表的介绍 前面我们讲过单链表,单链表的特点就是只能往后访问不能往前访问。单链表一般在面试中用的比较多,比如删除倒数第…

Ovid医学库文献如何在家查找下载

今天讲的数据库是一个知名医学库——Ovid Ovid隶属于威科集团的健康出版事业集团,与LWW、Adis等公司属于姊妹公司。Ovid数据库在医学外文文献数据库方面占据绝对地位,目前已有包涵人文、科技等多领域数据库300个,其中80多个是生物医学数据库…

Web组态可视化编辑器 快速绘制组态图

演示地址:by组态[web组态插件] 随着工业智能制造的发展,工业企业对设备可视化、远程运维的需求日趋强烈,传统的单机版组态软件已经不能满足越来越复杂的控制需求,那么实现Web组态可视化界面成为了主要的技术路径。 行业痛点 对于…

Ps 滤镜:消失点

Ps菜单:滤镜/消失点 Filter/Vanishing Point 快捷键:Ctrl Alt V 两条平行的铁轨或两排树木连线相交于很远很远的某一点,这点在透视图中叫做“消失点”,也称为“灭点”。 消失点 Vanishing Point滤镜主要用于在图像中处理具有透视…

NSS题目练习4

[LitCTF 2023]1zjs 打开后是一个游戏,用dirsearch扫描,什么都没发现 查看源代码搜索flag,发现没有什么用 搜索php,访问 出现一堆符号,看样子像是jother编码 解码得到flag,要删掉[] [LitCTF 2023]Http pro …

【StableDiffusion】SD1.4、1.5、2.0、2.1 和 SDXL0.9-1.0、SDXL turbo 等的区别

总览 1.基础sd base model家族:SD1.4、SD1.5、SD1.5-LCM、SD2.0、SD2.0-768、SD2.1、SD2.1-768、SD2.1-UNCLIP 2.升级sdxl base model家族:SDXL0.9、SDXL1.0、SDXL1.0-LCM、SDXL-DISTILLED、SDXL-TURBO 3.专门用于视频生成的 SVD 家族:SVD、…

备战秋招c++ 【持续更新】

T1 牛牛的快递 原题链接:牛牛的快递_牛客题霸_牛客网 (nowcoder.com) 题目类型:模拟 审题&确定思路: 1、超过1kg和不足1kg有两种不同收费方案 ---- 起步价问题 2、超出部分不足1kg的按1kg计算 ----- 向上取整 3、向上取整的实现思路…

卷出新高度,直呼太强!时隔三月,YOLO再度进化升级:《YOLOv10—实时端到端目标检测》重磅来袭

真的是不止一次感叹,学习的速度都跟不上发论文出新品的速度。。。。。 继前文YOLOv9发布以来也就不到三个月的时间,YOLOv10就来了! 《太卷了,目标检测新成员——YOLOv9: Learning What You Want to LearnUsing Programmable Gra…