Personality Enhanced Emotion Generation Modeling for Dialogue Systems

在这里插入图片描述

对话系统的人格增强情绪生成建模

  • 摘要
  • 1 介绍
  • 2 相关工作
    • 2.1 个性、情感和情绪
    • 2.2 个性的理论模型
    • 2.3 在对话系统中整合个性情感建模
  • 3 方法
    • 3.1 任务定义
    • 3.2 个性增强型情感生成模型
    • 3.3 情感状态推理单元
      • 3.3.1 情绪遗忘机制
      • 3.3.2 情感调节机制
    • 3.4 训练
  • 4 实验
    • 4.1 数据集 PELD

摘要

情感在人际交往中起着至关重要的作用,因为它为对话增添了深度和丰富性。近年来,越来越多的人对开发具有生成情感能力的对话系统表现出浓厚兴趣。然而,为了创造更具吸引力和真实性的互动体验,有必要考虑个性对情感生成的影响。本文提出了一种创新方法,将个性建模与对话系统的情感生成相结合。通过将个性特征纳入情感生成过程中,我们旨在创造更加个性化和与上下文相符的情感响应。基于大五人格模型和情感计算技术,我们的模型考虑了个性的个体差异,以生成与每个用户独特特征相一致的情感。实验证明,在对话系统中将情感建模与个性相结合有助于提高情感生成模型的性能。此外,经验证我们的方法在多个指标上优于其他基准模型。

1 介绍

情感产生是情感对话系统中的一个重要研究问题,其目标是使模型能够产生自然、现实的、情感丰富的情感表达。然而,在情感产生的过程中,仅仅关注情感本身可能并不能充分捕捉到人类情感的多样性和复杂性。因此,越来越多的研究开始将个性因素纳入情绪生成模型,以更充分地模拟和表达人类的情感体验。

研究表明,个性在个体的情感体验[1–3]中起着重要的作用。不同的个性特征可以影响个体的感觉、表达和调节情绪的方式;Zhang等人[4]探讨了这种关系。例如,一个外向而开朗的人可能更有可能表达积极的情绪,而一个内向而紧张的人可能更倾向于经历负面情绪。因此,将个性因素纳入情绪生成模型,可以更准确地建模和预测个体的情绪反应,提供更个性化、更具适应性的情绪生成[5]。

先前的研究探索了各种将个性和情感整合到生成模型中的各种方法。Zhang等人[6]探讨了如何在会话系统中添加个性化和情感丰富的特征,并采用了一种基于无监督学习的方法,该方法将用户提供的个人信息和对话历史与个性特征联系起来,以实现更个性化和情感丰富的会话互动。Wen等人[7]提出将VAD情绪空间中的五大人格特征结合在文本情绪预测中,以提高未来情绪的准确性。Chen等人[8]并构建了一个中文人格情绪注释数据集,用于人工智能对话系统。然而,目前结合人格的研究倾向于集中在情绪准确性预测上,而忽视了情绪拟人化的人格生成,这可能会降低对话系统中人机情感交互的体验。

这篇论文旨在为对话系统提供拟人化的情感生成,从而创造出自然而和谐的人机交互。为了解决这个问题,我们必须考虑如何从有限的对话历史信息中生成未来时刻的拟人化情感。因此,受到真实人类情感过程和心理学研究的启发,我们从时间跨度的角度概括了影响情感生成的三个主要因素。这些因素分别是长期因素(个性personality)、中期因素(情感sentiment)和短期因素(情绪emotion),以增强拟人化情感的生成。因此,我们提出了一种基于深度神经网络的情感生成方法,称为增强个性化情感生成模型(PEEGM)。PEEGM首先为对话代理分配个性特征,然后使用情感感知来分析输入语料库,获得的情感被发送到情感推理单元以实现情感生成。我们在PELD数据集上进行了实验,验证了我们提出的方法的有效性。同时,与基线模型相比,我们的模型在匹配度和适当性方面具有优势。总的来说,我们的贡献如下:

  • 定义了一个新的任务:对话系统的情绪生成任务。
  • 从时间的角度总结了对话系统情绪状态建模的三个主要因素:人格、情感和情绪。
  • 提出了一种用于情绪生成任务的人格增强情绪生成模型。
  • 实验表明,PEEGM能够在对话中适当、合理地实现情绪状态的产生。

2 相关工作

在本节中,我们将回顾与人格、情感和情绪建模相关的工作。接下来,我们回顾了重要的人格理论模型。最后,我们回顾了在对话中整合个性特征的情绪建模。

2.1 个性、情感和情绪

个性、情感和情绪是人类心理学中相互关联但又不同的方面。Funder [9] 指出,个性指的是在不同情境和时间跨度内保持稳定的思想、情感和行为的一致模式。这些稳定的思想、情感和行为模式在各种情境和情况下持续存在,为理解个体心理构成提供了独特而一致的框架。情感是指个体对客观事物或事件满意程度的态度 [10, 11]。它通常表现为对某些情感的倾向,如积极或消极情感。情感是主观的,并强调个体在一段时间内的个人经历。它以相对稳定和反馈为特征,意味着一个人的情感可以影响并受到外部因素和互动的影响。然而,情绪是对特定事件或刺激的复杂心理和生理反应 [12]。情绪通常是强烈但相对短暂的体验,可以迅速在对外部或内部触发因素的响应中波动。该领域中最流行的模型之一是由Ekman等人提出的六种基本情感模型 [13]。

2.2 个性的理论模型

在对话中,我们讨论了几种个性模型及其在情感生成中的应用。大五人格模型(FFM)[14]是一个广泛使用的个性模型,包括五个维度:外向性、宜人性、尽责性、情绪稳定性和开放性。这些个性特征与情感状态有关,可以在情感生成的计算方法中使用。大五人格模型的个性特征和描述如表1所示。
在这里插入图片描述

MBTI是一种基于心理类型理论的个性模型,将个性划分为16种类型。Myers和McCaulley [15]开发了最初的MBTI。对MBTI的缺点之一是它的可靠性较低,这可能解释了许多研究结果的差异问题 [9]。在情感生成中,它仍然具有价值,但需要进行更深入的研究来确定其在情感生成中的应用和有效性。

这些个性模型为情感生成提供了重要的理论基础和计算方法,可以通过整合个性特征和情感状态进行个性化。然而,由于大五人格的个性评估更全面,并用数字值量化,更符合计算机的处理范式,因此该模型在自然语言处理、个性/情感计算等研究中得到了广泛应用。

2.3 在对话系统中整合个性情感建模

情感建模结合个性化的对话系统旨在使系统能够以更个性化、更丰富情感的方式与用户交互。Egges等人[2]提出了一个通用模型,用于描述和更新与情感行为相关的参数,并探讨了如何将现有的评估理论整合到框架中。Egges等人[3]提出了一个基于个性和情感状态的模型,用于改变机器人发音时的头部行为,并根据不同的个性特征确定头部响应的强度。探索了情感个性对机器行为的影响机制。Ball等人[16]通过统计分析和拟合获得了个性与PAD情感空间中情感之间的转化关系。因此,Breese等人[17]考虑了在构建的情感模型中个性对情感的校正。Johns等人[18]还利用预定义的个性与交互机器人影响情感状态的转移。Zhu等人[19]提出了一个对比学习和基于生成的模型,用于零样本个性属性提取,以促进在个性下的人机交互研究。Wen等人[7]构建了一个具有个性和情感注释的数据集,并设计了一个情感预测模型,通过对话来预测未来时刻的情感。

通过结合人格的情感建模,对话系统可以更好地理解用户的情绪状态,并能够以更个性化和情感丰富的方式进行反应和互动。然而,在进行情感建模方面仍存在一些挑战,如数据稀缺、情感模糊性和情感传递等。在本文中,我们关注如何使用有限的对话数据结合个性来实现合理的情绪产生。

3 方法

在一个对话系统中,结合适当的情感表达可以极大地提高用户体验和参与度。在情绪的持续时间方面,人类的情绪过程受到长期、中期、短期等因素的影响。受心理学的启发,本文将这三个因素分类为人格、情感和情绪。

  • 相关研究表明[16, 21],个性和情感表达之间存在着强烈的相关性,不同个性在处理事情时的情感表达存在差异,而这种差异是长期稳定的。因此,我们将个性视为一种长期因素。
  • 情感是认知态度的一部分,其情感倾向(积极、消极或中性)将在很大程度上影响未来时刻的情感状态。但这种情感影响相对较为不稳定。因此,在对话中我们将情感视为一种中期因素。
  • 情绪是短暂的,对话中每个时刻都会有不同的情绪状态,而且这些状态之间存在时间关系,即未来时刻的情感受到先前时刻情感状态的影响。因此,我们将情绪视为一种短期因素。因此,本文的方法设计围绕着这三个要点展开。

3.1 任务定义

一个对话过程涉及到多个交互者。然而,在本文中,我们关注于涉及两个交互者的对话,而不考虑包含多个交互者的场景。

对话系统中情绪生成任务的目标是有效地模拟对话主体的情绪状态,从而提高其情绪能力。给定对话历史D = {U1,R1,U2,R2,…,UT }直到上次T和特定的个性特征PS,我们的目标是在下一次生成PS的情绪状态 e T R e^R_T eTR。我们用数学方法将这个任务表述为等式 1.

在这里插入图片描述
情绪状态 e T R e^R_T eTR∈{惊喜,快乐,无,恐惧,悲伤,愤怒},其中 i 表示下标索引,T 表示对话回合的总数。

与之前的研究相比,本文具体阐述了两个方面: (1)对对话主体本身的情绪状态进行建模,(2)在考虑个性特征影响的情况下产生情绪。因此,主要的挑战在于有效地利用对话中有限的情感信息来产生既合理又适当的情绪状态,与特定的个性保持一致。

3.2 个性增强型情感生成模型

关于人类情绪过程,个体在特定时间的情绪状态受到三个关键因素的影响: (1)长期和稳定的个性特征,(2)中期和不稳定的情感,(3)短期和快速变化的情绪状态。考虑到这些因素,我们开发了人格增强情绪生成模型(PEEGM),它将它们整合到一个LSTM框架中。模型架构如图1所示。

在这里插入图片描述

PEEGM模型的工作流程如下:在 T 时刻,对话代理的情感状态 e T R e^R_T eTR基于用户当前的外部输入和先前的内部输入T−1进行计算。对于时刻 i 的用户状态输入,对话文本 Ui 使用Transformer编码器进行编码,然后进行情感感知以识别用户的情感状态。随后,情感状态推理单元(ESIU)处理用户的情感状态。类似于用户状态输入处理,对话代理的输入包括特定的个性特征 PS 和对话文本的内容 Ri。其中, x T − 1 , 1 R x^R_{T-1,1} xT1,1R表示T−1时刻响应的第一个词,其余术语遵循类似的约定。

3.3 情感状态推理单元

对话交互的过程可以看作是一个时间序列。在从文本情感预测和共情响应生成中获取灵感的基础上,我们开发了一个基于LSTM时间序列模型的情感状态推理单元。主要目标是利用有限的对话信息和个性特征来预测和生成未来的情感状态。

为了增强LSTM模型的性能,我们在情感状态推理单元(ESIU)的输入门方面进行了重大改进。这些改进针对影响情感状态的长期、中期和短期因素的输入。此外,我们引入了一种情感遗忘机制,以促进对先前时刻状态的保留程度的处理。此外,我们设计了一种情感调节机制,以控制个性和情感对当前情感状态的影响。最后,在输出门上实现了一种情感反馈机制,以实现更精确的情感生成推理。该单元的结构如图2所示。

在这里插入图片描述
hT−1表示单元之前的隐藏状态,反映了主体的短期情绪信息。sT−1表示细胞最后一次的情绪状态,捕捉主体的中期情绪信息。cT−1表示细胞的单元状态,代表长期的个性信息。 e T U e_T^U eTU对应于用户在 t 时刻的情绪状态。PS代表代理的个性特征。 e T R e^R_T eTR表示代理在 T 时刻的情绪状态,它是根据单位传递的前一个时刻的状态和当前时刻的输入计算出来的。

改进后的输入门计算为2:
在这里插入图片描述
输出门计算为3:
在这里插入图片描述

3.3.1 情绪遗忘机制

情感状态的生成受到个性和上一时刻的情感状态的影响。因此,评估这两个信息源对当前情感状态的传递效果至关重要。然而,LSTM的原生遗忘门在同时有效处理cT−1和sT−1方面存在一些不足。为了解决这个限制,我们设计了一个遗忘机制(FM),取代了LSTM中的遗忘门。这一创新机制使我们能够对中长期情感记忆进行合理控制,确保更全面地整合cT−1和sT−1的信息。

遗忘机制结构如图3所示,由方程式4–7计算得到:

在这里插入图片描述
在这里插入图片描述

3.3.2 情感调节机制

个性和情感之间的相互作用影响了情感状态的生成。控制这些因素对情感状态生成的影响程度是一项挑战。为了解决这个问题,我们设计了一个情感调控门(RM),它控制中长期情感记忆对当前情感更新的影响。

情感调控门的结构如图4所示
在这里插入图片描述
其计算公式见公式8至9:
在这里插入图片描述

综上所述,使用公式可以计算出在时间 T 时刻生成的对话代理的情绪状态 e T R e^R_T eTR和参数更新。第10至16公式,具体内容如下:

在这里插入图片描述

在这里插入图片描述

3.4 训练

在PEEGM的训练过程中,输入了对话历史、对话代理的个性特征、情感序列以及多轮对话的情绪序列,模型输出生成的情感状态。ESIU的目标函数如公式17所示,模型还通过最小化交叉熵损失函数(见公式18-19)来优化模型生成的准确性。

在这里插入图片描述
在上式中, y i c y_{ic} yic表示一个指标变量。如果反应句 i 中产生的情绪状态与真实的情绪状态相匹配,则取值为1,否则取值为0。变量 p i c p_{ic} pic表示与回应句子 i 相关的情绪状态 c 的决策概率。其中,c作为情绪状态的指标,ei表示回应句子i的真实情绪状态指标。

4 实验

4.1 数据集 PELD

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/420696.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

C语言基础(三)——指针

五、指针 5.1 指针的定义 内存区域中的每字节都对应一个编号,这个编号就是“地址”. 在程序中定义一个变量,在对程序进行编译时,系统就会给这个变量分配内存单元. 按变量地址存取变量值的方式称为“直接访问”,如printf("&…

C++ 入门(八)— 常量和字符串

常量和字符串 常量变量常量表达式编译时优化 Constexpr 变量std::string字符串输出 std::coutstd::string可以处理不同长度的字符串字符串输入 std::cin用于输入文本std::getline()不要按值传递Constexpr 字符串 std::string_view可以使用许多不同类型的字符串进行初始化可以接…

基于springboot+html实现的衣物捐赠平台

一、系统架构 前端:html | layui | jquery | css 后端:springboot | thymeleaf | mybatis 环境:jdk1.8 | mysql | maven 二、代码及数据库 三、功能介绍 01. 登录页 02. 注册 03. web页-首页 04. web页-捐赠衣服 05. web页-论坛交流…

Doris实战——金融壹账通指标中台的应用实践

目录 前言 一、业务痛点 二、早期架构挑战 三、架构升级 四、一体化指标数据平台 4.1 构建指标体系 4.2 构建指标平台功能 五、Doris指标应用实践 六、未来规划 原文大佬的这篇指标中台的应用实践有借鉴意义,这里摘抄下来用作学习和知识沉淀。 前言 在搭建…

开源项目_代码生成项目介绍

1 CodeGeeX 系列 1.1 CodeGeeX 项目地址:https://github.com/THUDM/CodeGeeX 7.6k Star主要由 Python 编写深度学习框架是 Mindspore代码约 2.5W 行有 Dockerfile,可在本地搭建环境模型大小为 150 亿参数相对早期的代码生成模型,开放全部代…

BAT等大厂必问技术面试题,2024Android开发面试解答之设计模式

IT行业薪水高,这是众所周知的,所以很多人大学都选择IT相关专业,即使非该专业的人,毕业了也想去一个培训机构镀镀金,进入这一行业。 但是有关这个行业35岁就退休的说法,也一直盛传。 加上这几年不断有各大…

基于java Springboot实现课程评分系统设计和实现

基于java Springboot实现课程评分系统设计和实现 博主介绍:多年java开发经验,专注Java开发、定制、远程、文档编写指导等,csdn特邀作者、专注于Java技术领域 作者主页 央顺技术团队 Java毕设项目精品实战案例《1000套》 欢迎点赞 收藏 ⭐留言 文末获取源…

【白嫖8k买的机构vip教程】Appium自动化(3):Appium-Desktop界面介绍

Appium-Desktop主界面包含三个菜单Simple、Advanced、Presets Simple界面: Host设置Appium server的ip地址,本地调试可以将ip地址修改为127.0.0.1;Port设置端口号,默认是4723不用修改Start Server 启动 Appium serverEdit Confi…

网络安全课程VIP介绍(比同行便宜)

免责声明 本文发布的工具和脚本,仅用作测试和学习研究,禁止用于商业用途,不能保证其合法性,准确性,完整性和有效性,请根据情况自行判断。如果任何单位或个人认为该项目的脚本可能涉嫌侵犯其权利&#xff0c…

(学习日记)2024.03.01:UCOSIII第三节

写在前面: 由于时间的不足与学习的碎片化,写博客变得有些奢侈。 但是对于记录学习(忘了以后能快速复习)的渴望一天天变得强烈。 既然如此 不如以天为单位,以时间为顺序,仅仅将博客当做一个知识学习的目录&a…

Java毕业设计-基于springboot开发的私人健身与教练预约系统-毕业论文+答辩PPT(有源代码)

文章目录 前言一、毕设成果演示(源代码在文末)二、毕设摘要展示1.开发说明2.需求分析3、系统功能结构 三、系统实现展示1、系统功能模块2、后台功能模块2.1管理员功能2.2用户功能2.3教练功能 四、毕设内容和源代码获取总结 [Java毕业设计-基于springboot…

零拷贝技术深入分析

一、零拷贝 在前面的文章“深浅拷贝、COW及零拷贝”中对零拷贝进行过分析,但没有举例子,也没有深入进行展开分析。本文将结合实际的例程对零拷贝进行更深入的分析和说明。 在传统的IO操作中,以文件通过网络传输为例 ,一般会经历以…

【前端素材】推荐优质在线花卉商城电商网页Flowery平台模板(附源码)

一、需求分析 1、系统定义 在线花卉商城是一个通过互联网提供花卉销售服务的电子商务平台,用户可以在该平台上浏览、选择和购买各种花卉产品。 2、功能需求 在线花卉商城是一个通过互联网提供花卉销售服务的电子商务平台,用户可以在该平台上浏览、选…

内存取证 Volatility

文章目录 安装工具volatility和插件mimikatz[陇剑杯 2021]内存分析 内存分析工具 volatility,有Volatility2和Volatility3两种,分别基于Python2和Python3环境运行。说是一般Volatility2比Volatility3好用,所以我也选择的Volatility2版本。 一…

kubectl 陈述式资源管理方法

目录 陈述式资源管理方法 项目的生命周期 1.创建kubectl create命令 2.发布kubectl expose命令 service的4的基本类型 查看pod网络状态详细信息和 Service暴露的端口 查看关联后端的节点 ​编辑 查看 service 的描述信息 ​编辑在 node01 节点上操作,查看…

LeetCode 2120.执行所有后缀指令

现有一个 n x n 大小的网格,左上角单元格坐标 (0, 0) ,右下角单元格坐标 (n - 1, n - 1) 。给你整数 n 和一个整数数组 startPos ,其中 startPos [startrow, startcol] 表示机器人最开始在坐标为 (startrow, startcol) 的单元格上。 另给你…

前端的文字的字体应该如何设置

要设置文字的字体,在CSS中使用font-family属性。这个属性可以接受一个或多个字体名称作为其值,浏览器会按照列表中的顺序尝试使用这些字体渲染文本。如果第一个字体不可用,浏览器会尝试使用列表中的下一个字体,依此类推。 字体设…

SpringCloud gateway限流无效,redis版本低的问题

在使用springCloud gateway的限流功能的时候,配置RedisRateLimiter限流无效,后来发现是Redis版本过低导致的问题,实测 Redis版本为3.0.504时限流无效,改用7.0.x版本的Redis后限流生效。查了资料发现很多人都遇见过这个问题&#x…

让面试官眼前一黑,手把手带你打造个性化的 GitHub 首页

前期回顾 手机打开 第三方 “微信、快手、QQ、电话、信息” 等-CSDN博客https://blog.csdn.net/m0_57904695/article/details/136304084?spm1001.2014.3001.5501 🚩Github访问 Huo-zai-feng-lang-li (彩色之外) (github.com) &…

uniapp实现-审批流程效果

一、实现思路 需要要定义一个变量, 记录当前激活的步骤。通过数组的长度来循环数据,如果有就采用3元一次进行选择。 把循环里面的变量【name、status、time】, 全部替换为取出的那一项的值。然后继续下一次循环。 虚拟的数据都是请求来的, 组装为好渲染的格式。 二…