文章目录
- 文章介绍
- 文章模型
- 问题定义
- 文章模型
- PARAPHRASE建模
文章地址: https://arxiv.org/abs/2110.00796
文章介绍
这篇文章在已有的方面级情感分析任务的基础了研究了一项新的任务:方面级情感四元组提取(Aspect Sentiment Quad Prediction, ASQP)任务,旨在通过端到端的方式联合提取评论文本中所包含的方面实体、意见词、方面类别以及情感极性。为此,该篇论文作者提出了一种全新的模型范式PARAPHRASE(释义)生成,并不是直接将句子生成四元组的形似而是生成一个更符合人类生活习惯的自然语言形似从而可以更好地考虑到情感元素丰富的语义标签信息。
文章模型
问题定义
对于一个输入的句子,ASQP旨在提取句子所包含的所有 {(c,a,o,p)}四元组。其中c代表方面类别(一般为数据集中预先说明或定义),a代表方面实体(可隐式或显示的出现在句子中,因此该项输出可为空),o代表意见词,p代表代表情感极性分为POS、NEU、NEG,有些任务会多一个invalid输出的形似。
文章模型
作者所提出的模型如上图所示,其本质仍然为一个文本生成任务,但是与之前提取n元组任务处理不同的是,作者这里设置的是生成一个更贴近于自然语言的句子而不是直接生成孤单的情感元素。通过这样的处理,一方面可以更好地运用预训练语言模型的先验知识,而且生成一个真正意义上的句子也可以更好地使用文本中所含情感元素丰富的语义信息。
PARAPHRASE建模
对于一个(c,a,o,p)四元组,作者的转化方式如下:
其中P代表一个投影函数,即将原始的情感元素转变为自然语言的形似。如果一个句子中含有多个四元组的形似,作者采用[SSEP]特殊符号的形式隔开。
对于意见词还有方面类别都可以直接使用原句或者预定义好的形式,但是情感极性直接用POS或者postive这样的在一些时候是不恰当的,因此作者这里也进行如下转化:
由于方面实体可能不会显示的表达在语句中,因此作者这里也进行了相应的判断:
一些例句如下所示:
最后作者是采用了基于Transformer Encoder和Decoder架构的T5-base模型进行训练,encoder部分不用多说,decoder部分会有两个部分的输入一个是encoder部分的隐藏层的输出,另一个是t时刻之前decoder部分的输出。