Sarcasm detection论文解析 |# 利用情感语义增强型多层次记忆网络进行讽刺检测

论文地址

论文地址:https://www.sciencedirect.com/science/article/abs/pii/S0925231220304689?via%3Dihub#/

论文首页

笔记框架

利用情感语义增强型多层次记忆网络进行讽刺检测


📅出版年份:2020
📖出版期刊:Neurocomputing
📈影响因子:6
🧑文章作者:Ren Lu,Xu Bo,Lin Hongfei,Liu Xikai,Yang Liang
📍 期刊分区:
JCR分区: Q2 中科院分区升级版: 计算机科学2区 中科院分区基础版: 工程技术2区 影响因子: 6.0 5年影响因子: 6.0 EI: 是 CCF: C 南农高质量: B


🔎摘要:

讽刺检测是情感分析中一项具有挑战性的自然语言处理任务。现有的基于深度学习的讽刺检测模型没有充分考虑情感语义,但是情感语义对于提高讽刺检测的性能是必要的。为了解决这个问题,我们提出了一种利用情感语义捕捉讽刺表达特征的多层次记忆网络。在我们的模型中,我们使用第一级记忆网络来捕捉情感语义,并使用第二级记忆网络来捕捉情感语义与每个句子中的情况之间的对比。此外,我们还使用了改进的卷积神经网络,以在缺乏本地信息的情况下改进记忆网络。在互联网论证语料库(IAC-V1 和 IAC-V2)和 Twitter 数据集上的实验结果证明了我们模型的有效性。


🌐研究目的:

解决现有讽刺检测模型没有考虑情感语义问题。

📰研究背景:

讽刺检测是情感分析中一项具有挑战性的自然语言处理任务。现有的基于深度学习的讽刺检测模型没有充分考虑情感语义,但是情感语义对于提高讽刺检测的性能是必要的。

🔬研究方法:


🔩MMNSS模型架构:

MMNSS模型可以分为两部分,包括特征提取器和讽刺检测器。我们使用

两种不同的单元进行特征提取,包括基于情感语义的多级记忆网络单元和局部最大卷积神经网络(LM-CNN)单元。

输入编码层

特征提取器

多级记忆网络单元

  • 捕获句子中的对比度以进行讽刺检测。

  • 第一级记忆网络是捕获情感语义,为了捕获更多的情感语义,我们选择带有 SenticNet 的情感词作为这部分的输入。

  • 第二级记忆网络是通过计算情感语义与句子中所有单词之间的内部注意力来捕获情感与情感或情感与情境之间的对比。

LM-CNN
  • 为了弥补记忆网络中局部信息的缺乏

  • 改进的卷积神经网络(CNN)可以捕获局部信息

  • 使用局部最大池化层,它可以捕获有关局部特征的更多有用信息。

两个单元提取的特征连接起来并输入到后面的 MLP 中以获得最终的特征表示。然后将最终表示用作讽刺检测检测器的输入。

讽刺检测器

获得了三个特征,包括fCNN、fLSTM和记忆网络fmemory最后一跳的输出向量。

  • 将这三个特征连接起来得到最终的特征表示ffeature。

  • softmax 层

  • MLP层

  • 最小交叉熵损失


🧪实验:

📇 数据集:

互联网论证语料库(IAC-V1 和 IAC-V2)和 Twitter 数据集。

  • IAC 语料库旨在研究在线 BBS 上的政治辩论

  • Twitter 是一个社交网络和微博服务网站,通过文献[30]得到。

📏评估指标:

F1、召回率和精确度得分

📉 优化器&超参数:

使用预训练的 300 维全局向量(GloVe)[31] 作为词嵌入。

随机初始化 50 维位置向量得到词向量矩阵和情感词向量矩阵。

CNN模型参数Table2

IAC 数据集的本地池大小为 30,Twitter 数据集的本地池大小为 15。

💻 实验设备:

📊 消融实验:

第一级记忆网络(情感语义)提高了1.05个百分点。多级内存网络提升了1.84个百分点。 CNN cell 提高了 1.03 个百分点。 local-max-pooling 可以比 max-pooling 层提高 0.9 个百分点。

“70.93” (Ren 等, 2020, p. 325)

从表4的结果来看,我们可以看到在我们的模型中使用情感语义、记忆网络和 CNN 单元的有效性。

📋 实验结果:

Debates(IAC-V1和IAC-V2)上的结果表明CNN的性能优于LSTM。但 LSTM 在推文上的表现优于 CNN。

Attention LSTM 的性能通常优于 LSTM。

MIARN模型充分考虑了句内关系,取得了极具竞争力的性能。但MIARN模型缺乏情感考虑。


🚩研究结论:

提出了一种名为 MMNSS 的讽刺检测模型,该模型考虑了情感语义的高级表达。由于情感在讽刺检测中起着重要作用,我们从SenticNet中获取情感词,并使用记忆网络提取情感词的高级特征。这些高级特征作为下一个记忆网络的输入,进一步获得输入句子的高级特征。我们还使用局部最大池层代替传统的最大池层,以便保留输入句子的更多有用特征以用于讽刺检测。实验结果表明了我们模型的有效性。


📝总结

💡创新点:

  • 提出了一种利用情感语义捕捉讽刺表达特征的多层次记忆网络MMNSS 模型。

  • 我们使用改进的 CNN 在缺乏本地信息的情况下辅助记忆网络。

  • 使用local-max-pooling层代替传统的max-pooling层,这样可以有效地保留更多有用的特征。

🖍️知识补充:

  • 一般来说,讽刺表达涉及两个关键因素:(a)句子中情感极性的对比; (b)所传达的情绪与实际情况的对比。

  • 讽刺检测的算法可以分为两类,包括特征工程方法和深度学习方法。

  • 讽刺总是由积极情绪和消极情境产生,这表明讽刺具有不一致性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/594924.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【微服务】服务保护(通过Sentinel解决雪崩问题)

Sentinel解决雪崩问题 雪崩问题服务保护方案服务降级保护 服务保护技术SentinelFallback服务熔断 雪崩问题 在微服务调用链中如果有一个服务的问题导致整条链上的服务都不可用,称为雪崩 原因 微服务之间的相互调用,服务提供者出现故障服务的消费者没有…

软件全套资料整理包获取-软件各阶段支撑文档

软件全套精华资料包清单部分文件列表: 工作安排任务书,可行性分析报告,立项申请审批表,产品需求规格说明书,需求调研计划,用户需求调查单,用户需求说明书,概要设计说明书&#xff0c…

既能自动仿写公众号爆文,还能批量帮你上架闲鱼商品,打造自己的数字员工,简直yyds

「想象一下,如果有一个机器人在你的计算机上24小时不间断地工作,会不会做梦都笑着」 一、RPA机器人是什么? RPA——机器人流程自动化,它可以帮助人们完成重复性的、繁琐的工作,比如数据输入、网页爬取、自动化流程等…

The 2024 International Collegiate Programming Contest in Hubei Province, China

目录 H. Genshin Impact Startup Forbidden III K. Points on the Number Axis B 估计还会补D,I H. Genshin Impact Startup Forbidden III 对于一个有鱼的池塘,有周围与自己本身五个关键位置可以捕获当前位位置的鱼。把这些位置存储到 map中。用四进制…

2023 年全国职业院校技能大赛(高职组)“云计算应用”赛项赛卷 B(容器云)

#需要资源(软件包及镜像)或有问题的,可私聊博主!!! #需要资源(软件包及镜像)或有问题的,可私聊博主!!! #需要资源(软件包…

【011】网上鲜花商店(SSM+JSP)

【011】网上鲜花商店(SSMJSP) 一、系统情况介绍 网上鲜花商店分为前台端和后台端,是致力于可以便捷购花而开发的一套系统,可以按照不同种类进行分类管理,清晰客观的展示鲜花的详情信息以及价格等等,适合新手学习开发…

Redis(基础指令和五大数据类型)

文章目录 1.基本介绍1.多种数据结构支持2.应用场景 2.Redis安装(直接安装到云服务器)1.安装gcc1.yum安装gcc2.查看gcc版本 2.将redis6.2.6上传到/opt目录下3.进入/opt目录下然后解压4.进入 redis-6.2.6目录5.编译并安装6.进入 /usr/local/bin 查看是否有…

多域名证书一个域名50元

多域名SSL数字证书是一种特殊的域名SSL证书,它可以同时保护多个不同的独立域名,对于域名网站比较多的个人和企事业开发者来说,为每个网站购买不同的SSL证书是一项不小的开销。因此,CA认证机构推出了两种SSL证书——通配符SSL证书和…

内网使用有道云翻译(安装离线包,支持翻译长句)

当我们使用有道云翻译时,为了在没网的情况下也能准确进行翻译,我们需要下载一些离线包增强翻译效果,但是我们在内网进行有道云安装时,他只提供了一个有道云的exe安装,并没有提供离线包的安装,我们这里实现在…

vue快速入门(五十五)插槽基本用法

注释很详细&#xff0c;直接上代码 上一篇 新增内容 当传输内容只有一种时的基础写法 源码 App.vue <template><div id"app"><h1>被淡化的背景内容</h1><my-dialog><!-- 插槽内容:文字以及dom结构都可以传 --><span>你确…

分布式锁与秒杀

分布式锁与秒杀 1. 分布式锁1.1 常用Redis分布式锁方案三&#xff1a;使用Lua脚本(包含SETNX EXPIRE两条指令) 秒杀 1. 分布式锁 https://www.cnblogs.com/shoshana-kong/p/17519673.html 1.1 常用Redis分布式锁方案三&#xff1a;使用Lua脚本(包含SETNX EXPIRE两条指令) …

Gradio的Dataframe数据显示不全,例如只能显示前15行数据

Gradio的Dataframe数据显示不全&#xff0c;例如只能显示前15行数据 ⚙️1.软件环境⚙️&#x1f50d;2.问题描述&#x1f50d;&#x1f421;3.解决方法&#x1f421;&#x1f914;4.结果预览&#x1f914; ⚙️1.软件环境⚙️ Windows10 教育版64位 Python 3.10.6 Chrome 版本…

RFC 791 (1)-导论

目录 浅论 IP是啥 IP可以管啥 操作 范例查看 提示&#xff1a;本系列将会开始RFC文档阅读&#xff0c;这里会给出我的一些笔记 浅论 我们这篇RFC文档描述的是IP和ICMP协议&#xff0c;我们都知道&#xff0c;在传统的OSI七层或者是现在被简化的五层&#xff1a;应用层&…

绘唐3工具怎么成为团长阿

绘唐3怎么成为团长阿 这里https://qvfbz6lhqnd.feishu.cn/wiki/D3YLwmIzmivZ7BkDij6coVcbn7W

统一大型语言模型和知识图谱:路线图

【摘要】 大型语言模型&#xff08;LLM&#xff09;&#xff0c;如ChatGPT和GPT4&#xff0c;由于其涌现能力和泛化性&#xff0c;正在自然语言处理和人工智能领域掀起新的浪潮。然而&#xff0c;LLM是黑箱模型&#xff0c;通常无法捕捉和获取事实知识。相反&#xff0c;知识图…

图片如何转换成jpg?分享三种简单方法

在日常生活中&#xff0c;我们经常需要将照片转换为JPG格式以便于分享或者上传&#xff0c;然而&#xff0c;小伙伴不知道的是不同的设备和软件可能会有不同的默认保存格式。如果你发现你的照片不是jpg格式&#xff0c;那么如何将图片如何转换成jpg呢? 如果您有其他格式的图片…

Windows 系统使用Jenkins 实现CI一键打包部署操作

一 下载安装jenkins jenkins 中文官网链接: 下载地址 点击下载&#xff0c;完成后是一个.msi后缀的安装文件&#xff0c;双击安装 安装和普通软件一样&#xff0c;一路next&#xff0c;安装路径自己设置一下&#xff0c;默认是C盘&#xff0c;我C盘不够用了&#xff0c;设置…

【C++基础】this指针

一&#xff0c;this指针引入 不同对象调用相同函数时 &#xff0c;打印出来的值不一样&#xff0c;为什么&#xff1f; 这就隐含了一个this指针。this指针又叫隐含的this指针。&#xff08;不能显示写&#xff0c;但能显示用&#xff09; 注&#xff1a;1&#xff0c;红色部…

企业计算机服务器中了rmallox勒索病毒怎么处理,rmallox勒索病毒解密恢复

网络在为企业提供便利的同时&#xff0c;也为企业的数据安全带来严重威胁。随着网络技术的不断发展&#xff0c;越来越多的企业利用网络开展各项工作业务&#xff0c;网络数据安全问题&#xff0c;一直成为企业关心的主要话题&#xff0c;但网络威胁随着网络技术的不断成熟&…

《Fundamentals of Power Electronics》——一些常用变换器的正则电路参数值

对于理想的CCM PWM dc-dc转换器&#xff0c;其包含一个电感和电容&#xff0c;正则模型有效的低通滤波器需要包含一个电感和一个电容。正则模型简化为如下图所示。 假设电容与负载直接相连。基础的buck、boost和buck-boost转换器的参数值如下表所示。 该模型可以用传统的线性电…