Sarcasm detection论文解析 |A2Text-Net:一种用于讽刺检测的新型深度神经网络

论文地址

论文地址:A2Text-Net: A Novel Deep Neural Network for Sarcasm Detection | IEEE Conference Publication | IEEE Xplore

github:lliyuan1117/A2Text-Net (github.com)

论文首页

A2Text-Net:一种用于讽刺检测的新型深度神经网络


📅出版年份:2019
📖出版期刊:
📈影响因子:
🧑文章作者:Liu Liyuan,Priestley Jennifer Lewis,Zhou Yiyun,Ray Herman E.,Han Meng


🔎摘要:

讽刺是一种常见的反讽形式,使用者通常使用相反的词语来表达自己的负面态度。预测讽刺是研究人类社会互动的重要组成部分。改进讽刺语言的分类有可能改进人类情感的其他方面(如品牌偏好、政治观点)。在面对面交流中,声音的变化、眼神的交流、身体的姿势等都为听众提供了发现讽刺的线索。然而,由于缺乏这些以人为中心的微妙线索,仅通过文本检测讽刺尤其具有挑战性。在这项研究中,我们采用了一种新的深度神经网络: A2Text-Net 来模仿面对面的语音,它整合了标点符号、语篇(POS)、数字、表情符号等辅助变量,以提高分类性能。实验结果证明,与传统的机器学习和深度学习算法相比,我们的 A2Text-Net 方法提高了分类性能。


🌐研究目的:

改进的讽刺检测支持更好地解释客户情绪、政治评论和通过社交媒体平台进行的信息交流。

📰研究背景:

在社交媒体和其他基于文本的环境中,讽刺检测成为一项艰巨的任务。仅从文本中很难对讽刺信息进行分类;缺少提供重要背景的线索。

🔬研究方法:


🔩模型架构:

A2Text-Net 共有三层。

第一层名为“假设检验层”

  • 旨在确定辅助变量是否适合添加到文本中。

  • “假设层”选择适当的辅助变量,添加到下一个“特征处理层”中。

第二层是“特征处理层”

  • 主要目的是将非结构化数据转换为结构化数据,并将文本特征与辅助特征连接起来。

  • 对于文本数据,词嵌入层可以训练每个词的参数,并将非结构化文本数据转换为结构化数据。

  • 在词嵌入层之后接着一个扁平化层,因为它可以减少词嵌入层的维度以满足下一层的输入维度要求。

  • 由于上下文向量和辅助变量具有不同的维度,因此不能同时充当神经网络的输入。

第三层“神经网络层”

  • 双通道数据、词嵌入输出和虚拟辅助变量将作为输入连接到第三层。

  • 应用反向传播深度神经网络。神经网络层的输入将是与文本的平坦层连接的词嵌入输出,以及我们第一层得到的辅助变量。


🧪实验:

📇 数据集:

  • 新闻标题数据集:该数据集包含从“Onion”和“HuffPost”网站收集的 26,709 个新闻标题。

  • Tweets 数据集 A:原始数据集由 Riloff 等人收集。我们收集了 1,956 条推文,其中 308 条是讽刺记录,1,648 条不是讽刺记录。

  • 推文数据集 B:数据集中有 54,931 条记录,其中 25,872 条被标记为讽刺推文,29,059 条被标记为非讽刺推文。

  • Reddit 数据集:该数据集包含 4,692 条 Reddit 评论。其中,2,346 条是讽刺记录,2,346 条不是讽刺记录。

数据预处理包括几个方面:单词标记化、所有文本小写、删除停用词和标点符号、雪词干法和词形还原

📏评估指标:

采用ROC AUC、召回率、精度和F1分数作为评价指标。

F1 分数是精确率和召回率的调和平均值。

5 折交叉验证来测试模型。

📉 优化器&超参数:

dropout率设置为0.2

两个隐藏层使用ReLu函数

输出层使用sigmoid函数对讽刺状态进行分类。

第一隐藏层有 64 个神经元,第二隐藏层有 32 个神经元。

与逻辑回归类似,“rmsprop”优化器用于寻找二元交叉熵目标函数的最优解。

💻 实验设备:

📊 消融实验:

📋 实验结果:

我们提出的 A2Text-Net 在三个数据集上具有最佳性能。

Tweets 数据集 A 是一个小型且不平衡的数据集,LSTM 在解决该数据集上的讽刺分类问题方面具有最佳性能。

显然,A2Text-Net 神经网络可以帮助 DNN 模型获得更好的分类结果。


🚩研究结论:

  • 本文提出了一种新颖的深度神经网络来检测讽刺,即“A2Text-Net”。

  • 实验结果表明,与其他基线模型相比,我们提出的方法可以获得出色的性能。

  • A2Text-Net 是一个合适的模型来检测讽刺,它允许我们添加更多相关的辅助特征,而不仅仅是使用文本特征。

  • 我们的 A2Text-Net 中的第三层可以适应任何其他深度学习模型,如果它们具有比深度神经网络更好的性能。


📝总结

💡创新点:

  • 采用了一种新的深度神经网络: A2Text-Net 来模仿面对面的语音,它整合了标点符号、语篇(POS)、数字、表情符号等辅助变量,以提高分类性能。

  • A2Text-Net框架使用辅助特征来改进模型选择,它将多个辅助数据与词嵌入的输出相结合。

  • 提出了两个辅助变量:标点符号和词性。可以使用统计假设检验来选择辅助变量,以改进讽刺的检测。

  • 训练了词嵌入模型,而不是使用预先训练的模型

⚠局限性:

🔧改进方法:

🖍️知识补充:

  • 词嵌入的主要目的是使用密集向量表示来表示单词和文档。

  • 在词嵌入层之后接着一个扁平化层,因为它可以减少词嵌入层的维度以满足下一层的输入维度要求。


💬讨论:

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/591874.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Win11 怎么让软件运行后台全部显示在任务栏上 win11任务栏展开显示所有软件图标

Win11 怎么让软件运行后台全部显示在任务栏上 win11任务栏展开显示所有软件图标 方法二 搜索cmd 打开命令行面板 然后输入 explorer shell:::{05d7b0f4-2121-4eff-bf6b-ed3f69b894d9}就能显示出来了 ## 方法三 通知区域图标不存在 如图,显示为这样 这种时候桌面…

深入解析Java中的String对象及其性能优化

作者主页: 🔗进朱者赤的博客 精选专栏:🔗经典算法 作者简介:阿里非典型程序员一枚 ,记录在大厂的打怪升级之路。 一起学习Java、大数据、数据结构算法(公众号同名) ❤️觉得文章还…

uniapp乡村社区户籍问外来人员管理系统 微信小程序python+java+node.js+php

基于微信小程序的外来人员管理系统项目的概述设计分析,主要内容有的私教预约平台系统平台的具体分析,进行数据库的是设计,数据采用MySQL数据库,并且对于系统的设计采用比较人性化的操作设计,对于系统出现的错误信息可以…

用Jenkins Gerrit-Trigger插件实现提交gerrit后自动启动编译验证-解决编译依赖问题

用Jenkins Gerrit-Trigger插件实现提交gerrit后自动启动编译验证-CSDN博客讨论了如何利用插件在提交gerrit的时候自动出发一个jenkins job编译固件,但是没有解决编译依赖问题。本文提出一种解决方案 首先在git commit -m ""的时候在commit message中设置Depend-On:…

Typescript基础语法(四)

模块化 模块化是指将复杂的程序拆解为多个独⽴的⽂件单元,每个⽂件被称为⼀个模块。在 TypeScript 中,默认情况下,每个模块都拥有⾃⼰的作⽤域,这意味着在⼀个模块中声明的任何内容(如变量、函数、类等)在该…

我们的手机是如何连接上网的?骨干网又是什么?

什么是骨干网(Backbone Network) 几台计算机连接起来,互相可以看到其他人的文件,这叫局域网。整个城市的计算机都连接起来,就是城域网。把城市之间连接起来的网就叫骨干网。 这些骨干网是国家批准的可以直接和国外连…

CUDA CPP Unity Compute Shader

为学 开始一个新的学习计划,涵盖: 主题学习内容CUDAProfessional CUDA C Programming/NVIDIA CUDA初级教程视频(周斌)CCPrimer / The Cherno CPPUnity Compute ShaderUdemy Learn to Write Unity Compute ShadersLinear AlgebraMIT 18.06 Prof.Gilbert…

【Anaconda 3 】Jupyter Notebook 的安装配置及使用

Jupyter Notebook 的安装配置及使用 一、引言 Jupyter Notebook 是一种交互式笔记本,它允许用户将代码、注释、方程式、可视化内容等整合到一个文档中,并支持多种编程语言,如 Python、R、Julia 等。它在数据科学、机器学习和教育领域中得到…

Idea 自动生成测试

先添加测试依赖&#xff01;&#xff01; <!--Junit单元测试依赖--><dependency><groupId>org.junit.jupiter</groupId><artifactId>junit-jupiter</artifactId><version>5.9.1</version><scope>test</scope><…

MATLAB 集成

MATLAB 集成&#xff08;Integration&#xff09; 集成处理两种本质上不同的问题。 在第一种类型中&#xff0c;给出了函数的导数&#xff0c;我们想找到函数。因此&#xff0c;我们从根本上扭转了分化的过程。这种反向过程称为反微分&#xff0c;或者找到原始函数&#xff0…

基于SSM的宠物领养平台(有报告)。Javaee项目。ssm项目。

演示视频&#xff1a; 基于SSM的宠物领养平台&#xff08;有报告&#xff09;。Javaee项目。ssm项目。 项目介绍&#xff1a; 采用M&#xff08;model&#xff09;V&#xff08;view&#xff09;C&#xff08;controller&#xff09;三层体系结构&#xff0c;通过Spring Spri…

专项技能训练五《云计算网络技术与应用》实训7-1:安装mininet

文章目录 mininet安装1. 按6-1教程安装opendaylight控制器。2. 按6-2教程安装RYU控制器。3. 按5-1教程安装openvswitch虚拟交换机并开启服务。4. 将老师所给mininet安装包试用winSCP传送至电脑端。5. 安装net-tools。6. 安装mininet7. 安装完成后&#xff0c;使用命令建立拓扑&…

Stable Diffusion webUI 配置指南

Stable Diffusion webUI 配置指南 本博客主要介绍部署Stable Diffusion到本地&#xff0c;生成想要的风格图片。 文章目录 Stable Diffusion webUI 配置指南1、配置环境&#xff08;1&#xff09;pip环境[可选]&#xff08;2&#xff09;conda环境[可选] 2、配置Stable Diffu…

JavaScript 动态网页实例 —— 文字移动

前言 介绍文字使用的特殊效果。本章介绍文字的移动效果,主要包括:文字的垂直滚动、文字的渐隐渐显、文字的闪烁显示、文字的随意拖动、文字的坠落显示、页面内飘动的文字、漫天飞舞的文字、文字的下落效果。对于这些效果,读者只需稍加修改,就可以应用在自己的页面设计中。 …

农作物害虫检测数据集VOC+YOLO格式3575张10类别

数据集格式&#xff1a;Pascal VOC格式YOLO格式(不包含分割路径的txt文件&#xff0c;仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数)&#xff1a;3575 标注数量(xml文件个数)&#xff1a;3575 标注数量(txt文件个数)&#xff1a;3575 标注…

电话号码的字母组合 【C++】【力扣刷题】

解题思路&#xff1a; 以第一个为例,digits “23”&#xff0c;表明从电话号码的按键中选取2和3这两个字符&#xff0c;然后去寻找它们各自所对应的字母&#xff0c;这里每一个数字字符所对应的字母的不同&#xff0c;0对应的是空字符&#xff0c;而1的话题目中讲到是不对应任…

中药辨别二

声明&#xff1a;参考懒兔子公益课&#xff0c;参考网络资料和部分网络图片整理而成&#xff0c;仅供学习使用&#xff0c;不提供商业活动价值&#xff0c;文章描述的中药仅供学习&#xff0c;请在专业医师或专业医生指导下使用药材&#xff0c;擅自或其他情况下使用&#xff0…

LeetCode406:根据身高重建队列

题目描述 假设有打乱顺序的一群人站成一个队列&#xff0c;数组 people 表示队列中一些人的属性&#xff08;不一定按顺序&#xff09;。每个 people[i] [hi, ki] 表示第 i 个人的身高为 hi &#xff0c;前面 正好 有 ki 个身高大于或等于 hi 的人。 请你重新构造并返回输入数…

初学python记录:力扣1235. 规划兼职工作

题目&#xff1a; 你打算利用空闲时间来做兼职工作赚些零花钱。 这里有 n 份兼职工作&#xff0c;每份工作预计从 startTime[i] 开始到 endTime[i] 结束&#xff0c;报酬为 profit[i]。 给你一份兼职工作表&#xff0c;包含开始时间 startTime&#xff0c;结束时间 endTime …

[嵌入式AI从0开始到入土]17_Ascend C算子开发

[嵌入式AI从0开始到入土]嵌入式AI系列教程 注&#xff1a;等我摸完鱼再把链接补上 可以关注我的B站号工具人呵呵的个人空间&#xff0c;后期会考虑出视频教程&#xff0c;务必催更&#xff0c;以防我变身鸽王。 第1期 昇腾Altas 200 DK上手 第2期 下载昇腾案例并运行 第3期 官…