NLP论文阅读记录 - 2021 | WOS 基于动态记忆网络的抽取式摘要

文章目录

  • 前言
  • 0、论文摘要
  • 一、Introduction
    • 1.1目标问题
    • 1.2相关的尝试
    • 1.3本文贡献
  • 二.前提
  • 三.本文方法
  • 四 实验效果
    • 4.1数据集
    • 4.2 对比模型
    • 4.3实施细节
    • 4.4评估指标
    • 4.5 实验结果
      • 4.6 细粒度分析
  • 五 总结
  • 思考


前言

在这里插入图片描述

Extractive Summarization Based on Dynamic Memory Network(21)

0、论文摘要

我们提出了一种基于 Bert 和动态记忆网络的提取摘要模型。基于 Bert 的模型使用 Transformer 提取文本特征,并使用预训练模型构建句子嵌入。基于 Bert 的模型自动标记句子,无需使用任何手工制作的特征,并且数据集是对称标记的。我们还提出了一种用于提取摘要的动态记忆网络方法。在几个摘要基准数据集上进行了实验。与其他提取摘要方法相比,我们的模型显示出可比的性能。

一、Introduction

1.1目标问题

摘要是自然语言理解和信息检索的一个重要问题。摘要的目的是压缩输入文本并保留输入文本的核心含义。概括的方法分为两类:抽取式概括法和抽象式概括法。这两种方法的对称性很重要。提取摘要方法从文档中选择显着内容,而抽象摘要方法解释文档内容。早期的研究主要集中在抽取式摘要方法,近期的研究主要集中在神经抽取式摘要和神经抽象式摘要。在本文中,我们只关注提取摘要方法。

1.2相关的尝试

Edmundson [1] 的早期工作是通过考虑标题词、线索词和句子位置来对句子进行评分。 Lin[2]使用一些规则来查找主题句,并训练一个模型来根据位置预测主题句。
随着深度学习的发展,研究人员主要集中于利用神经网络方法来解决提取摘要问题。特别是神经网络语言模型[3]和文本表示方法[4]的发展使得自然语言处理腾飞。曹[5]将神经网络应用于提取式查询集中摘要,这是一种信息检索任务。在他们的模型中,他们使用 CNN(卷积神经网络)将文档的句子和查询投影到潜在空间。为了获得文档表示,他们对句子嵌入使用加权和池化。最后,他们在比较句子嵌入和文档嵌入之间的相似性后,对文档的句子进行排序和选择。
由于RNN(循环神经网络)在机器翻译中的成功[6],Rush[7]首先采用基于注意力机制的RNN进行抽象摘要。
Nallapati [8]使用基于RNN的序列模型来提取单个文档的摘要,这是我们关注的问题。在他们的模型中,他们将提取摘要任务视为二元分类任务,并使用 RNN 模型作为句子分类器。最近,Zhou[9]将Carbonell和Goldstein[10]提出的MMR(最大边际相关性)选择策略集成到评分模型中。在他们的模型中,他们采用 BiGRU(双向门控循环单元)[4] 作为编码器来获取句子表示和文档表示,并通过最大化 ROUGE-2 F1 分数 [2] 构建标记训练数据。上面提到的这些神经抽取摘要方法都是使用RNN作为编码器,并且标记数据构建方法的计算量很大。 Narayan [11] 使用 CNN [12] 作为句子编码器,并使用 RNN 作为文档编码器。由于提取文本特征的能力很强,我们将像 Bert [14] 一样使用 Transformer [13] 作为编码器。

1.3本文贡献

总之,我们的贡献如下:

1.我们提出了一种提取摘要模型,该模型可以实现与其他基线可比较的结果。 2.我们提出了一种用于提取摘要问题的简单有效的句子标签方法。 3.我们将位置编码合并到动态记忆网络中。 4.我们建议使用动态记忆网络方法进行提取摘要。

二.前提

三.本文方法

四 实验效果

4.1数据集

4.2 对比模型

4.3实施细节

4.4评估指标

4.5 实验结果

4.6 细粒度分析


五 总结

在这项工作中,我们提出了一种基于 Bert 和动态记忆网络的提取摘要模型。在我们的模型中,我们使用简单的语义匹配方法来标记训练集并使用预训练的 Bert 模型来训练我们的模型。强大的文本特征提取能力使得模型有效。实验结果表明,基于 Bert 和动态记忆网络的模型在数据集上取得了与其他提取系统相当的结果。我们用于提取摘要问题的带有双 LSTM 编码器的动态记忆网络取得了良好的结果。以后我们会把这种抽取式概括的方法融入到抽象方法中。

思考

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/323512.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

百亿补贴链接的快速控价方式

各大电商平台都有推出百亿补贴这个通道,作为低价引流的方式,百亿补贴越来越受到消费者认可,对于平台来说,其带来的流量也是巨大的,而对于品牌来说,百亿补贴的价格对渠道的影响非常大,如果百亿补…

Linux之引导和服务篇

系统引导是操作系统运行的开始,在用户能够正常登录之前,Linux的引导过程完成了一系列的初始化任务,并加载必要的程序和命令终端,为用户登录做好准备。 一. 引导过程 开机自检--->MBR引导--->GRUB菜单--->加载Linux内核-…

pandas进行数据计算时如何处理空值的问题?

目录 1.数据预览: 2.解决方法 (1)问题示例 (2)方法 A.方法一 B.方法二 1.数据预览: 2.解决方法 (1)问题示例 如下图如果不理睬这些空值的话,计算总分便也会是空值…

Chapter 10 类的继承(上篇)

目的:了解三种继承方式,并清楚其中的差别 🎃🎃🎃🎃🎃🎃🎃🎃🎃🎃🎃🎃🎃🎃🎃…

安科瑞微电网能量监测系统Acrel-2000MG 储能电站监测预警

在新型电力系统中,储能将成为至关重要的一环,是分布式光伏、风电等新能源消纳以及电网安全保障必要保障,在电源侧、电网侧、用户侧都会得到广泛的应用。《电力现货市场基本规则(征求意见稿)》以及各地出台的扶持政策给…

Axure RP软件揭秘:设计师的秘密武器

Axure rp是一种快速原型设计工具,可以制作高度互动的HTML原型。设计师不仅可以使用Axure绘制线框图和原型,还可以在Axure rp中完成一系列用户体验设计。在本文中,我们将根据用户体验设计师的真实经验,触发用户体验设计师的实际工作…

我们公司都用哪些软件?强烈推荐这些

大家好,我是鱼皮。周末给大家分享一些轻松的干货吧,聊聊我们公司在用的软件,说不定能帮大家提高学习工作效率呢~ 我把软件分为四大类:团队协作、内容创作、文件共享、效率提升,分别介绍,便于大家选取。 团队…

Flink会话集群docker-compose一键安装

1、安装docker 参考,本人这篇博客:https://blog.csdn.net/taotao_guiwang/article/details/135508643?spm1001.2014.3001.5501 2、flink-conf.yaml flink-conf.yaml放在/home/flink/conf/job、/home/flink/conf/task下面,flink-conf.yaml…

如何利用静态代理IP优化跨境电商运营

文章目录 什么是跨境电商心得分享IP的重要性如何注册小结 什么是跨境电商 跨境电商,即跨境电子商务,是指在不同关境(国境)之间通过互联网进行的商业交易活动。这种商业模式充分利用了网络的全球化特性,使得买卖双方不…

探索FTP:原理、实践与安全优化

引言 在正式开始讲解之前,首先来了解一下文件存储的类型有哪些。 DAS、SAN和NAS是三种不同的存储架构,分别用于解决不同场景下的数据存储需求。 DAS (Direct Attached Storage 直接附加存储):DAS 是指将存储设备(如硬盘&#x…

微信小程序上传并显示图片

实现效果&#xff1a; 上传前显示&#xff1a; 点击后可上传&#xff0c;上传后显示&#xff1a; 源代码&#xff1a; .wxml <view class"{{company_logo_src?blank-area:}}" style"position:absolute;top:30rpx;right:30rpx;height:100rpx;width:100rp…

商城小程序(8.购物车页面)

目录 一、商品列表区域1、渲染购物车商品列表的标题区域2、渲染商品列表区域的基本结构3、为my-goods组件封装radio勾选状态4、为my-goods组件封装radio-change事件5、修改购物车中商品的选择状态6、为my-goods组件封装NumberBox7、为my-goods封装num-change事件8、修改购物车商…

[zabbix] zabbix监控

一、温习zabbix自定义监控 二、zabbix 自动发现与自动注册 2.1 zabbix 自动发现 //zabbix 自动发现&#xff08;对于 agent2 是被动模式&#xff09; zabbix server 主动的去发现所有的客户端&#xff0c;然后将客户端的信息登记在服务端上。 缺点是如果定义的网段中的主机数…

Linux进程【2】进程地址空间(+页表详解哦)

fork 引言&#xff08;程序地址空间&#xff09;进程地址空间进程地址空间mm_struct 虚拟地址到物理地址的转化总结 引言&#xff08;程序地址空间&#xff09; 在之前的学习过程中&#xff0c;我们认识了内存与地址&#xff0c;并且了解了在程序地址空间中的基本分区&#xf…

C++ 之LeetCode刷题记录(十)

&#x1f604;&#x1f60a;&#x1f606;&#x1f603;&#x1f604;&#x1f60a;&#x1f606;&#x1f603; 开始cpp刷题之旅&#xff0c;多学多练&#xff0c;尽力而为。 先易后难&#xff0c;先刷简单的。 66. 加一 给定一个由 整数 组成的 非空 数组所表示的非负整数…

Alist开源网盘搭建

官网&#xff1a;https://alist.nn.ci/zh/github下载地址&#xff1a;https://github.com/alist-org/alist/releases gitcode上也提供了源码:https://gitcode.com/mirrors/alist-org/alist/tags 源码安装使用自己研究,这里不讲解,较为复杂 我使⽤的版本:v3.29.1 我的下载地址:…

[ACM学习] 动态规划基础之一二三维dp

课内学习的动态规划 有记忆的迭代 优化解的结构&#xff1a;原始问题的一部分解是子问题的解 三要素&#xff1a;1.子问题 2.状态的定义 3.状态转移方程 定义 线性dp的一道例题 dp[i]表示以位置 i 结尾的方案总数&#xff0c;dp[4]2&#xff0c;因为&#xff1a;首先只放一…

大数据开发之Hive(查询、分区表和分桶表、函数)

第 6 章&#xff1a;查询 6.1 基本语法及执行顺序 1、查询语句语法 select_expr, select_expr, ... FROM table_reference [WHERE where_condition] [GROUP BY col_list] [ORDER BY col_list] [CLUSTER BY col_list| [DISTRIBUTE BY col_list] [SORT BY col_list]] [LIMIT n…

C#~Winform取消窗体最大化最小化按钮

目录 取消最大化-false取消最小化-false效果 取消最大化-false 取消最小化-false 效果

Umi3 创建,配置环境,路由传参(代码示例)

目录 创建项目 配置环境 创建脚手架 项目结构及其目录、 路由 配置路由 嵌套路由 编程式导航和声明式导航 声明式导航 编程式导航 约定式路由 路由传参 query传参&#xff08;问号&#xff09; 接收参数 params传参&#xff08;动态传参&#xff09; 接收参数 创…