【论文】SimCLS:一个简单的框架 摘要总结的对比学习(1)

SimCLS:摘要总结的对比学习(1)

  • 写在最前面
    • 模型框架
  • 摘要
  • 1 简介

写在最前面

SimCLS: A Simple Framework for Contrastive Learning of Abstractive Summarization(2021ACL会议)

https://arxiv.org/abs/2106.01890
论文:https://arxiv.org/pdf/2106.01890.pdf
在这里插入图片描述
预期写几篇博客详细展示该论文

模型框架

在这里插入图片描述
SimCLS框架进行两阶段抽象摘要 ,其中Doc、S、Ref分别表示文档、生成摘要和引用。
第一阶段,使用Seq2Seq生成器(BART)生成候选摘要。
第二阶段,使用评分模型(RoBERTa)来预测基于源文档的候选摘要的性能。评分模型通过对比学习进行训练,其中训练示例由Seq2Seq模型提供。

摘要

提出了一个概念上简单而经验上强大的抽象摘要框架SIMCLS,它可以通过将文本生成制定为一个无参考的评估问题(即质量估计),通过对比学习来弥补目前主导的序列到序列学习框架所产生的学习目标和评估指标之间的差距

实验结果表明,SimCLS对现有的顶级评分系统进行了少量的修改,可以大大提高现有顶级评分模型的性能。特别是,在CNN/DailyMail数据集上,相对于BART (Lewis et al., 2020)的2.51绝对提升,相对于PEGASUS (Zhang et al., 2020a)w.r.t ROUGE-1的2.50绝对提升,将最先进的性能提升到一个新的水平。

代码和结果:https://github.com/yixinL7/SimCLS
模型的结果已经部署到EXPLAINABOARD(Liuet al., 2021a)平台上,该平台允许研究人员以更细粒度的方式理解系统。

1 简介

序列到序列(Seq2Seq)神经模型(Sutskever et al.,2014)已广泛用于语言生成任务,如抽象摘要(Nallapati et al., 2016)和神经机器翻译(Wu et al., 2016)。
虽然抽象模型(Lewis et al., 2020; Zhang et al., 2020a)在总结任务中显示出了很好的潜力,但它们分享了Seq2Seq模型训练中广泛承认的挑战
具体来说,Seq2Seq模型通常在最大似然估计(MLE)框架下进行训练,在实践中通常使用teacher-forcing算法(Williams and Zipser, 1989)进行训练。这引入了目标函数和评价指标之间的差距,因为目标函数基于局部的令牌级预测,而评价指标(例如ROUGE (Lin, 2004))将比较黄金参考资料和系统输出之间的整体相似性。
此外,在测试阶段,模型需要自回归地生成输出,这意味着在前面步骤中所犯的错误会累积起来。这种训练和测试之间的差距在以前的工作中被称为exposure bias 暴露偏差(Bengio et al., 2015; Ranzato et al., 2016)。

方法的主线(Paulus et al., 2018; Li et al., 2019)建议使用强化学习(RL)的范式来缓解上述差距。虽然RL训练可以根据全局预测和与评估指标密切相关的奖励来训练模型,但它引入了深度RL的共同挑战。
具体来说,基于rl的训练存在噪声梯度估计(Greensmith et al., 2004)问题,这通常会使训练不稳定并且对超参数敏感
Minimum risk training最低风险培训,作为一种替代方案,也已用于语言生成任务(Shen et al., 2016; Wieting et al., 2019)。
然而,估计损失的准确性受到采样输出数量的限制。其他方法(Wiseman and Rush, 2016; Norouzi et al., 2016; Edunov et al., 2018)旨在扩展MLE的框架,将句子水平分数纳入目标函数。虽然这些方法可以减轻MLE训练的局限性,但评估指标和在其 方法中使用的目标函数之间的关系可以是间接的和隐含的。

在此背景下,本文将对比学习((Chopra et al., 2005))的范式进行了推广,引入了一种抽象总结的方法,从而实现了用相应的评价指标直接优化模型的目标,从而缩小了MLE训练中训练阶段和测试阶段之间的差距。
虽然一些相关工作(Lee et al., 2021; Pan et al., 2021)建议引入对比损失作为条件文本生成任务的MLE训练的增强,但本文选择通过在提出的框架的不同阶段引入对比损失和MLE损失来分离它们的功能。

具体来说,受到Zhong et al. (2020); Liu et al. (2021b)最近在文本摘要方面的工作的启发,我们建议使用一个两阶段模型进行抽象摘要,
其中首先训练Seq2Seq模型来生成带有MLE损失的候选摘要,
然后训练一个参数化评估模型来对生成的候选进行对比学习排名。
通过在不同阶段优化生成模型和评估模型,我们能够用监督学习来训练这两个模块,绕过基于rl方法的具有挑战性和复杂的优化过程。
我们在这项工作中的主要贡献是通过提出一个带有对比学习的生成-然后评估两阶段框架来接近面向度量的抽象总结训练,这不仅将CNN/DailyMail上的最新性能提升到一个新的水平(2.2 ROUGE-1对基线模型的改进),也展示了这个两阶段框架的巨大潜力。呼吁今后努力使用最大似然估计以外的方法优化Seq2Seq模型。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/18596.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

GIT常用操作

GIT基本使用保姆级教程 1、本地安装GIT 1.1、安装 GIT安装包获取:https://git-scm.com/ 具体安装流程自行百度或自行摸索 1.2、配置信息 安装完成后运行git程序,大打开git bash界面,然后输入以下命令,设置全局用户名与全局邮…

软件设计师笔记--数据结构

文章目录 前言学习资料数据结构大 O 表示法时间复杂度线性结构和线性表线性表的顺序存储线性表的链式存储栈的顺序存储栈的链式存储队列的顺序存储与循环队列 串KMP 数组矩阵树二叉树二叉树的顺序存储结构二叉树的链式存储结构二叉树的遍历平衡二叉树二叉排序树最优二叉树(哈夫…

ZZS-7系列分闸、合闸、电源监视综合控制装置ZZS-7/1 ac220v

ZZS-7系列分闸、合闸、电源监视综合控制装置 系列型号: ZZS-7/1分闸、合闸、电源监视综合控制装置 ZZS-7/11分闸、合闸、电源监视综合控制装置 ZZS-7/12分闸、合闸、电源监视综合控制装置 ZZS-7/13分闸、合闸、电源监视综合控制装置 ZZS-7/14分闸、合闸、电源…

分享111个Java源码,总有一款适合您

分享111个Java源码,总有一款适合您 源码下载链接:https://pan.baidu.com/s/1fycjYHA7y6r-IH8H7v5XKA?pwdag8l 提取码:ag8l ​ Druid v1.2.15 OpenJDK Java开发环境 v21.5 Diboot轻代码开发平台 v2.8.0 blockj 基础区块链(联…

ANSYS APDL谐响应分析——悬臂梁的频响函数计算以及幅值、角度(相位)、分贝计算

问题描述 研究一根悬臂梁,材质为钢材。长度 L 2 L2 L2 米;截面为矩形,矩形的长度为 H 5 c m H 5cm H5cm,宽度为 B 2 c m B 2cm B2cm 。 建模思路: 先建立节点,然后用节点生成单元。使用n命令&…

《基于多尺度特征提取的少样本脉搏波形轮廓分类》阅读笔记

目录 一、论文摘要 二、论文十问 Q1:论文试图解决什么问题? Q2:这是否是一个新的问题? Q3:这篇文章要验证一个什么科学假设? Q4:有哪些相关研究?如何归类?谁是这一课…

索引—MySQL

文章目录 1.定义以及相关知识1.1定义1.2数据库保存数据的基本单位 2.MySQL中索引分类2.1B树和B树2.2主键索引(聚簇索引)2.3非聚簇索引2.4覆盖索引2.5复合索引(联合索引)2.6基于B树的索引2.7hash索引 1.定义以及相关知识 1.1定义 …

数据导向下制造业的生产效率、交易效率提升办法

在智能制造和工业4.0成为趋势的今天,大部分制造业企业,均已在企业内部通过实施PLM系统(Product Lifecycle Management,产品生命周期管理系统),实现了对组织内产品研发过程和产品研发数据的管理,…

基于Spring Boot的在线考试系统

系统分析 可行性分析 一个完整的系统,可行性分析是必须要有的,因为关系到系统生存问题,对开发的意义进行分析,能否通过本系统来补充线下在线考试管理模式中的缺限,去解决其中的不足等,通过对本系统&#…

基于SpringBoot, Vue实现的校园二手书交易系统

背景 在Internet高速发展的今天,计算机的应用几乎完全覆盖我们生活的各个领域,互联网在经济,生活等方面有着举足轻重的地位,成为人们资源共享,信息快速传递的重要渠道。在中国,网上管理的兴起也同时飞速发…

【Linux】基本权限

😁作者:日出等日落 🔔专栏:Linux 任何值得到达的地方,都没有捷径。 目录 Linux权限: 权限的概念: Linux上面的用户分类: Linux权限管理 文件访问者的分类(人) 文件…

金兰组织 | 2023金兰解决方案集经营管理篇正式发布

为助力企业创新管理、提质增效,人大金仓携手金兰组织成员单位,于近期发布多项经营管理领域的联合解决方案,共享创新应用成果。 /人大金仓高级副总裁宋瑞/ 人大金仓高级副总裁宋瑞在致辞中表示:“联合解决方案创新是指通过把不同领…

跟着我学 AI丨ChatGPT 详解

随着人工智能的发展,聊天机器人成为了一个备受关注的领域。而ChatGPT作为其中的佼佼者,其功能和技术水平也越来越受到人们的关注。那么,什么是ChatGPT?它又有哪些优点和限制呢? ChatGPT是一款基于自然语言处理技术开发…

178_技巧_Power BI 动态排名多项展示

178_技巧_Power BI 动态排名多项展示 一、背景 在 Power BI 中做排名矩阵时,我们经常遇到同一维度下,多项展示排名的问题。类似这样的排名矩阵,排名的名次不会太多,但是同一维度下会有多项同时展示排名,并且还要满足…

第10 CURD操作与RedisCache缓存的强制清理的实现

using System.Net; using Microsoft.Extensions.Caching.Distributed; using Core.Caching; using Core.Configuration; using StackExchange.Redis; namespace Services.Caching { /// <summary> /// 【Redis分布式缓存数据库软件管理器--类】 /// <remarks>…

2023零售店铺管理系统最新排名,这5款性价比高!

很多零售店铺的老板&#xff0c;每天都在被开单收银、记账对账、商品销售、销售数据等各种琐事困扰&#xff0c;使用传统的人工管理模式&#xff0c;耗费了大量的时间和成本&#xff0c;也没有达到理想的效果。 其实&#xff0c;零售店铺管理也可以很简单省事&#xff0c;借助零…

TCP三次握手

TCP三次握手 文章目录 TCP三次握手1. TCP三次握手过程和状态变迁1. 准备工作2. 进行连接 2. 能把三次握手改为两次握手吗&#xff1f;3. 改为两次握手会出现什么后果&#xff1f;4. 改为四次握手行不行&#xff1f;5. TCP第三次握手失败了怎么办&#xff1f;6. 三次握手是否可以…

探索 Elasticsearch 8.X Terms Set 检索的应用与原理

1、Terms Set 检索简介 Terms Set查询是Elasticsearch中一种强大的查询类型&#xff0c;主要用于处理多值字段中的文档匹配。 其核心功能在于&#xff0c;它可以检索至少匹配一定数量给定词项的文档&#xff0c;其中匹配的数量可以是固定值&#xff0c;也可以是基于另一个字段的…

抖音商城小程序搭建的注意事项

抖音商城小程序已经成为了越来越多电商企业的选择&#xff0c;毕竟它具有强大的用户资源和社交传播力。但是&#xff0c;在搭建抖音商城小程序的过程中&#xff0c;还有一些需要注意的事项。 1、制定明确的策略和目标 在搭建抖音商城小程序前&#xff0c;必须事先制定明确的策…

三步配置轻量级服务器nginx

这里写目录标题 一 nginx及其应用场景1.什么是nginx2.应用场景背诵 二 nginx的配置安装1.选择nginx版本2. 安装配置环境3.安装nginx4.启动nginx 三 访问 一 nginx及其应用场景 1.什么是nginx 一款轻量级的Web服务器&#xff0c;反向代理服务器&#xff0c;以及电子邮件代理服…