Google最新论文:有限的标注和时间内提升文档信息提取的效率和准确性 Noise-Aware Training(NAT)

  1. 📌 元数据概览:
  • 标题:Noise-Aware Training of Layout-Aware Language Models
  • 作者:Ritesh Sarkhel, Xiaoqi Ren, Lauro Beltrao Costa, Guolong Su, Vincent Perot 等
  • 链接:Noise-Aware Training of Layout-Aware Language Models
    • 这是论文的预印本链接,提供了论文的详细内容和实验结果。
  • 标签:Layout-Aware Language Models, Semi-Supervised Learning, Information Extraction, Document Layout
    • 论文主要关注于布局感知的语言模型、半监督学习、信息提取和文档布局理解。
      在这里插入图片描述
      在这里插入图片描述
  1. ✨ 核心观点与亮点:
  • 主张:通过NAT方法,可以在有限的标注数据和时间内有效地训练出性能强大的文档信息提取模型。
  • 亮点:NAT方法通过利用弱标注文档和引入对样本信心的估计,提高了模型的训练效率和性能。
  • 核心贡献:提出了一种新颖的半监督持续训练框架NAT,它能够在减少人工标注需求的同时,保持或提升模型的提取性能。
  • Motivation:论文的动机是在企业场景中,需要一种可扩展、高效且准确的训练方法来处理数千种不同类型的文档。

3… 📚 论文的核心内容,模型结构,关键术语/概念:

  • 核心内容:NAT框架通过三个阶段的工作流程来训练模型:初始化、噪声感知微调和合成数据增强微调。
  • 模型结构详述:NAT首先使用预训练模型初始化提取器,然后通过弱监督源赋予未标注文档标签,并结合少量人工标注数据进行微调。在第三阶段,通过基于规则的数据增强策略生成合成文档,并进一步微调模型。
  1. 🌟 实验结果:
  • 核心实验结果:NAT训练的模型在多个公开和内部数据集上展现出了优越的性能,与迁移学习基线相比,宏观F1分数提高了多达6%,并且通过减少人工标注需求,提高了标签效率,最高可达73%。
  • 消融实验:通过移除NAT中的噪声感知训练方案,实验结果显示在法国发票数据集上平均宏观F1分数下降了3.10%,证明了NAT中使用弱标签的重要性。
  1. 🔄 总结归纳:
  • NAT方法为在有限资源下训练高效的文档信息提取模型提供了一种新的解决方案。它不仅减少了对大量标注数据的依赖,而且在保持高提取性能的同时显著降低了人工标注的成本。这一方法对于需要处理大量文档的企业场景尤其有价值。
  • 相关工作包括其他在文档布局理解和信息提取领域的研究,如LayoutLMV2、FormNet等。

6.❓引发思考的问题:

  • NAT方法在处理不同类型和复杂度的文档时的表现如何?
  • 在实际应用中,如何选择合适的弱监督源以最大化NAT的效果?
  • NAT方法是否可以与其他类型的语言模型结合使用?

7.推文总结:

  • 探索NAT,一种创新的半监督学习方法,能够在有限的标注和时间内提升文档信息提取的效率和准确性!📄🚀 减少人工标注,提高性能,NAT是企业文档处理的新利器。#NAT #DocumentExtraction #MachineLearning

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/512807.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

深度学习平台

深度学习平台(只能有线连接校园网) 账户 yeguifeng密码 yguifengenv3 : pytorch1.9cudajupytermatplotlib pycuda: pycuda Timesformer –data_dir ./trainingVideo --category my_fire --output_dir ./output --image_size 100 --num_chain 10 --batch_size 14 --lr 0.001…

C++——哈希(二)unordered_map和unordered_set的封装

前言 在上一篇文章中我们已经对闭散列的哈希表(线性探测法)和开散列的哈希表(哈希桶)进行了简单的模拟实现,由于是简单实现,功能简单、没有迭代器且不支持不同的类型(非泛型编程)。此时我们这篇文章主要是对上次开散列哈希表的完善并用其封装出unordere…

如何操作RAID 0阵列的扩容?

正文共:1888 字 23 图,预估阅读时间:2 分钟 RAID(Redundant Array of Independent Disks)即独立磁盘冗余阵列,通常简称为磁盘阵列,在高级磁盘阵列中,部分物理存储空间会用来记录保存…

前端学习<四>JavaScript基础——01-编程语言和JavaScript简介

计算机语言 概念 计算机语言:人与计算机之间通信的语言。它是人与计算机之间传递信息的媒介,它通过特定的语法规则和语义约定,将人类可理解的指令转化为计算机可以执行的机器指令。 计算机程序:就是计算机所执行的一系列的指令…

数据结构——二叉树链式结构

目录 前言 1. 二叉树的概念及结构 1.1概念 1.2 特殊的二叉树 1.3 二叉树的性质 1.4 二叉树的存储结构 2. 二叉树链式结构实现 2.1 手动创建二叉树 2.2 二叉树的遍历 2.2.1 前序、中序和后序遍历 2.2.2 层序遍历 2.3 节点个数以及高度 2.3.1 节点个数 2.3.2 求二叉…

爬虫实战三、PyCharm搭建Scrapy开发调试环境

#一、环境准备 Python开发环境以及Scrapy框架安装,参考:爬虫实战一、Scrapy开发环境(Win10Anaconda)搭建 PyCharm安装和破解,参考:爬虫实战二、2019年PyCharm安装(激活到2100年) …

关于 ulimit 的两个天坑

稍微有点 Linux 经验的人一定会遇到过 “Too many open files” 错误,这个错误本质是 ulimit 设置不合理导致的。关于 ulimit 设置,有哪些需要注意的点呢?本文给大家做一个介绍,希望对大家有所帮助。 如何确认 ulimit 设置生效了…

苍穹外卖面试题准备(持续更新

苍穹外卖面试题准备 讲讲 redis,它在你的项目中作用是什么?在你的项目中 redis 作为缓存, MySQL 的数据如何与 redis 进行同步呢?如何解决 Redis 的缓存穿透问题redis 的淘汰机制是怎么样的?redis 的 IO 多路复用是什么&#xff1…

大屏可视化项目示例--基于Vue3+vite2+echart+mock+axios+dataV

图例: 项目环境: Vite、Echarts、Npm、Node、axios、mock、vue3、dataV。 项目地址: IofTV-Screen-Vue3: 🔥(IofTV-Screen Vue3版本)一个基于 vue3、vite、Echart 框架的物联网可视化(大屏展示)模板&…

docker导出导入镜像

docker导出镜像 查看要导出的镜像 docker images主要有两列 REPOSITORY TAG 导出命令 导出公式 docker save -o xxxx.tar REPOSITORY:TAG例子 docker save -o minio.tar minio/minio:latestminio/minio:latest可以使用image id代替,但是使用image id会导致导…

CSS之第一个CSS样式和CSS选择符

前端这些博客&#xff0c;我觉得都是固定的语法&#xff0c;故而不会以过多的文字进行描述&#xff0c;本系列博文均以实例和代码介绍的方式进行&#xff0c;主要按照代码进行。不会以过多的文字描述。 第一个CSS样式 <!DOCTYPE html> <html lang"en">…

百度地图 JavaScript API GL快速升级 和mapV的使用

一、百度地图 JavaScript API GL快速升级 JavaScript API GL升级指南 1、在原来的链接中添加type webgl 2、批量替换页面中的BMap直接替换为BMapGL 二、mapV的使用 MapVGL mapVGL的效率确实要快很多&#xff0c;一万个点基本实现秒现 1、加载mapvgl.min.js export const…

eclipse显示包层级设置

1、选择中右上角的倒三角 2、选中 Package Presentation -> Hierachical

【linux学习15】日志管理rsyslog、logrotate介绍

1.rsyslog 系统日志管理 什么程序产生什么日志&#xff0c;日志存放文件夹 rsyslogd&#xff1a;系统专职日志程序 httpd/nginx/mysql&#xff1a;各类应用程序&#xff0c;存放自己的日志查看rsyslogd程序 ps aux | grep rsyslogd//常见日志文件&#xff08;洗头膏、进程、应…

CTK插件框架学习-信号槽(05)

CTK插件框架学习-事件监听(04)https://mp.csdn.net/mp_blog/creation/editor/137171155 一、主要流程 信号发送者告诉服务要发送的信号信号发送者发送信号信号接收者告诉服务当触发某个订阅的主题时通知槽函数信号接收者处理槽函数信号槽参数类型必须为&#xff08;const ctk…

算法训练day57leetcode1143.最长公共子序列 1035.不相交的线 53最大子序和

part14 1143.最长公共子序列 1035.不相交的线 53最大子序和 动态规划 1143. 最长公共子序列 初始化动态规划数组 dp 动态规划数组 dp 是一个二维数组&#xff0c;其大小为 (text1.size() 1) x (text2.size() 1)&#xff0c;dp[i][j] 表示 text1 的前 i 个字符和 text2 的前…

对【AI技术创业】有哪些机会进行分析和引导

文章目录 方向一&#xff1a;行业解决方案,以下是一些常见的行业解决方案&#xff1a;方向二&#xff1a;智能产品和服务,以下是一些智能产品和服务的示例&#xff1a;方向三&#xff1a;教育和培训 1.智能客户服务&#xff1a; 利用自然语言处理&#xff08;NLP&#xff09;和…

通过SSH在苹果手机上查看系统文件:远程访问iOS文件系统的方法

​ 目录 引言 用户登录工具和连接设备 查看设备信息&#xff0c;电池信息 查看硬盘信息 硬件信息 查看 基带信息 销售信息 电脑可对手机应用程序批量操作 运行APP和查看APP日志 IPA包安装测试 注意事项 引言 苹果手机与安卓手机不同&#xff0c;无法直接访问系统文件…

【蓝牙协议栈】【BLE】【ATT】低功耗蓝牙之属性协议介绍

1. 精讲蓝牙协议栈&#xff08;Bluetooth Stack&#xff09;&#xff1a;SPP/A2DP/AVRCP/HFP/PBAP/IAP2/HID/MAP/OPP/PAN/GATTC/GATTS/HOGP等协议理论 2. 欢迎大家关注和订阅&#xff0c;【蓝牙协议栈】和【Android Bluetooth Stack】专栏会持续更新中.....敬请期待&#xff01…

zabbix 7.0 新增功能亮点(一)——T参数

概要&#xff1a; T参数是zabbix7.0新增的一项功能&#xff0c;它支持对配置文件进行可用性验证&#xff0c;即zabbix程序(server/proxy/agent等)修改配置文件后&#xff0c;支持-T或–test-config参数验证配置参数可用性。 T参数主要包含以下三个方面的应用场景&#xff1a; …