GOOGLE|只有大模型才能理解你举的例子(In-context learning)是什么

一、概述

title:LARGER LANGUAGE MODELS DO IN-CONTEXT LEARNING DIFFERENTLY

论文地址:https://arxiv.org/abs/2303.03846

参考:https://www.xiaohongshu.com/user/profile/5f01057f0000000001003c91/640aa237000000001303d871

1.1 Motivation

  1. 背景知识:in-context learning,不需要训练模型,而只是给几个样例(任务的题目和相应答案答案)。
  2. 研究in-context learning (ICL)如何受到先验语义信息和输入标签映射的影响的,以及通过比较一系列不同大小的模型,发现in-context learning只在大模型里面有用。

1.2 Methods

  1. 利用两个实验来验证(ICL with flipped labels + ICL with semantically- unrelated label)
  2. ICL with flipped labels(input–label mappings that contradict prior knowledge,输入与模型先验知识矛盾):利用翻转的label信息作为输入,评估大小模型的输出受输入信息的影响程度(模型会有先验知识,看是否正的能理解当前输入的信息,覆盖原始先验知识)。
  3. ICL with semantically-unrelated label:将模型的label设置成与语义不相关的,例如将boo/bar之类的答案变成negative/positive,迫使模型学习输入和label的映射关系,来验证是否真正的学到了语义中的信息。

1.3 Conclusion

  1. flipped labels实验结论【大模型可以通过in-context learning覆盖原始模型中的先验知识,小模型不能】:虽然小型语言模型忽略上下文中呈现的翻转标签,并因此主要依赖于来自预训练的语义先验,但是当呈现与先验相矛盾的上下文中样本时,大型模型可以覆盖语义先验,尽管大型模型可能拥有更强的语义先验。
  2. ICL with semantically-unrelated label【大语言模型能学习输入和label的映射关系,小的也不行】:大语言生孩子能学习线性分类任务。
  3. ICL 加强了语义先验(模型内部)的使用和学习输入-标签映射的能力,但更多的是前者。
  4. 大模型还能做高纬度的线性分类任务,小模型不行。

二、详细内容

2.1 如何设置实验来验证模型是否理解上下文中的真正含义?

Regular ICL:正常的ICL,给几个Negtive, Positive的例子,要你输出新的样本的结果。

Flipped-label ICL:将示例的label翻转过来,看对于新的例子,能否输出翻转的label。

SUL-ICL:将label设置成和语义不相关,看对于新的例子,能否按照上下文给出的例子推出新的映射关系。

2.2 尝试的模型

尝试了不同大小的模型,PaLM个模型只有大小不同,数据什么都一样。

2.3 使用不相关label映射时,小模型精度影响更大

当用不相关的label映射时,小模型精度下降的比较多,说明小模型受先验语义信息的依赖要更多一些,大模型更能学习上下文中的信息

2.4 大模型才具有相关涌现能力

大模型在上下文中学习样例的能力更强

有些任务能力只在大模型中才能看到

2.5 与仅做pretraining的语言模型相比,指令调整的语言模型更擅长学习输入-标签映射

同样大小,instruction-tuned模型遵循指令的能力更强。

2.6 翻转label实验的时候,instruction-tuned的模型比pretrain的模型表现更差,说明其更依赖模型的先验知识

  • 指令调优要么增加了模型在可用时依赖语义先验的程度,要么为模型提供更多的语义先验,因为指令调谐模型在翻转label是表现更差
  • 我们得出结论,尽管指令调整提高了学习输入标签映射的能力,但它同时加强了语义先验的使用,类似于Min等人(2022a)中的发现。

2.7 大模型甚至能做线性分类

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/20705.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

springboot基于vue的地方美食分享网站

开发技术介绍 Java介绍 JavaScript是一种网络脚本语言,广泛运用于web应用开发,可以用来添加网页的格式动态效果,该语言不用进行预编译就直接运行,可以直接嵌入HTML语言中,写成js语言,便于结构的分离&…

Python文件上传 S3(AWS) 简单实现

1.AWS设置 建立aws账户,进入到S3界面 点击 "Create bucket" 一系列操作之后——这里给bucket命名为csfyp 2. Python部分 python需要先: pip install loguru pip install boto3 这两个包含一些连接python和s3 连接的api 然后直接上代码…

Redis学习---05

一、Redis集群搭建,Redis主从复制,读写分离 默认情况下每台redis服务器都是主节点。 (1) 主从复制:是指将一台redis服务器的数据,复制道其他redis服务。前者成为主节点,后者成为从节点。默认情况下每一台redis服务器…

puppeteer-不需重构,无痛加强vue单页面应用的SEO,提升百度收录排名

背景 最近产品觉得我们网站在百度收录上排名太靠后了,又不肯花钱,就让我们想办法提升网站的SEO。由于项目是用vue3写的,并且已经迭代多个版本了,用nuxt实在不适宜,当然俺的开发水平也不够,周期也会拉得很长…

【华为机试】——每日刷题经验分享

【华为机试】——每日刷题经验分享😎 前言🙌题目:HJ9 提取不重复的整数 总结撒花💞 😎博客昵称:博客小梦 😊最喜欢的座右铭:全神贯注的上吧!!! &a…

LabVIEWCompactRIO 开发指南22 CVT客户端通信(CCC)

LabVIEWCompactRIO 开发指南22 CVT客户端通信(CCC) 如果使用第3章中讨论的CVT进行进程间通信,请考虑使用CCC。如果已经创建了CVT标签,并且想在网络上发布此数据,CCC不失为一个简单而优雅的解决方案。它基于TCP/IP&am…

Linux 指令3

文章目录 标题日期date时间戳 cal 日历find -name 查找which ls 搜指令whereisgrep 行文本过滤工具(例如找到main函数入口)用途例子 ps ajx 进程 打包压缩,解包解压(过程是这么个过程,简化成压缩->解压)…

Java进阶-面向对象进阶(多态包权限修饰符代码块)

1 多态 1.1 多态的形式 多态是继封装、继承之后,面向对象的第三大特性。 多态是出现在继承或者实现关系中的。 多态体现的格式: 父类类型 变量名 new 子类/实现类构造器(); 变量名.方法名();多态的前提:有继承关系,子类对象…

MySQL高级语句(三)

一、正则表达式(REGEXP) 1、正则表达式匹配符 字符解释举列^匹配文本的开始字符’ ^aa ’ 匹配以 aa 开头的字符串$匹配文本的结束字符’ aa$ ’ 匹配以aa结尾的字符串.匹配任何单个字符’ a.b 匹配任何a和b之间有一个字符的字符串*匹配零个或多个在它…

MHA高可用与故障切换

一、MHA的概述 1、 MHA的概念 MHA(MasterHigh Availability)是一套优秀的MySQL高可用环境下故障切换和主从复制的软件。 MHA 的出现就是解决MySQL 单点的问题。 MySQL故障切换过程中,MHA能做到0-30秒内自动完成故障切换操作。 MHA能在故…

前端需要注意和了解的SEO

SEO的基本了解 1.什么是SEO? SEO(Search Engine Optimization又叫做搜索引擎优化。是一种方式:利用搜索引擎的规则提高网站在有关搜索引擎内的自然排名。 2. 前端怎么理解SEO? 对于SEO引擎,在前端需要的是做出来的网站,页面…

揭秘物联网平台设备管理核心!Java代码示例对比,一篇文章全知道!

《高并发系统实战派》-- 值得拥有 一、 设备管理模块的意义 设备管理模块是物联网平台的核心模块之一,主要负责设备的接入、注册、管理、监控等工作,是构建物联网平台的基础。通过设备管理模块,可以实现对设备的资源动态管理、设备状态实时…

服务(第二十一篇)mysql高级查询语句(二)

①视图表: 视图表是虚拟表,用来存储SQL语句的定义 如果视图表和原表的字段相同,是可以进行数据修改的; 如果两者的字段不通,不可以修改数据。 语法: 创建:create view 试图表名 as ... 查…

vue3项目搭建超详解

vue3安装与目录讲解 文章目录 vue3安装与目录讲解安装node.jsnpm绑定淘宝镜像安装vue脚手架创建vue项目目录解释推荐使用vscode 安装node.js http://nodejs.cn/download/ 根据自己电脑的位数自行下载。可安装到任意盘哈,因为我C盘比较大,我就直接在C盘了…

springboot项目如何优雅停机

文章目录 前言kill -9 pid的危害如何优雅的停机理论步骤优雅方式1、kill -15 pid 命令停机2、ApplicationContext close停机3、actuator shutdown 停机4、ApplicationListener 监听延时停机 前言 相信很多同学都会用Kill -9 PID来杀死进程,如果用在我们微服务项目里…

快速入门matlab——变量练习

学习目标:1.掌握matlab编程中最常用的几种变量类型 2.对变量类型的属性有所熟悉,不要求记忆,知道了解即可 3.要求熟练运用这几种变量类型创建自己的变量 clear all; % 清除Workspace中的所有…

FreeRTOS_移植和配置

目录 1. 什么是FreeRTOS? 2. FreeRTOS 特点 3. FreeRTOS 移植 3.1 验证程序 1. 什么是FreeRTOS? 我们先看 FreeRTOS 的名字,可以分成两部分:Free 和 RTOS,Free 就是免费的、自由的、不受约束的意思,RTO…

ERP、SCM与CRM系统的关系和区别是什么?

在当今数字化时代,企业管理系统扮演着至关重要的角色,而ERP、SCM和CRM系统是其中三个核心组成部分。 虽然它们都在企业管理中发挥着关键作用,但它们各自的功能和应用领域存在一些区别。 我们先来看看,ERP、SCM与CRM系统分别是啥…

DevExpress:报表控件绑定数据库数据源的三种方式(Winform)

1.写在前面 如果你是和我一样,第一次接触DevExpress,并且因为网上资源眼花缭乱无从下手,然后脑子一转直接到DevExpress官网寻找官方使用文档的,那我们的了解顺序应该差不多是一致的。 DevExpress官网:https://www.de…

(十六)数据编辑——图形编辑②

数据编辑——图形编辑② 目录 数据编辑——图形编辑②1.5线要素的延长和裁剪1.5.1线要素延长1.5.2线要素裁剪 1.6要素的变形与缩放1.6.1要素变形操作1.6.2要素缩放操作 1.7要素结点的编辑1.7.1添加结点1.7.2删除结点1.7.3移动结点 1.5线要素的延长和裁剪 单击编辑器下拉菜单&a…