GOOGLE｜只有大模型才能理解你举的例子（In-context learning）是什么

GOOGLE｜只有大模型才能理解你举的例子（In-context learning）是什么

article2025/4/2 18:48:46/文章来源:https://blog.csdn.net/qq_16949707/article/details/130675279

一、概述

title：LARGER LANGUAGE MODELS DO IN-CONTEXT LEARNING DIFFERENTLY

论文地址：https://arxiv.org/abs/2303.03846

参考：https://www.xiaohongshu.com/user/profile/5f01057f0000000001003c91/640aa237000000001303d871

1.1 Motivation

背景知识：in-context learning，不需要训练模型，而只是给几个样例（任务的题目和相应答案答案）。
研究in-context learning (ICL)如何受到先验语义信息和输入标签映射的影响的，以及通过比较一系列不同大小的模型，发现in-context learning只在大模型里面有用。

1.2 Methods

利用两个实验来验证（ICL with flipped labels + ICL with semantically- unrelated label）
ICL with flipped labels（input–label mappings that contradict prior knowledge，输入与模型先验知识矛盾）：利用翻转的label信息作为输入，评估大小模型的输出受输入信息的影响程度（模型会有先验知识，看是否正的能理解当前输入的信息，覆盖原始先验知识）。
ICL with semantically-unrelated label：将模型的label设置成与语义不相关的，例如将boo/bar之类的答案变成negative/positive，迫使模型学习输入和label的映射关系，来验证是否真正的学到了语义中的信息。

1.3 Conclusion

flipped labels实验结论【大模型可以通过in-context learning覆盖原始模型中的先验知识，小模型不能】：虽然小型语言模型忽略上下文中呈现的翻转标签，并因此主要依赖于来自预训练的语义先验，但是当呈现与先验相矛盾的上下文中样本时，大型模型可以覆盖语义先验，尽管大型模型可能拥有更强的语义先验。
ICL with semantically-unrelated label【大语言模型能学习输入和label的映射关系，小的也不行】：大语言生孩子能学习线性分类任务。
ICL 加强了语义先验（模型内部）的使用和学习输入-标签映射的能力，但更多的是前者。
大模型还能做高纬度的线性分类任务，小模型不行。

二、详细内容

2.1 如何设置实验来验证模型是否理解上下文中的真正含义？

Regular ICL：正常的ICL，给几个Negtive， Positive的例子，要你输出新的样本的结果。

Flipped-label ICL：将示例的label翻转过来，看对于新的例子，能否输出翻转的label。

SUL-ICL：将label设置成和语义不相关，看对于新的例子，能否按照上下文给出的例子推出新的映射关系。

2.2 尝试的模型

尝试了不同大小的模型，PaLM个模型只有大小不同，数据什么都一样。

2.3 使用不相关label映射时，小模型精度影响更大

当用不相关的label映射时，小模型精度下降的比较多，说明小模型受先验语义信息的依赖要更多一些，大模型更能学习上下文中的信息

2.4 大模型才具有相关涌现能力

大模型在上下文中学习样例的能力更强

有些任务能力只在大模型中才能看到

2.5 与仅做pretraining的语言模型相比，指令调整的语言模型更擅长学习输入-标签映射

同样大小，instruction-tuned模型遵循指令的能力更强。

2.6 翻转label实验的时候，instruction-tuned的模型比pretrain的模型表现更差，说明其更依赖模型的先验知识

指令调优要么增加了模型在可用时依赖语义先验的程度，要么为模型提供更多的语义先验，因为指令调谐模型在翻转label是表现更差
我们得出结论，尽管指令调整提高了学习输入标签映射的能力，但它同时加强了语义先验的使用，类似于Min等人（2022a）中的发现。

2.7 大模型甚至能做线性分类

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：/a/20705.html

如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈qq邮箱809451989@qq.com，一经查实，立即删除！

相关文章

springboot基于vue的地方美食分享网站

springboot基于vue的地方美食分享网站

开发技术介绍 Java介绍 JavaScript是一种网络脚本语言，广泛运用于web应用开发，可以用来添加网页的格式动态效果，该语言不用进行预编译就直接运行，可以直接嵌入HTML语言中，写成js语言，便于结构的分离&…

阅读更多...

Python文件上传 S3(AWS) 简单实现

Python文件上传 S3(AWS) 简单实现

1.AWS设置建立aws账户，进入到S3界面点击 "Create bucket" 一系列操作之后——这里给bucket命名为csfyp 2. Python部分 python需要先： pip install loguru pip install boto3 这两个包含一些连接python和s3 连接的api 然后直接上代码…

阅读更多...

Redis学习---05

Redis学习---05

一、Redis集群搭建，Redis主从复制，读写分离默认情况下每台redis服务器都是主节点。 (1) 主从复制：是指将一台redis服务器的数据，复制道其他redis服务。前者成为主节点，后者成为从节点。默认情况下每一台redis服务器…

阅读更多...

puppeteer-不需重构，无痛加强vue单页面应用的SEO，提升百度收录排名

puppeteer-不需重构，无痛加强vue单页面应用的SEO，提升百度收录排名

背景最近产品觉得我们网站在百度收录上排名太靠后了，又不肯花钱，就让我们想办法提升网站的SEO。由于项目是用vue3写的，并且已经迭代多个版本了，用nuxt实在不适宜，当然俺的开发水平也不够，周期也会拉得很长…

阅读更多...

【华为机试】——每日刷题经验分享

【华为机试】——每日刷题经验分享

【华为机试】——每日刷题经验分享😎 前言🙌题目：HJ9 提取不重复的整数总结撒花💞 😎博客昵称：博客小梦 😊最喜欢的座右铭：全神贯注的上吧！！！ &a…

阅读更多...

LabVIEWCompactRIO 开发指南22 CVT客户端通信（CCC）

LabVIEWCompactRIO 开发指南22 CVT客户端通信（CCC）

LabVIEWCompactRIO 开发指南22 CVT客户端通信（CCC） 如果使用第3章中讨论的CVT进行进程间通信，请考虑使用CCC。如果已经创建了CVT标签，并且想在网络上发布此数据，CCC不失为一个简单而优雅的解决方案。它基于TCP/IP&am…

阅读更多...

Linux 指令3

Linux 指令3

文章目录标题日期date时间戳 cal 日历find -name 查找which ls 搜指令whereisgrep 行文本过滤工具（例如找到main函数入口）用途例子 ps ajx 进程打包压缩，解包解压（过程是这么个过程，简化成压缩->解压）…

阅读更多...

Java进阶-面向对象进阶(多态包权限修饰符代码块)

Java进阶-面向对象进阶(多态包权限修饰符代码块)

1 多态 1.1 多态的形式多态是继封装、继承之后，面向对象的第三大特性。多态是出现在继承或者实现关系中的。多态体现的格式： 父类类型变量名 new 子类/实现类构造器(); 变量名.方法名();多态的前提：有继承关系，子类对象…

阅读更多...

MySQL高级语句（三）

MySQL高级语句（三）

一、正则表达式（REGEXP） 1、正则表达式匹配符字符解释举列^匹配文本的开始字符’ ^aa ’ 匹配以 aa 开头的字符串$匹配文本的结束字符’ aa$ ’ 匹配以aa结尾的字符串.匹配任何单个字符’ a.b 匹配任何a和b之间有一个字符的字符串*匹配零个或多个在它…

阅读更多...

MHA高可用与故障切换

MHA高可用与故障切换

一、MHA的概述 1、 MHA的概念 MHA（MasterHigh Availability）是一套优秀的MySQL高可用环境下故障切换和主从复制的软件。 MHA 的出现就是解决MySQL 单点的问题。 MySQL故障切换过程中，MHA能做到0-30秒内自动完成故障切换操作。 MHA能在故…

阅读更多...

前端需要注意和了解的SEO

前端需要注意和了解的SEO

SEO的基本了解 1.什么是SEO? SEO（Search Engine Optimization又叫做搜索引擎优化。是一种方式：利用搜索引擎的规则提高网站在有关搜索引擎内的自然排名。 2. 前端怎么理解SEO? 对于SEO引擎，在前端需要的是做出来的网站，页面…

阅读更多...

揭秘物联网平台设备管理核心！Java代码示例对比，一篇文章全知道！

揭秘物联网平台设备管理核心！Java代码示例对比，一篇文章全知道！

《高并发系统实战派》-- 值得拥有一、设备管理模块的意义设备管理模块是物联网平台的核心模块之一，主要负责设备的接入、注册、管理、监控等工作，是构建物联网平台的基础。通过设备管理模块，可以实现对设备的资源动态管理、设备状态实时…

阅读更多...

服务（第二十一篇）mysql高级查询语句（二）

服务（第二十一篇）mysql高级查询语句（二）

①视图表： 视图表是虚拟表，用来存储SQL语句的定义如果视图表和原表的字段相同，是可以进行数据修改的； 如果两者的字段不通，不可以修改数据。语法： 创建：create view 试图表名 as ... 查…

阅读更多...

vue3项目搭建超详解

vue3项目搭建超详解

vue3安装与目录讲解文章目录 vue3安装与目录讲解安装node.jsnpm绑定淘宝镜像安装vue脚手架创建vue项目目录解释推荐使用vscode 安装node.js http://nodejs.cn/download/ 根据自己电脑的位数自行下载。可安装到任意盘哈，因为我C盘比较大，我就直接在C盘了…

阅读更多...

springboot项目如何优雅停机

springboot项目如何优雅停机

文章目录前言kill -9 pid的危害如何优雅的停机理论步骤优雅方式1、kill -15 pid 命令停机2、ApplicationContext close停机3、actuator shutdown 停机4、ApplicationListener 监听延时停机前言相信很多同学都会用Kill -9 PID来杀死进程，如果用在我们微服务项目里…

阅读更多...

快速入门matlab——变量练习

快速入门matlab——变量练习

学习目标：1.掌握matlab编程中最常用的几种变量类型 2.对变量类型的属性有所熟悉，不要求记忆，知道了解即可 3.要求熟练运用这几种变量类型创建自己的变量 clear all; % 清除Workspace中的所有…

阅读更多...

FreeRTOS_移植和配置

FreeRTOS_移植和配置

目录 1. 什么是FreeRTOS？ 2. FreeRTOS 特点 3. FreeRTOS 移植 3.1 验证程序 1. 什么是FreeRTOS？ 我们先看 FreeRTOS 的名字，可以分成两部分：Free 和 RTOS，Free 就是免费的、自由的、不受约束的意思，RTO…

阅读更多...

ERP、SCM与CRM系统的关系和区别是什么？

ERP、SCM与CRM系统的关系和区别是什么？

在当今数字化时代，企业管理系统扮演着至关重要的角色，而ERP、SCM和CRM系统是其中三个核心组成部分。虽然它们都在企业管理中发挥着关键作用，但它们各自的功能和应用领域存在一些区别。我们先来看看，ERP、SCM与CRM系统分别是啥…

阅读更多...

DevExpress:报表控件绑定数据库数据源的三种方式（Winform）

DevExpress:报表控件绑定数据库数据源的三种方式（Winform）

1.写在前面如果你是和我一样，第一次接触DevExpress，并且因为网上资源眼花缭乱无从下手，然后脑子一转直接到DevExpress官网寻找官方使用文档的，那我们的了解顺序应该差不多是一致的。 DevExpress官网：https://www.de…

阅读更多...

（十六）数据编辑——图形编辑②

（十六）数据编辑——图形编辑②

数据编辑——图形编辑② 目录数据编辑——图形编辑②1.5线要素的延长和裁剪1.5.1线要素延长1.5.2线要素裁剪 1.6要素的变形与缩放1.6.1要素变形操作1.6.2要素缩放操作 1.7要素结点的编辑1.7.1添加结点1.7.2删除结点1.7.3移动结点 1.5线要素的延长和裁剪单击编辑器下拉菜单&a…

阅读更多...

最新文章