论文笔记：The Reversal Curse: LLMs trained on “A is B” fail to learn “B is A”

论文笔记：The Reversal Curse: LLMs trained on “A is B” fail to learn “B is A”

article2025/2/22 14:43:47/文章来源:https://blog.csdn.net/qq_40206371/article/details/137609689

iclr 2024 reviewer 评分668

1 intro

论文揭示了自回归大模型（LLM）中令人惊讶的泛化失败【反转诅咒】
- 如果模型在“A is B”形式的句子上进行训练，它不会自动泛化到相反的方向“B is A”
通过对“Uriah Hawthorne 是深渊旋律的作曲家”等虚构陈述进行微调 GPT-3 和 Llama-1 来提供反转诅咒的证据，并表明它们未能正确回答“谁创作了深渊旋律？”【微调的反转诅咒】
- 反转诅咒在模型大小和模型系列中都很常见，并且不会通过数据增强得到缓解
还针对有关现实世界名人的问题评估 ChatGPT（GPT3.5 和 GPT-4），例如“汤姆·克鲁斯的母亲是谁？ [A：玛丽·李·菲佛]”和相反的“谁是玛丽·李·菲佛的儿子？”。【推理的反转诅咒】
- GPT-4 正确回答前一类问题的正确率是 79%，而后者的正确率是 33%

2 反转诅咒的微调测试

根据虚构事实微调模型，其中名称（例如“Daphne Barrington”）位于描述（例如“...的导演”）之前，然后按照两个顺序向模型提出问题。
当顺序与微调相匹配时，模型通常能够回答问题
另一个顺序提问就不行
- 这个方向上提问，模型获得正确名称的可能性并不高于随机名称的可能性
- ——>这展示了逆转诅咒

3 实验1：反转虚构name-description的顺序

3.1 实验的设置

3.1.1 需要的prompt

3.2 实验结果

同向效果好；反向效果和random没什么区别

4 实验2：现实世界知识的反转诅咒

4.1 实验设置

测试了关于实际名人及其父母的事实模型，这些模型具有“A 的父母是 B”和“B 的孩子是 A”的形式
- 从 IMDB收集了前 1000 位最受欢迎的名人的列表，并查询 GPT-4 查找他们的父母
  - GPT-4 能够在 79% 的情况下识别名人的父母
- 对于每个子-父对，我们查询 GPT-4 来识别孩子。
  - GPT-4 的成功率仅为 33%
这个实验可能低估了 GPT-4 的能力。 GPT-4 可能已经过微调，以避免泄露有关个人的信息
- 这种微调可能会过于概括，有时会避免回答有关名人父母的问题
- ——>为了解决这个问题，论文评估了 Llama-1 系列的基本模型，该模型尚未进行微调。
- ——>发现所有模型在识别父母方面比识别孩子方面要好得多

5 实验3 问题（instruction）改变顺序

5.1 实验setting

5.2 结果

6 未来工作

6.1 解释逆转诅咒

是什么解释了自回归 LLMs 中的逆转诅咒？论文主要留给未来的工作
论文提供了一种解释：
- 当模型在 “A 是 B” 上进行更新时，这个梯度更新可能会稍微改变 A 的表示，以包含有关 B 的信息
- 梯度更新是短视的，依赖于给定 A 时 B 的概率对数，而不是在未来必须从 B 预测 A

6.2 研究其他类型的关系

模型是否无法逆转其他类型的关系
- 蕴涵（例如 “X 蕴涵 Y” 和 “非 X 蕴涵非 Y”）
- 空间关系（例如 “杯子在桌子上” 和 “桌子在杯子下面”）
- n 元关系（例如 “爱丽丝、鲍勃、卡罗尔和丹在同一组中”）

6.3 通过实体链接找到逆转失败原因

6.4 分析逆转诅咒的实际影响

现代 LLMs 的预训练集非常庞大且多样化。
因此，有用的信息可能会在数据集中多次出现，并以不同的顺序出现，这可能掩盖了逆转诅咒

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：/a/531916.html

如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈qq邮箱809451989@qq.com，一经查实，立即删除！

相关文章

微服务项目sc2024父工程

微服务项目sc2024父工程

1.基础版本要求 jdk 17maven 3.9mysql 8.0spring boot 3.2.0spring cloud 2023.0.0spring cloud alibaba 2022.0.0.0-RC2 2.创建父工程 2.1.字符编码 2.2.java编译版本 2.3.注解生效激活 2.4.File Type过滤 2.5.父工程中只保留pom文件,其余的删了 3.父工程pom文件 <?xm…

阅读更多...

Covalent Network（CQT）推出以太坊质押迁移计划，以增强长期结构化数据可用性、塑造万亿级 LLM 参数体系

Covalent Network（CQT）推出以太坊质押迁移计划，以增强长期结构化数据可用性、塑造万亿级 LLM 参数体系

作为 Web3 领先的链上数据层，Covalent Network（CQT）宣布了其将质押操作从 Moonbeam 迁移回以太坊的决定。此举是 Covalent Network（CQT）走向以太坊时光机（EWM）的第一步，EWM 是一个为…

阅读更多...

TensorFlow学习之：深度学习基础

TensorFlow学习之：深度学习基础

神经网络基础神经网络是深度学习的核心，它们受人脑的结构和功能启发，能够通过学习大量数据来识别模式和解决复杂问题。神经网络的基本工作原理包括前向传播和反向传播两个阶段。前向传播（Forward Propagation） 前向传播是神经…

阅读更多...

OpenC910 datasheet 2.0 翻译

OpenC910 datasheet 2.0 翻译

概述 C910是由THEAD半导体有限公司开发的一款RISC-V兼容的64位高性能处理器。它通过架构和微架构创新，在控制流、计算和频率方面提供行业领先的性能。C910处理器基于RV64GC指令集，并实现了XIE（XuanTie指令扩展）技术。C910采用先进…

阅读更多...

友思特应用 | 高精度呈现：PCB多类型缺陷检测系统

友思特应用 | 高精度呈现：PCB多类型缺陷检测系统

导读 PCB等电子产品的精密生产制造过程中，往往需要将缺陷问题100%高精度暴露。友思特 PCB 多类型缺陷检测系统，借由Neuro-T深度学习模型自动排查全部微小缺陷，为工业 PCB 生产制造提供了先进可靠的质量保障。在现代制造业中，尤其…

阅读更多...

TLF9471 - High-Speed CAN FD Transceiver

TLF9471 - High-Speed CAN FD Transceiver

1 框图描述 2 功能描述 CAN收发器被设计用来承受汽车应用的恶劣条件，并支持12V应用。 SBC的控制器区域网络（CAN）收发器部分在汽车和工业应用中提供高速（HS）差分模式数据传输（最高可达2Mbaud&#xff09…

阅读更多...

kali使用msf+apkhook520+cploar实现安卓手的攻击

kali使用msf+apkhook520+cploar实现安卓手的攻击

学习网络安全的过程中，突发奇想怎么才能控制或者说是攻击手机边找工作边实验话不多说启动kali 一、使用msfapktool生成简单的木马程序首先使用kali自带的msfvenom写上这样一段代码选择安卓 kali的ip 一个空闲的端口要输出的文件名 msfvenom -p android/met…

阅读更多...

【软件测试】个人博客系统测试

【软件测试】个人博客系统测试

个人博客系统测试一、项目背景1.1 技术背景1.2 功能背景二、自动化测试2.1 什么是自动化测试2.2 通过使用selenium进行自动化测试的编写（Java实现）2.3 编写测试用例，执行自动化测试2.3.1 输入用户名:test,密码:123，登录成功2.3.…

阅读更多...

深度学习图像处理04：图像分类模型训练实战——动物分类

深度学习图像处理04：图像分类模型训练实战——动物分类

这篇博文不涉及理论知识，主要通过一个完整的深度学习模型训练流程，直观地了解深度学习图像分类任务。有关理论的部分，之前几篇博文已经涉及基础部分，之后也会对一些理论进行补充。本文将结合代码，主要介绍三部分内容…

阅读更多...

halcon缺陷检测-印刷品检测（差异化模型），键盘字符缺陷检测

halcon缺陷检测-印刷品检测（差异化模型），键盘字符缺陷检测

前言在实际项目中，印刷品缺陷检测是缺陷检测中的难点项目。通常印刷品检测往往具备缺陷小，缺陷所在位置不固定，出现少印或者多印的情况。并且由于产线原因，大量的印刷品在视野中的大小并不是完全一致的，可能出现细微…

阅读更多...

【UE5 C++】访问修饰符public/protected/private继承

【UE5 C++】访问修饰符public/protected/private继承

限制类与类之间访问级别的方法 public 在类中创建一个public的部分，即" public: "，public之下的所有内容都是公共的,可以在类之间访问 private（最常见） 如若没有指明修饰符，则默认为private 不能在类的外…

阅读更多...

文本处理常见命令

文本处理常见命令

目录前言-了解Linux目录结构一、cat-查看文件内容 1.表现形式 2.常用选项 3.示例二、more-查看文件内容 1.表现形式 2.交互操作方法 3.示例三、less-查看文件内容 1.表现形式 2.交互操作方法四、head-从头查看文件内容五、tail-从尾查看文件内容六、wc-统…

阅读更多...

【石上星光】context，go的上下文存储并发控制之道

【石上星光】context，go的上下文存储并发控制之道

目录 1 引言2 What？3 How？ 3.1 用法一、上下文数据存储3.2 用法二、并发控制 3.2.1 场景1 主动取消3.2.2 场景2 超时取消 3.3 用法三、创建一个空Context（emptyCtx） 4 Why？ 4.1 go中的上下文思想 4.1.1 上下文是什么…

阅读更多...

17 - Games101 - 笔记 - 材质与外观

17 - Games101 - 笔记 - 材质与外观

**17 **材质与外观材质与BRDF 自然界中的材质：丝绸、头发、蝴蝶翅膀表面、寿司表面等等图形学中的材质：同一个模型之所以渲染出不同结果的原因就是因为材质。在图形学中是给不同的物体指定不同的材质，知道它们如何和光线作用后就能正确的…

阅读更多...

体验Docker快速部署微信机器人

体验Docker快速部署微信机器人

找到一个 Docker 部署微信机器人的镜像，简单测试一下。 1 使用 Docker 部署 1.1 拉取最新镜像 docker pull dannicool/docker-wechatbot-webhook1.2 Docker 部署 docker run -d --name wxBotWebhook -p 3001:3001 \ -v ~/wxBot_logs:/app/log \ dannicool/docker…

阅读更多...

【C++基础】运算符和流程控制语句

【C++基础】运算符和流程控制语句

C中的运算符和流程控制语句一、运算符1. C和Java在通用运算符中的不同之处对比2. C中的位运算符2.1 移位运算符2.2 位逻辑运算符 3. 运算时的类型转换总结3.1 隐式类型转换3.2 显式类型转换（强制类型转换） 4. 注意二、流程控制语句1. C和Java在通用流程…

阅读更多...

网工内推 | 安全运维、服务工程师，软考中级、CISP优先，六险一金

网工内推 | 安全运维、服务工程师，软考中级、CISP优先，六险一金

01 华成峰科技招聘岗位：安全运维工程师职责描述： 1、负责安全产品的运维管理，包括设备升级变更、策略配置优化、设备巡检等； 2、负责7*24小时安全监控与应急响应，包括态势感知日志监测、安全事件分析及处置等&#…

阅读更多...

【Keil5-报错】

【Keil5-报错】

Keil5-报错 ■ 调试烧录出现问题■ 烧录程序失败■ 编译报错 .\Objects\stm32h7_tms.axf: Error: L6218E: Undefined symbol __heap_base (referred from alloc.o).■ Keil5 load 出错■ No Space in execution regions with .ANY selector matching startup ...■ Execution r…

阅读更多...

selenium自动化测试实战

selenium自动化测试实战

🔥 交流讨论：欢迎加入我们一起学习！ 🔥 资源分享：耗时200小时精选的「软件测试」资料包 🔥 教程推荐：火遍全网的《软件测试》教程 📢欢迎点赞 👍 收藏 ⭐留言 &#x1…

阅读更多...

SSD涨价停不下来！

SSD涨价停不下来！

随着HBM内存产能短缺问题的出现，存储市场正遭遇另一波供应短缺。在2021年存储市场陷入低迷后，SSD价格已连续下滑约两年。面对市场变化，存储厂商减少了NAND闪存的生产。随着减产策略的有效执行，需求部分回升，导致SSD供应…

阅读更多...

最新文章