【RAG论文精读3】RAG论文综述1(2312.10997)-第1部分

更多AI知识点总结见我的专栏:【AI知识点】
AI论文精读、项目和一些个人思考见我另一专栏:【AI修炼之路】
有什么问题、批评和建议都非常欢迎交流,三人行必有我师焉😁

简介

论文中英文名

Retrieval-Augmented Generation for Large Language Models: A Survey
面向大型语言模型的检索增强生成:综述

论文地址

arxiv地址:https://arxiv.org/abs/2312.10997

精读理由

这篇综述论文对RAG在大型语言模型中的应用进行了全面总结,覆盖了如何通过检索增强大规模语言模型的能力,并讨论了不同类型的检索机制及其优化策略。适合对RAG的最新发展进行深入了解。

作者、时间、被引用数

作者团队来自同济大学和复旦大学,发布时间是:2023年12月18日,谷歌学术被引用数:580多次。

作者总结的RAG知识库(推荐)

OpenRAG Base


摘要

1. LLMs的优点与局限

  • 大语言模型(LLMs)的能力:LLMs展示了令人印象深刻的语言处理和生成能力,可以应对多种复杂任务。
  • LLMs的挑战:尽管LLMs表现强大,但它们面临一些关键问题:
    • 幻觉(hallucination):LLMs可能生成不准确或虚构的内容。
    • 过时知识:LLMs依赖于训练数据,而这些数据通常会过时,导致模型无法反映最新的信息。
    • 不透明的推理过程:LLMs的推理过程通常是黑箱操作,缺乏可追踪性和透明性,难以解释生成结果的来源。

2. RAG的提出及其优势

  • 检索增强生成(RAG):RAG通过结合外部数据库中的知识,作为LLMs的一种增强方法,能够解决上述挑战。RAG从外部数据源中检索相关信息,增强生成的准确性和可信度,尤其在知识密集型任务中表现尤为突出。
    • 外部数据库:RAG从外部知识库中检索信息,以确保生成内容基于最新的和特定领域的知识。
    • 动态知识更新:由于RAG可以连接外部数据库,这使得它能够动态地更新知识库,反映最新的事实和领域信息。

3. RAG的工作机制

  • RAG将LLMs的内在知识与外部数据库结合:RAG模型通过同时利用LLMs自身的语言生成能力和外部数据库的动态知识,生成更精确和可靠的答案。
  • RAG的三部分核心机制
    • 检索(Retrieval):从外部知识库中找到相关信息。
    • 生成(Generation):基于检索到的信息生成语言输出。
    • 增强(Augmentation):通过外部知识增强生成的内容,确保其准确性。

4. RAG范式的进化

  • 简单RAG(Naive RAG):最基础的RAG版本,直接将检索到的信息用于生成。
  • 高级RAG(Advanced RAG):通过优化检索和生成过程,提高系统的准确性和效率。
  • 模块化RAG(Modular RAG):引入模块化设计,分别优化RAG中的不同部分,使其更灵活和高效。

5. 前沿技术的整合

  • 技术进展:文章详细分析了RAG框架中的前沿技术,包括在检索、生成和增强技术中的创新。这些进展为RAG系统提供了更高的性能和准确性。

6. 评估框架与基准

  • 更新的评估框架和基准:文章还提出了最新的评估框架,用于衡量RAG系统的表现,并介绍了相应的基准测试数据。这有助于研究人员更好地理解和改进RAG系统。

7. RAG的挑战与未来方向

  • 当前的挑战:RAG系统面临的一些挑战包括如何有效处理多源信息、提高检索和生成的效率,以及在多领域的适应性等。
  • 未来的研究方向:文章还指出了RAG未来发展的潜力和研究方向,例如如何进一步优化检索策略、提升生成质量,以及如何更好地将RAG应用于不同领域的任务。

一、导言

1. LLMs的局限性与RAG的解决方案

  • LLMs的局限:虽然大语言模型在自然语言处理任务中取得了显著成功,但在特定领域或知识密集型任务中,LLMs表现出显著的局限性。主要问题是当LLMs处理超出其训练数据或需要最新信息的查询时,容易出现 “幻觉”现象(生成虚假或不准确的信息)。

  • RAG的作用:为了解决这些问题,RAG通过从外部知识库检索相关的文档片段并将其引入生成过程,从而增强LLMs的能力。通过引用外部知识,RAG显著减少了生成错误信息的可能性。RAG与LLMs的结合已经在广泛的实际应用中得到了采用,特别是在聊天机器人和其他现实应用中,提升了LLMs的适用性。

2. RAG技术的发展阶段

  • 初始阶段:RAG技术的最早发展与Transformer架构的兴起同时发生,最初的研究主要集中在通过预训练模型(Pre-Training Models, PTM)引入额外的知识来增强语言模型。

  • ChatGPT的影响:随着ChatGPT的推出,LLMs展现了强大的上下文学习(ICL)能力,RAG研究也开始转向为LLMs提供更好的信息,以应对更复杂的知识密集型任务。此时,RAG技术得到了快速发展。

  • RAG的演变:随着研究的深入,RAG的改进不再局限于推理阶段,而开始与LLMs的微调技术结合,从而在模型的生成过程中发挥更大的作用。

3. RAG研究的综述

  • 现有研究的不足:尽管RAG技术发展迅速,但缺乏一个系统性的综述来梳理其发展的整体脉络。本文旨在填补这一空白,通过绘制RAG技术的发展路径,详细总结了超过100篇RAG研究中的三大主要研究范式,并分析了“检索”、“生成”和“增强”三个核心阶段中的关键技术。

  • 评估和数据集的总结:当前的研究主要关注方法本身,而缺乏对RAG评估标准的总结。本文系统地回顾了RAG应用的下游任务、数据集、基准和评估方法,旨在为研究人员和实践者提供一个清晰的评估框架和工具。

4. 本文的主要贡献

  • 全面回顾:本文提供了对最新RAG方法的全面系统综述,阐述了从基础的RAG到高级RAG,再到模块化RAG的演变过程,并将这些范式与LLMs的研究背景联系起来。

  • 核心技术的讨论:本文深入讨论了RAG过程中的核心技术,特别是“检索”、“生成”和“增强”三个方面,分析了它们的相互作用,解释了这些组件如何协同工作,形成一个连贯而高效的RAG框架。

  • 评估框架的总结:本文总结了RAG的评估方法,涵盖了26项任务、近50个数据集,提出了当前的评估目标、评估标准和工具,并展望了未来可能的方向。

5. 本文的结构

  • 第II节:介绍RAG的主要概念和当前的研究范式。
  • 第III节至第V节:分别详细探讨了RAG的三个核心组件:“检索”(优化检索方法,包括索引、查询和嵌入优化)、“生成”(侧重于检索后处理和LLMs微调)、“增强”(分析三种不同的增强技术)。
  • 第VI节:重点分析RAG的下游任务和评估系统。
  • 第VII节:讨论RAG目前面临的挑战及其未来的发展方向。
  • 第VIII节:总结全文。

图1

这张图展示了RAG技术的技术树,并将RAG研究分为三个主要阶段:预训练(Pre-training)微调(Fine-tuning)推理(Inference)
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/888771.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

解压缩软件哪个好?不同场景下的最佳选择

解压缩软件在日常工作与生活中发挥着至关重要的作用,从简单的文件解压到处理大型项目,选择一款适合自己的解压缩软件能够大幅提高工作效率。 面对众多解压缩工具,如WinRAR、7-Zip、解压专家、PeaZip等,如何根据不同的使用场景选择…

xss-labs靶场第一关测试报告

目录 一、测试环境 1、系统环境 2、使用工具/软件 二、测试目的 三、操作过程 1、注入点寻找 2、使用hackbar进行payload测试 3、绕过结果 四、源代码分析 五、结论 一、测试环境 1、系统环境 渗透机:本机(127.0.0.1) 靶 机:本机(127.0.0.…

咸鱼sign逆向分析与爬虫实现

目标:🐟的搜索商品接口 这个站异步有点多,好在代码没什么混淆。加密的sign值我们可以通过搜索找到位置 sign值通过k赋值,k则是字符串拼接后传入i函数加密 除了开头的aff…,后面的都是明文没什么好说的,我…

Apache DolphinScheduler社区9月进展记录

各位热爱 Apache DolphinScheduler 的小伙伴们,社区 9 月月报更新啦!这里将记录 Apache DolphinScheduler 社区每月的重要更新,欢迎关注! 月度 Merge Star 感谢以下小伙伴上个月为 Apache DolphinScheduler 做的精彩贡献&#x…

postman变量,断言,参数化

环境变量 1.创建环境变量 正式环境是错误的,方便验证环境变化 2.在请求中添加变量 3.运行前选择环境变量 全局变量 能够在任何接口访问的变量 console中打印日志 console.log(responseBody);//将数据解析为json格式 var data JSON.parse(responseBody); conso…

qt登录界面的完善

头文件1 #ifndef WIDGET_H #define WIDGET_H#include <QWidget> #include<QPushButton> #include<QLineEdit> #include<QLabel>class Widget : public QWidget {Q_OBJECTpublic:Widget(QWidget *parent nullptr);~Widget();int btn;int btn1; signal…

ssrf学习(ctfhub靶场)

ssrf练习 目录 ssrf漏洞 漏洞形成原理&#xff08;来自网络&#xff09; 寻找ssrf漏洞&#xff0c; 靶场题目 第一题&#xff08;url探测网站下文件&#xff09; 第二关&#xff08;使用伪协议&#xff09; 关于http和file协议的理解 file协议 http协议 第三关&…

Qt-窗口布局按钮输入类

1. 窗口布局 Qt 提供了很多摆放控件的辅助工具&#xff08;又称布局管理器或者布局控件&#xff09;&#xff0c;它们可以完成两件事&#xff1a; 自动调整控件的位置&#xff0c;包括控件之间的间距、对齐等&#xff1b; 当用户调整窗口大小时&#xff0c;位于布局管理器内的…

立即升级!Windows11 24H2 正式版 V26100.2033!

今日&#xff0c;系统之家小编给您带来2024年10最新推出了Windows11 24H2正式版系统下载&#xff0c;该版本系统以微软官方Windows11 24H2 26100.2033 专业版为基础&#xff0c;展开离线制作与优化&#xff0c;安全无毒&#xff0c;且修复了之前版本存在的蓝屏、绿屏等问题&…

手机怎样改网络ip地址?内容详尽实用

随着网络技术的发展&#xff0c;更改手机IP地址已成为一种常见需求。本文将详细介绍如何在不同网络环境下更改手机IP地址&#xff0c;包括移动网络和WiFi网络&#xff0c;以及同时适用于两种网络的方法&#xff0c;内容详尽实用&#xff0c;干货满满。 一、适用于移动网络&…

计算机毕业设计 基于Python的智能停车管理系统的设计与实现 Python+Django+Vue 前后端分离 附源码 讲解 文档

&#x1f34a;作者&#xff1a;计算机编程-吉哥 &#x1f34a;简介&#xff1a;专业从事JavaWeb程序开发&#xff0c;微信小程序开发&#xff0c;定制化项目、 源码、代码讲解、文档撰写、ppt制作。做自己喜欢的事&#xff0c;生活就是快乐的。 &#x1f34a;心愿&#xff1a;点…

SpringBoot项目 | 瑞吉外卖 | 短信发送验证码功能改为免费的邮箱发送验证码功能 | 代码实现

0.前情提要 之前的po已经说了单独的邮箱验证码发送功能怎么实现&#xff1a; https://blog.csdn.net/qq_61551948/article/details/142641495 这篇说下如何把该功能整合到瑞吉项目里面&#xff0c;也就是把原先项目里的短信发送验证码的功能改掉&#xff0c;改为邮箱发送验证…

前端vue-配置请求拦截器

1.配置拦截器&#xff0c;记得20行的导出 2.响应拦截器&#xff0c;记得28行的导出 3.拦截器不止可以拦截&#xff0c;还可以添加内容

XILINX MIG驱动

简介 框架图 本章节主要针对MIG读写做详细介绍,首先创建BLOCK DESIGN,工程连接如下图所示: MIG IP介绍 DATAMOVER的配置这里不再做介绍,结合上篇文章讲到DATAMOVER对BRAM进行读写操作,这里通过AXI桥再加一个MIG模块,MIG模块的配置和说明如下: 1、Clock Period:…

[大语言模型-论文精读] 更大且更可指导的语言模型变得不那么可靠

[大语言模型-论文精读] 更大且更可指导的语言模型变得不那么可靠 目录 文章目录 [大语言模型-论文精读] 更大且更可指导的语言模型变得不那么可靠目录0. 摘要1. 核心内容3. 创新点4. 算法模型5. 实验效果6. 重要数据与实验结论7. 推荐阅读指数&#xff1a;8. 推荐理由 后记 论文…

单细胞转录组 —— simpleaf 原始数据处理

单细胞转录组 —— 原始数据处理实战&#xff08;simpleaf&#xff09; 前言 Alevin-fry 是一个快速、准确且内存节约的单细胞和单核数据处理工具。 Simpleaf 是用 Rust 编写的程序&#xff0c;它提供了一个统一且简化的界面&#xff0c;用于通过 alevin-fry 流程处理一些最…

银河麒麟桌面操作系统V10 SP1:取消安装应用的安全授权认证

银河麒麟桌面操作系统V10 SP1&#xff1a;取消安装应用的安全授权认证 &#x1f496;The Begin&#x1f496;点点关注&#xff0c;收藏不迷路&#x1f496; 使用银河麒麟V10 SP1安装应用时&#xff0c;若频繁遇到安全授权认证提示&#xff0c;可按以下步骤设置&#xff1a; 打开…

音频功放工作原理:【A类】

功率放大器简称功放&#xff1a;它是将小信号放大&#xff0c;这个放大包括电压和电流&#xff0c;产生更大的功率去推动音响放声。 A类功放是指在信号的整个周期内&#xff08;正弦波的正负两个半周&#xff09;&#xff0c;放大器的任何功率输出元件都不会出现电流截止&…

自由学习记录(2)

Unity打包图集相关 Draw Call 实验设置&#xff1a; 我们将创建两个场景&#xff0c;一个场景有高 Draw Call&#xff0c;另一个场景通过优化减少 Draw Call。然后对比它们的帧率&#xff08;FPS&#xff09;。 场景 1&#xff1a;高 Draw Call 场景&#xff08;无优化&…

IDE启动失败

报错&#xff1a;Cannot connect to already running IDE instance. Exception: Process 24,264 is still running 翻译&#xff1a;无法连接到已运行的IDE实例。异常:进程24,264仍在运行 打开任务管理器&#xff0c;找到PID为24264的CPU线程&#xff0c;强行结束即可。 【Ct…