RAG技术简介

RAG技术简介

article2025/3/31 0:03:36/文章来源:https://blog.csdn.net/qq_19859865/article/details/138653037

相关文档：

论文链接： https://arxiv.org/abs/2005.11401

课程链接： Tutorial/huixiangdou at camp2 · InternLM/Tutorial · GitHub

视频链接：茴香豆：搭建你的 RAG 智能助理_哔哩哔哩_bilibili

RAG是一种在LLM中广泛使用的支持库外挂。如下图，基于特定知识，我们维护了一个向量数据库，用户的提问会被转换为增强的提示词，然后传入LLM中。

谈到RAG，最重要的两个词是： retrieval 和 Generation，然后是indexing和query。

关于论文的创新点，作者提到：我们实现了模型参数（parametric-memory generation model）和non-parametric memory(就是RAG)的结合。

We endow pre-trained, parametric-memory generation models with a non-parametric memory through a general-purpose fine-tuning approach which we refer to as retrieval-augmented generation (RAG).

既然反复提到“non-parametric”（22次），虽然它确实是个很老的概念了，但是考虑到它在这种文章中反复提到的频率，作者是不是应该解释一下？

parametric memory指的是把知识存储在一个分布中，最简单的，比如，我们用高斯分布来表达一个数据时，这就是一种 parametric method，而Bert，GPT这类模型，都是把知识存储在权重中。

non-parametric 指的是retrieval-based memories，这种方法的好处是支持不是存放在权重中，而是通过query的机制从知识库去获取。令人困惑的是，RAG的构造也包括了Bert等编码器结构，难道这些不算是参数化吗？

RAG论文中结构图， pre-trained retriever(Query encodder + Document index) and seq2seq model . maximum inner product search(MIPS)

从图可知， RAG包含retriever 和 generator。我们把retrieve的文档作为latent ariable。我们提出了两种方法去学习生成文字的分布。分别为RAG-Sequence（基于相同文件预测）, 和RAG-Token，基于不同文档预测。

其中，Retrever（DPR）是基于编码器的结构。比如Bert。而Generator基于Encoder-decoder的结构，比如Bart。

retriever可以用于提取文档，建立index信息，然后把index信息称为non-parametric memory信息。

而关于Generator，它是基于encoder-decoder的结构，

总结：

我不喜欢RAG的思路，号称是non-parametric的方法，实际上也引入了编码器解码器的结构去解决额外难题，另外，RAG的显存占用多大呢？

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：/a/610146.html

如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈qq邮箱809451989@qq.com，一经查实，立即删除！

相关文章

echarts指标盘属性概括

echarts指标盘属性概括

echarts指标盘属性概括代码有模拟数据可以直接使用const options {animation: true,title: {top: "35%",left: "center",// text: "单元测试覆盖度", // 主标题itemGap: 15,textStyle: {// 主标题样式color: "#666666",fontSize:…

阅读更多...

Spring MVC分页示例

Spring MVC分页示例

Spring MVC分页示例分页用于在不同部分显示大量记录。在这种情况下，我们将在一页中显示10、20或50条记录。对于其余记录，我们提供链接。我们可以在Spring MVC中简单地创建分页示例。在此分页示例中，我们使用MySQL数据库来获取记录。创建…

阅读更多...

MySQL索引优化（超详细）篇章2--索引调优

MySQL索引优化（超详细）篇章2--索引调优

目录 1.索引失效状况2.性能分析3.表的索引信息--调整索引顺序4.删除冗余索引5.最佳左前缀法则5.1下面是一个实际的例子来说明这个概念： 6.数据长度和索引长度占用空间比较 1.索引失效状况 MySQL索引失效通常指的是查询语句无法有效地利用索引，而导致全表…

阅读更多...

为什么说HTTPS比HTTP安全? HTTPS是如何保证安全的？

为什么说HTTPS比HTTP安全? HTTPS是如何保证安全的？

一、安全特性在上篇文章中，我们了解到HTTP在通信过程中，存在以下问题： 通信使用明文（不加密），内容可能被窃听不验证通信方的身份，因此有可能遭遇伪装而HTTPS的出现正是解决这些问题&#xff0c…

阅读更多...

基于springboot + vue 实现的简易博客系统

基于springboot + vue 实现的简易博客系统

项目效果图登陆页面文章列表发表文章用户管理栏目管理数据统计后端技术栈后端主要采用了： 1.SpringBoot 2.SpringSecurity 3.MyBatis 4.部分接口遵循Restful风格 5.MySQL 前端技术栈前端主要采用了： 1.Vue 2.axios 3.Elemen…

阅读更多...

ETL如何执行Java脚本

ETL如何执行Java脚本

ETLCloud提供了执行 Java 脚本的方式，让用户能够灵活地处理数据并实现各种复杂的数据处理任务。 ETLCloud在数据处理领域的应用优势主要体现在以下几个方面： 灵活性：通过执行Java脚本，用户能够灵活定制数据处理逻辑，满…

阅读更多...

C语言---使用共用体将double型经纬度存储到无符号数组中

C语言---使用共用体将double型经纬度存储到无符号数组中

1.在上报经纬度时由于数据协议限制需要将double型数据存储到无符号数组中，下边是写了一个简单C程序进行验证； 2.代码示例如下 #include <stdio.h> typedef union {float data;unsigned char arr[4]; } my_data;int main() {my_data test_data {…

阅读更多...

IDEA HTTP Client 插件配置空密码的 Request

IDEA HTTP Client 插件配置空密码的 Request

最近在测试一些 rest api 的时候，发现 IDEA 的 HTTP Client 很好用。对比 postman 更加的轻量，可以满足一些简单的 HTTP 请求测试。这里主要记录下，当用户名没有设置密码时，我们该如何配置这个 HTTP Client 的 Request 文件&#…

阅读更多...

综合内容运营实习生实习体验报告怎么写？

综合内容运营实习生实习体验报告怎么写？

分享一个笔灵ai生成的综合内容运营的实习体验报告，有别的岗位需要的可以自己去网站使用实习体验报告AI写作助手 | AI文章智能生成器 - 笔灵AI写作实习体验报告尊敬的领导： 您好！我很荣幸有机会向您提交我的实习体验报告。在过去的几个月…

阅读更多...

wpf中的图标字体和android的矢量图vector

wpf中的图标字体和android的矢量图vector

1.背景在安卓程序中如下截图所示中，在drawable文件夹下有如下图片文件。这是一个xml文件，打开后看到Vector节点下paht中有一个pathData属性有一串带字母数字和"."点的数据。这些是什么呢？ <vector xmlns:android"http:…

阅读更多...

14个项目带你熟练学握AI2G免费分享|一门让你掌握人工智能能力的实操课（送工具）利用Midjourney

14个项目带你熟练学握AI2G免费分享|一门让你掌握人工智能能力的实操课（送工具）利用Midjourney

目录 1-一门让你掌握人工智能能力的实操课（送工具）.mp4 10-成为UI设计师：利用Midjourney进行页面UI设计.mp4 11-做室内设计师：利用Midjourney产出家居、室内设计方案.mp4 12-故事绘本：利用Midjouney准备课件、故事…

阅读更多...

PCIe协议之-TLP路由基础

PCIe协议之-TLP路由基础

✨前言： 在PCI Express (PCIe) 技术中，数据包的路由方式对于确保信息能够高效、准确地传送至目标设备至关重要。PCIe定义了几种路由方式，主要有以下几种。 🌟地址路由（Address Based Routing） 这是最基本…

阅读更多...

自动驾驶系统中的数据闭环：挑战与前景

自动驾驶系统中的数据闭环：挑战与前景

目录自动驾驶概况 1.1自动驾驶分级 1.2自动驾驶国内发展 1.3自动驾驶架构模型数据闭环的意义 2.1 搜集corner case的数据 2.2 提高模型的泛化能力 2.3 驱动算法迭代数据闭环落地的痛点及对策 3.1 数据采集和使用的合规性问题 3.2 数据确权问题 3.3 数据采集…

阅读更多...

【经验总结】常用的模型优化器

【经验总结】常用的模型优化器

优化器是一种用于优化模型权重和偏差的算法，它根据训练数据更新模型参数，以模型的预测结果更加准确。 1. 常见的优化器 SGD（Stochastic Gradient Descent）：SGD是一种基本的优化算法，它在每次迭代中随机选择…

阅读更多...

揭秘Ping32如何实现上网行为监控

揭秘Ping32如何实现上网行为监控

企业上网行为管理软件在现代企业管理中扮演着举足轻重的角色。它不仅能够监控和记录员工的上网行为，还能有效防止数据泄露和不当使用，从而保障企业的信息安全。一、Ping32上网监控软件的具体功能包括： 1.网页浏览监控：对Chrome…

阅读更多...

jvm面试题30问

jvm面试题30问

什么是JVM的跨平台？ 什么是JVM的语言无关性？ 什么是JVM的解释执行什么是JIT? JIT：在Java编程语言和环境中，即时编译器（JIT compiler，just-in-time compiler）是一个把Java的字节码（…

阅读更多...

流量卡就该这么选，用起来性价比真的超高！

流量卡就该这么选，用起来性价比真的超高！

很多朋友会私信小编，让小编给大家推荐几款流量卡，在这里小编告诉大家，流量卡可以推荐，但是每个人的喜好不同，小编也忙不过来，今天，小编整理了一篇选购指南，大家可以参考选择&#xf…

阅读更多...

2024 B2B企业出海营销白皮书（展会篇）

2024 B2B企业出海营销白皮书（展会篇）

来源：科特勒&微吼根据36氪研究院发布的《2023-2024年中国企业出海发展研究报告》中指出，随着全球化浪潮席卷以及中国智造的崛起，中国企业出海主力从过去的低附加值行业逐步扩展至信息技术、先进制造、医疗健康、汽车交通、新消费等附加…

阅读更多...

106短信平台疑难解答：为何手机正常却收不到短信？

106短信平台疑难解答：为何手机正常却收不到短信？

当您使用群发短信平台发送消息时，有时尽管系统提示发送成功，但手机却未能收到短信。这背后可能隐藏着一些不为人知的原因。首先，我们要明确，在正常情况下，只要手机状态正常，都应该能够接收到短信。然而&am…

阅读更多...

为什么站长们喜欢使用新加坡站群服务器呢?

为什么站长们喜欢使用新加坡站群服务器呢?

为什么站长们喜欢使用新加坡站群服务器呢? 站群优化一直是站长们追逐的目标之一，而新加坡站群服务器则备受站长们的青睐。为什么会如此呢?让我们深入了解一下。为什么站长们喜欢使用新加坡站群服务器呢? 站群，简单来说，就是一组相互关联…

阅读更多...

最新文章