实现基于RAG的QA应用程序

实现基于RAG的QA应用程序

article2025/1/1 16:36:32/文章来源:https://blog.csdn.net/m0_56699208/article/details/138063866

实现基于RAG的Q&A应用程序

LLM 支持的最强大的应用程序之一是复杂的问答（Q&A）聊天机器人。这些应用程序可以回答有关特定来源信息的问题。这些应用程序使用一种称为检索增强生成（RAG）的技术。

什么是检索增强生成（RAG）

通用语言模型通过微调就可以完成几类常见任务，比如分析情绪和识别命名实体。这些任务不需要额外的背景知识就可以完成。

要完成更复杂和知识密集型的任务，可以基于语言模型构建一个系统，访问外部知识源来做到。这样的实现与事实更加一性，生成的答案更可靠，还有助于缓解“幻觉”问题。

Meta AI 的研究人员引入了一种叫做检索增强生成（Retrieval Augmented Generation，RAG）的方法来完成这类知识密集型的任务。RAG 把一个信息检索组件和文本生成模型结合在一起。RAG 可以微调，其内部知识的修改方式很高效，不需要对整个模型进行重新训练。

RAG 会接受输入并检索出一组相关/支撑的文档，并给出文档的来源（例如维基百科）。这些文档作为上下文和输入的原始提示词组合，送给文本生成器得到最终的输出。这样 RAG 更加适应事实会随时间变化的情况。这非常有用，因为 LLM 的参数化知识是静态的。RAG 让语言模型不用重新训练就能够获取最新的信息，基于检索生成产生可靠的输出。
在这里插入图片描述

RAG 架构

典型的 RAG 应用程序有两个主要组件：

索引：用于从源引入数据并编制索引的管道它。这通常发生在离线状态。

检索和生成：实际的 RAG 链，它需要用户在运行时查询并从索引中检索相关数据，然后将其传递给模型。

从原始数据到答案最常见的完整序列如下所示：

索引

加载：首先我们需要加载数据。这是使用 DocumentLoaders 完成的。
拆分：文本分离器将大块分成更小的块。这对于以下方面都很有用索引数据并将其传递到模型，因为大块更难搜索，并且不适合模型的有限上下文窗。Documents
存储：我们需要某个地方来存储和索引我们的拆分，以便以后可以搜索它们。这通常是使用 VectorStore 和 Embeddings 模型完成的。

在这里插入图片描述
检索和生成

检索：给定用户输入，从中检索相关拆分使用猎犬进行存储。
生成：ChatModel / LLM 使用包含问题和检索数据的提示

案例参考

在LangChain 文档中可以找到一个使用检索器和 LLM 回答问题并给出知识来源的简单例子。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：/a/563467.html

如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈qq邮箱809451989@qq.com，一经查实，立即删除！

相关文章

Golang | Leetcode Golang题解之第43题字符串相乘

Golang | Leetcode Golang题解之第43题字符串相乘

题目： 题解： func multiply(num1 string, num2 string) string {if num1 "0" || num2 "0" {return "0"}m, n : len(num1), len(num2)ansArr : make([]int, m n)for i : m - 1; i > 0; i-- {x : int(num1[i]) - 0fo…

阅读更多...

设计模式之访问者模式（上）

设计模式之访问者模式（上）

访问者模式 1）概述 1.概念访问者模式包含访问者和被访问元素两个主要组成部分。处方单中的各种药品信息就是被访问的元素，而划价人员和药房工作人员就是访问者，被访问的元素通常具有不同的类型，且不同的访问者可以对它们进行…

阅读更多...

上位机图像处理和嵌入式模块部署（树莓派4b处理类muduo网络编程）

上位机图像处理和嵌入式模块部署（树莓派4b处理类muduo网络编程）

【声明：版权所有，欢迎转载，请勿用于商业用途。联系信箱：feixiaoxing 163.com】既然是linux编程，那么自然少不了网络编程。在linux平台上面，有很多的网络编程库可以选择，大的有boost、qt&…

阅读更多...

免费PNG素材网站推荐：设计效率倍增！

一、即时设计新一代协同设计工具即时设计，内置丰富社区资源，可以在此获得设计前线的各类PNG图像，以及矢量图标，包括毛玻璃、3D混搭、全息投影、单色、平面化等，都是符合目前市场的主流风格。通过最近更新、作品、资源…

阅读更多...

影响钕铁硼磁钢性能的因素及方法

影响钕铁硼磁钢性能的因素及方法

钕铁硼永磁材料自问世以来，就以其优越的磁性能而备受关注，被称为“磁王“，在市场需求的不断地增长下，钕铁硼生产工艺及磁体性能也不断发展和提升。我们一般用剩磁、矫顽力和最大磁能积这几个指标来衡量磁性材料的磁性能。剩磁 B…

阅读更多...

【C++】：类和对象(上)

【C++】：类和对象(上)

目录一，面向过程和面向对象初步认识二，类的引入三，类的定义3.1 **类的说明**3.2 **类的访问限定符**3.3 **类的两种实现方式**3.4 **成员变量的命名规则 --- 加下划线** 四，类的作用域4.1 **类域的说明**4.2 **类域与命名空间域的…

阅读更多...

分析经过j2k压缩的dicom文件经验分享

分析经过j2k压缩的dicom文件经验分享

最近碰到一个问题，在网上搜到是用JPEG 2000压缩的DICOM文件 JPEG 2000对应的transfer syntax UID为 1.2.840.10008.1.2.4.91 参考:https://dicom.nema.org/medical/dicom/current/output/chtml/part18/sect_8.7.3.html 该文件是用专业德国老牌开发库DCMTK生成的 (…

阅读更多...

虚拟机VMware安装与Ubuntu

虚拟机VMware安装与Ubuntu

1.虚拟机安装链接：百度网盘请输入提取码提取码：2fr6 CG54H-D8D0H-H8DHY-C6X7X-N2KG6 2.Ubuntu下载 Download Ubuntu Desktop | Ubuntu 3.设置如后续要下一些软件越大越好

阅读更多...

Diffusion Model原理剖析

Diffusion Model原理剖析

目录前言1. DDPM演算法初览2. 图像生成模型共同目标3. VAE: Lower bound of l o g P ( x ) logP(x) logP(x)4. Diffusion Model背后的数学原理5. 为什么需要Sample?6. Diffusion Model的应用7. Diffusion Model成功的关键总结参考前言接着上篇文章图像生成模型浅析&#…

阅读更多...

15.C++常用的算法_拷贝和替换算法

15.C++常用的算法_拷贝和替换算法

文章目录遍历算法1. copy()代码工程运行结果 2. replace()代码工程运行结果 3. replace_if()代码工程运行结果 4. swap()代码工程运行结果遍历算法 1. copy() 代码工程 copy()函数不要因为使用而使用#define _CRT_SECURE_NO_WARNINGS #include<iostream> #include&l…

阅读更多...

dremio支持设置

dremio支持设置

Dremio 支持提供可用于诊断目的的设置。这些设置通过 Dremio UI：设置>支持启用（或禁用） 使用 Client Tools 可以配置当用户查看数据集中的数据时，Dremio 项目的工具栏上显示哪些客户端应用程序按钮。用户可以通过单击相应的工具…

阅读更多...

免费ssl泛域名/泛解析证书获取教程

泛域名SSL证书，也称为通配符证书，它可以保护一个主域名下的所有子域名。这意味着，无论你有多少个子域名，只要安装了一个泛域名SSL证书，就可以实现全部子域名的安全保护。这种证书非常适合大型企业或有大量子域名的网站…

阅读更多...

数电复习（五）半导体存储电路

数电复习（五）半导体存储电路

半导体存储电路 5.1 概述5.2 SR锁存器5.3 触发器5.3.1电平触发的触发器5.3.2 边沿触发器5.3.3 脉冲触发(主从) 触发器5.3.4 触发器逻辑功能的转换 5.4 寄存器5.4.1 数码寄存器5.4.2 移位寄存器 5.5 存储器5.5.1 ROM5.5.2 随机存储器RAM5.5.3 存储器容量的扩展5.5.4 用存储器实现…

阅读更多...

怎么申请免费SSL证书，如何安装

什么是SSL证书，SSL，即Secure Sockets Layer（安全套接层），它是一种安全协议，用于在互联网通信中为数据提供加密保护，从而防止数据被窃听或篡改。而SSL证书则是由权威的数字证书认证机构&#xff…

阅读更多...

数据结构面试常见问题：什么是哈希表？它的工作原理是什么？

数据结构面试常见问题：什么是哈希表？它的工作原理是什么？

哈希表的基本概念在我们的日常生活中，我们经常需要存储和查找各种信息，这些信息可能是电话号码，地址，或者是商品的价格等等。这些信息的存储和查找，就像是我们在一个巨大的仓库中存放和寻找物品。这个仓库就是数据结…

阅读更多...

机器学习中的过拟合问题及应对策略：深入剖析与实战指南

机器学习中的过拟合问题及应对策略：深入剖析与实战指南

在机器学习的领域中，过拟合是一个普遍而又棘手的问题。过拟合指的是模型在训练数据上表现优秀，但在未知或测试数据上表现不佳的现象。这通常是因为模型过于复杂，以至于“记住”了训练数据的噪声和细节，而非学习其内在规律和结构。…

阅读更多...

立创·实战派ESP32-C3开发板 with lv_micropython

立创·实战派ESP32-C3开发板 with lv_micropython

一、lv_micropython对驱动芯片的支持 ESP32-C3开发板的Display drivers:ST7789，Input drivers:FT6336，从LVGL的官方文档了解到lv_micropython包含了这两颗IC的驱动。参考文档： lv_micropython already contains these drivers: 链接:Micro…

阅读更多...

使用Python进行容器编排Docker Compose与Kubernetes的比较

使用Python进行容器编排Docker Compose与Kubernetes的比较

👽发现宝藏前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。【点击进入巨牛的人工智能学习网站】。随着容器化技术的普及，容器编排成为了管理和部署容器化应用程序的重要环节。在容…

阅读更多...

jBPM的介绍

jBPM的介绍

一、简介 jBPM（Java Business Process Management）是一个开源的业务流程管理框架，用于管理和执行业务流程。它提供了一个可视化的流程设计器，可以创建、模拟和部署业务流程，并提供了灵活的流程执行引擎。 jBPM可以帮…

阅读更多...

【Go语言快速上手(三)】数组, 切片与映射

【Go语言快速上手(三)】数组, 切片与映射

💓博主CSDN主页:杭电码农-NEO💓 ⏩专栏分类:Go语言专栏⏪ 🚚代码仓库:NEO的学习日记🚚 🌹关注我🫵带你学习更多Go语言知识 🔝🔝 GO快速上手 1. 前言2. 数组详解3. 切…

阅读更多...

最新文章