RAG 流程及论文串烧

文档切片

文档切片的五个层次

https://medium.com/@anuragmishra_27746/five-levels-of-chunking-strategies-in-rag-notes-from-gregs-video-7b735895694d#b123

Basic RAG 与 Advanced RAG

https://pub.towardsai.net/advanced-rag-techniques-an-illustrated-overview-04d193d8fec6

Basic RAG 的一般流程

basic RAG pipeline

  1. Vanilla RAG case in brief looks the following way: you split your texts into chunks, then you embed these chunks into vectors with some Transformer Encoder model, you put all those vectors into an index and finally you create a prompt for an LLM that tells the model to answers user’s query given the context we found on the search step.
  2. In the runtime we vectorise user’s query with the same Encoder model and then execute search of this query vector against the index, find the top-k results, retrieve the corresponding text chunks from our database and feed them into the LLM prompt as context.
  3. prompt 设计:
    def question_answering(context, query):
        prompt = f"""
                    Give the answer to the user query delimited by triple backticks ```{query}```\
                    using the information given in context delimited by triple backticks ```{context}```.\
                    If there is no relevant information in the provided context, try to answer yourself, 
                    but tell user that you did not have any relevant context to base your answer on.
                    Be concise and output the answer of size less than 80 tokens.
                """
    response = get_completion(instruction, prompt, model="gpt-3.5-turbo")
    answer = response.choices[0].message["content"]
    return answer
    
    

Advanced RAG 的一般流程

在这里插入图片描述

  • 分层索引
    在这里插入图片描述

  • 上下文窗口扩充
    在这里插入图片描述
    在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/725218.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

用画图,将2张图片,合并成 一张图片 + 压缩体积

合并 第一步:选中要做比较的两张图片其中一张,单击鼠标右键,选择“打开方式--画图”。 第二步:如果图片过大,占据了整个屏幕不好观察,用右下角的标尺,缩小视图 第三步:鼠标左键按住…

Day55 代码随想录打卡|二叉树篇---二叉搜索树中的插入操作

题目(leecode T701): 给定二叉搜索树(BST)的根节点 root 和要插入树中的值 value ,将值插入二叉搜索树。 返回插入后二叉搜索树的根节点。 输入数据 保证 ,新值和原始二叉搜索树中的任意节点值…

Java并发编程深度解析:构建高并发应用的实践与探究

摘要:随着互联网技术的飞速发展,大型分布式系统对并发处理能力的要求越来越高。Java作为企业级应用的主流开发语言,在并发编程方面有着深厚的积累和强大的生态支持。本文将深入探讨Java并发编程的基础知识,高级技巧,以…

​海康威视 isecure center 综合安防管理平台任意文件上传漏洞

文章目录 前言声明一、漏洞描述二、影响版本三、漏洞复现四、修复方案 前言 海康威视是以视频为核心的智能物联网解决方案和大数据服务提供商,业务聚焦于综合安防、大数据服务和智慧业务。 海康威视其产品包括摄像机、多屏控制器、交通产品、传输产品、存储产品、门禁产品、消…

C++初学者指南第一步---7.控制流(基础)

C初学者指南第一步—7.控制流(基础) 文章目录 C初学者指南第一步---7.控制流(基础)1.术语:表达式/语句Expressions表达式Statements语句 2.条件分支3.Switching(切换):基于值的分支4.三元条件运算符5.循环迭代基于范围的循环   C…

2024下《网络工程师》50个高频考点汇总,背就有效!

宝子们!上半年软考已经结束一段时间了,准备考下半年软考中级-网络工程师的小伙伴们可以开始准备了,这里给大家整理了50个高频考点,涵盖全书90%以上重点,先把这个存下!再慢慢看书,边看书边背这个…

示例:WPF中如何不卡顿页面的情况加载大量数据

一、目的:在开发过程中经常会遇到一个ListBox列表里面需要加载大量数据,但是加载过程中会假死卡顿影响用户体验,或者是你的主页面加载了大量控件,或者切换到一个有大量元素的页面都会有这种体验,因为加载的都是UI元素不…

工程打包与运行

黑马程序员Spring Boot2 文章目录 先点击cean,确保打包之前是个干净的环境点击package进行打包,打包成功之后可以看到target文件夹下的文件 到项目目录下使用终端打开,并使用以下命令运行打包好的程序 如果遇到没有主清单属性的问题&#xff…

【Unity】RPG2D龙城纷争(三)角色、角色数据集

更新日期:2024年6月18日。 项目源码:后续章节发布 索引 简介角色数据集(RoleDataSet)一、定义角色数据集类二、角色基础数据(公共数据) 角色(Role)一、定义角色类二、角色其他数据&a…

警惕!新增4本SCI/SSCI被剔除!6月WOS更新(附下载)

本周投稿推荐 SSCI • 中科院2区,6.0-7.0(录用友好) EI • 各领域沾边均可(2天录用) CNKI • 7天录用-检索(急录友好) SCI&EI • 4区生物医学类,0.5-1.0(录用…

【UE数字孪生学习笔记】 Apifox一体化接口测试平台

声明:部分内容来自于b站,知乎,慕课,公开课等的课件,仅供学习使用。如有问题,请联系删除。 部分内容来自UE官方文档,博客等 Apifox接口测试 Apifox 是集 API 文档、API 调试、API Mock、API 自动…

深度学习(十二)——神经网络:搭建小实战和Sequential的使用

一、torch.nn.Sequential代码栗子 官方文档:Sequential — PyTorch 2.0 documentation # Using Sequential to create a small model. When model is run, # input will first be passed to Conv2d(1,20,5). The output of # Conv2d(1,20,5) will be used as the in…

【unity笔记】二、海洋系统Crest Ocean System插件使用

一、介绍 Crest 是 Unity 技术先进的海洋系统。 它专为性能而设计,并大量使用细节级别 (LOD) 策略和 GPU 加速来实现快速更新和渲染。它还具有高度的灵活性,允许对水形状/泡沫/动态波浪/等进行任何自定义输入,并具有直…

基于Matlab的人脸表情识别系统(GUI界面)【W5】

简介: 该系统是一个基于Matlab开发的人脸表情识别应用程序,旨在识别输入图像中的人脸表情,并通过直观的图形用户界面(GUI)向用户展示识别结果。系统结合了图像处理、机器学习和用户交互技术,使用户能够轻松…

(论文翻译)ViM Out-Of-Distribution with Virtual-logit Matching(CVPR2022)

ViM: Out-Of-Distribution with Virtual-logit Matching(CVPR2022) 文章目录 ViM: Out-Of-Distribution with Virtual-logit Matching(CVPR2022)Abstract1.Introduction2.Related Work3.Motivation: The Missing Info in Logits4.…

SUSE linux的快照和恢复

snapper用于创建和管理文件系统快照,并在需要时实现回滚,它还可以用于创建用户数据的磁盘备份。snapper使用btrfs文件系统或者精简配置的被格式化成XFS或EXT4的LVM卷。snapper可以通过命令行或YaST来进行管理。 btrfs是一种copy-on-write文件系统&#x…

Linux网络命令:网络速度测试工具 speedtest-cli 详解

目录 一、概述 二、安装 speedtest-cli 1、在基于 Debian 的系统上安装 2、在基于 Red Hat 的系统上安装 三、命令语法 1、基本命令语法 2、查看帮助 3、常用选项 四、 speedtest-cli使用示例 1. 基本测试 2. 列出所有可用的服务器 3. 指定服务器进行测试 …

kotlin集合框架

1、集合框架的接口类型对比 2、不可变和可变List fun main() {// 不可变List - 不能删除或添加元素val intList: List<Int> listOf(1,2,3)intList.forEach{println(it) // 1 2 3}println("")// 可变List - 可以删除或添加元素val mutableList mutableListO…

【SpringBoot】RSA加密(非对称加密)

一、关于RSA RSA是一种非对称加密算法&#xff0c;广泛应用于数据加密和数字签名领域。 RSA算法是由罗纳德李维斯特&#xff08;Ron Rivest&#xff09;、阿迪萨莫尔&#xff08;Adi Shamir&#xff09;和伦纳德阿德曼&#xff08;Leonard Adleman&#xff09;在1977年提出的。…

单元测试很难么?

前言 你可能会用单元测试框架&#xff0c;python的unittest、pytest&#xff0c;Java的Junit、testNG等。 那么你会做单元测试么&#xff01;当然了&#xff0c;这有什么难的&#xff1f; test_demo.py def inc(x): return x 1 def test_answer(): assert inc(3) 4 i…