【百问大模型02】一文讲透RAG实战全解析

1.实时性无法更新,知识容易自相矛盾

2.大模型的缺点有哪些?

3.一个人的能力可以分为两种:

1)大模型:推理能力,聪明,知识;很聪明但是缺少知识

2)知识库:辅助记忆,人类历史积累下来的东西,论知识,可能牛顿都不如你;

推理能力+记忆力=人工智能

4、最常见的embedding模型,bert;向量的相似度代替文本的相似度;

5、检索技术+提示词工程+大模型,RAG的方法论

6、对象数据库怎么设计和实现

7、技术实现细节

文档种类多:doc,ppt,excel,pdf
切分方式:段落、句子、token、知识点;切分原因:大模型输入长度有限制;理想的切分方式,按照知识点来切分,但是不容易操作;按段落分,容易出现一个知识点横跨多段的时候,容易分割成2段或者多段,使用交叉重叠来减缓这个问题,但是不能解决;

8、内部知识的特殊性,这个是比较麻烦的事情,专业术语不容易理解,需要辅助一些外部资料解决;

9、如果大量数来自网络,大部分工作是花在数据清洗上面;

10、检索:用户的问题,找到对应的知识,就是检索的作用;常见的检索技术,会经常被用到,搜、广、推;

相似度检索:欧氏距离、曼哈顿距离、余弦相似度

关键词检索:ti-idf

SQL检索:传统的检索算法

11、向量检索:query和知识可以通过相似度向量比较检索,搜索一些top的结果,可以加一下文本规则的限制,提升精准度,得到召回来的知识;对找回来的知识进行排序,把用户的问题,召回来的知识,给他下个模型,输出0和1,0表示不相关,1表示相关强烈,然后对输出的结果进行排序,输出检索的结果;

13、树检索,把知识整理成树的结构;知识图谱,召回一个知识,也把另外一个知识给召回,知识构建、维护成本很高,好用但是慎用;

14、对用户的问题,进行优化,比如用大模型来扩展问题HyDE,利用大模型来做假答案,取向量平均值;

15、RAG Fusion:主要是在检索的环节做了拓展;用大模型生成类似的话术问题;防止用户的输入过于口语化,导致找回不了;每个quey和原生query,一起召回,排序,rerank,得到最终的结果;

16.问题-知识对,放到向量库->创建索引

17.用户输入问题后,对问题进行一次拓展,使用大模型来拓展,得到3个相似的问题;问了描述的更好,还可以加一下用户的一些特征信息,例如性别等等,辅助检索;

18.召回5个(bert1模型:召回模型的bert),精排3个(排序模型的bert,分类,运算量更大)

下载别人开源的bert,不太适合直接用,因为场景太垂直了,开源的未必匹配的会那么好

19.召回的知识,然后给出问题,告诉大模型,根据上述的治疗方案,给出下面病情的治疗方案;

20.RAG的核心就是相似度计算,相似度计算有很多种方法;

21.SFT和微调并不矛盾,可以融合、组合起来使用;

22.不要以完美主义要求大模型,要不然什么都做不了;

------------------ppt---------------------








 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/737347.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

第一个Flask程序

自学python如何成为大佬(目录):https://blog.csdn.net/weixin_67859959/article/details/139049996?spm1001.2014.3001.5501 一切准备就绪,现在我们开始编写第一个Flask程序,由于是第一个Flask程序,当然要从最简单的“Hello World&#xff…

打印机状态显示错误是什么原因?这5个有效方法要记好!

打印机是现代办公中不可或缺的设备之一,但在使用过程中,打印机状态显示错误是一个常见的问题。本文将详细探讨打印机状态显示错误的原因及其解决方法。 摘要 打印机状态显示错误的原因及解决方法如下: 1、网络连接问题:原因&…

【python】python基于微博互动数据的用户类型预测(随机森林与支持向量机的比较分析)(源码+数据集+课程论文)【独一无二】

👉博__主👈:米码收割机 👉技__能👈:C/Python语言 👉公众号👈:测试开发自动化【获取源码商业合作】 👉荣__誉👈:阿里云博客专家博主、5…

皇河将相董事长程灯虎出席第二十四届世纪大采风并获奖

仲夏时节,西子湖畔。第二十四届世纪大采风品牌人物年度盛典于6月16日至17日在杭州东方文化园隆重举行。本届盛典由亿央网、《华夏英才》电视栏目联合多家媒体共同主办,中世采文化发展集团承办,意尔康股份有限公司、宸咏集团协办,汇聚了来自全国政、商、产、学、研、媒等各界代表…

图像编辑技术的新篇章:基于扩散模型的综述

在人工智能的浪潮中,图像编辑技术正经历着前所未有的变革。随着数字媒体、广告、娱乐和科学研究等领域对高质量图像编辑需求的不断增长,传统的图像编辑方法已逐渐无法满足日益复杂的视觉内容创作需求。尤其是在AI生成内容(AIGC)的…

YIA主题侧边栏如何添加3D旋转标签云?

WordPress站点侧边栏默认的标签云排版很一般,而3D旋转标签云就比较酷炫了。下面boke112百科就以YIA主题为例,跟大家说一说如何将默认的标签云修改成3D旋转标签云,具体步骤如下: 1、点此下载3d标签云文件(密码&#xf…

开源项目推荐-vue2+element+axios 个人财务管理系统

文章目录 financialmanagement项目简介项目特色项目预览卫星的实现方式:首次进入卫星效果的实现方式:卫星跟随鼠标滑动的随机效果实现方式:环境准备项目启动项目部署项目地址 financialmanagement 项目简介 vue2elementaxios 个人财务管理系…

java学习--集合(大写二.2)

看尚硅谷视频做的笔记 2.collection接口及方法 jdk8里有一些默认的方法,更多的是体现的是一种规范,规范更多关注的是一些抽象方法。 看接口里面的抽象方法,选一个具体的实现类。 测试collection的方法,存储一个一个数据都有哪些…

记录:[android] SSLHandshakeException: Handshake failed 问题;已解决!

1、问题描述:在使用Retrofit2 时在安卓老设备上(安卓6.0)网络无法请求、安卓 10 、 11 未出现此问题?what? 原因:服务端 TLS 版本过高 2、废话不多说、解决方案A 、添加依赖:implementation org.conscrypt…

安徽理工大学2计算机考研情况,招收计算机专业的学院和联培都不少!

安徽理工大学(Anhui University of Science and Technology),位于淮南市,是安徽省和应急管理部共建高校,安徽省高等教育振兴计划“地方特色高水平大学”建设高校,安徽省高峰学科建设计划特别支持高校&#…

Java面试八股之myBatis与myBatis plus的对比

myBatis与myBatis plus的对比 基础与增强: MyBatis 是一个成熟的Java持久层框架,它允许开发者通过XML文件或注解来配置SQL语句和数据库映射,提供了一个灵活的方式来操作数据库,但需要手动编写所有的SQL语句和结果集映射。 MyBa…

oracle 外连接(+)和left join用法

案例1: select count(1) FROM TFUNDINFO A, TFUNDTYPE B WHERE A.VC_FUNDCODEB.VC_FUNDCODE() select count(1) FROM TFUNDINFO A, TFUNDTYPE B WHERE A.VC_FUNDCODEB.VC_FUNDCODE SELECT count(1): 这表示查询将返回一个计数,count(1)是一种常见的计数…

适用于 AI/ML 工作负载的有状态 KES

在此概念验证 (POC) 中,我们将探讨在 Kubernetes (k8s) 生态系统中安装和管理有状态密钥加密服务 (KES)。本指南促进了加密操作的无缝衔接,而不会将敏感的密钥材料暴露给使用型应用程…

Window和linux杀死进程的方式(命令行版)

在本文中,我们将探讨如何在Windows和Linux操作系统下高效地终止指定的进程,涵盖基本命令与高级技巧,确保您能灵活应对各种管理需求。 linux杀死进程 在终端中,我们通过下面命令找到端口运行的程序 lsof -i:72812. 然后输入下面…

见证数据的视觉奇迹——DataV Atlas

引言 前段时间一直沉迷于AI方向,几乎很久没碰大数据开发的相关内容了,今天突然看到阿里活动又推出DataV的体验了,我直接“啪”的一下就点进来了,很快啊!本来之前开发数字孪生的时候就接触过基础的DataV操作了&#x…

北京BJ90升级新款迈巴赫大连屏四座头等舱行政四座马鞍

北京BJ90升级奔驰迈巴赫头等舱行政四座大联屏的内饰效果会非常出色,将为车辆带来更豪华、高端的内饰氛围。以下是升级后可能的效果: • 科技感提升:奔驰的中控系统一直以来都以其先进的科技和用户友好的界面而闻名。升级后,北京B…

Retrieval-Augmented Generation for Large Language Models A Survey

Retrieval-Augmented Generation for Large Language Models: A Survey 文献综述 文章目录 Retrieval-Augmented Generation for Large Language Models: A Survey 文献综述 Abstract背景介绍 RAG概述原始RAG先进RAG预检索过程后检索过程 模块化RAGModules部分Patterns部分 RAG…

TEMU自养号测评系统如何搭建,有哪些要求

TEMU全托管目前优点是全程不用去运营,只要做好选品,质检就可以了。缺点是无法自由决定产品的营销策略,这也是使得卖家会去通过自养号测评方式来为产品链接打造权重。 TEMU自养号测评的搭建是一个涉及多个步骤和细节的过程。以下是一个清晰的…

智能优化算法改进策略之局部搜索算子(六)--进化梯度搜索

1、原理介绍 进化梯度搜索(Evolutionary Gradient Search, EGS)[1]是兼顾进化计算与梯度搜索的一种混合算法,具有较强的局部搜索能力。在每次迭代过程中,EGS方法首先用受进化启发的形式估计梯度方向,然后以最陡下降的方式执行实际的迭代步骤&…

QListView、QTableView或QTreeView截取滚动区域(截长图)

本文以QTreeView为例,理论上继承自QAbstractScrollArea的类都支持本文所述的方法。 一.效果 一共5个文件夹,每个文件文件夹下有5个文件,先把文件夹展开,然后截图。将滚动条拖到居中位置,是为了证明截图对滚动条无影响 下面是截的图 二.原理 将滚动区域的viewport设置为…