腾讯云向量数据库-RAG介绍

article2025/1/31 10:47:09/文章来源:https://blog.csdn.net/lovemelovefish/article/details/137653295

1.说明

RAG结合LLM(通用大预言模型)构件基于私有文档、专业领域知识、实时信息的charbot。

2.RAG的主要步骤

知识切片成chunk
向量化chunk入库
query检索知识chunk
构件prompts
调用llm生成回答

3.优势

快速构件demo
快速理解rag
社区支持

4.痛点

投入大
效果差
调优难

5.RAG应用的效果

整体效果=文档处理效果*embedding效果*retrieval效果*LLM效果

6.数据处理的难点：解析和拆分

1.PDF格式的多样性（eg:标准格式、跨页表格、离散等），会有复杂多变的文档格式，提高效果的困难度。

解决办法：

2.文档内容质量将很有程度影响最终效果。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：/a/537620.html

如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈qq邮箱809451989@qq.com，一经查实，立即删除！

MURF1640CT-ASEMI快恢复二极管MURF1640CT

编辑：ll MURF1640CT-ASEMI快恢复二极管MURF1640CT 型号：MURF1640CT 品牌：ASEMI 封装：TO-220F 最大平均正向电流（IF）：16A 最大循环峰值反向电压（VRRM）：4…

【Java】JDK1.8 HashMap源码，put源码详细讲解

📝个人主页：哈__ 期待您的关注在Java中，HashMap结构是被经常使用的，在面试当中也是经常会被问到的。这篇文章我给大家分享一下我对于HashMap结构源码的理解。 HashMap的存储与一般的数组不同，HashMap的每一个元素存…

SQLite从出生到现在（发布历史记录）（二十二）

返回：SQLite—系列文章目录上一篇：从 SQLite 3.5.9 迁移到 3.6.0（二十一） 下一篇：SQLite—系列文章目录引言： SQLite拥有别人无法比拟的装机量，究竟什么成就了SQLite呢，本…

WPS制作表格热图

最近看到一篇文献使用了表格热图，于是想着用wps制作一个类似的。表格热图可以使表格中的数字大小变得更加直观。参考文献原文：Miller, O.L., Helman, D., Tal Svoray, Morin, E., Bonfil, D.J., 2019. Explicit wheat production model adjusted for s…

代码实现： typedef struct node {int val;struct node *next; } Node;typedef struct {struct node *top;int min; } MinStack;/** initialize your data structure here. */MinStack* minStackCreate() {MinStack *obj malloc(sizeof(*obj));obj->top NULL;ob…

Failure Unable to retrieve image details-解决Portainer与Docker v26不兼容问题

文章目录前言解决过程解决方法一解决方法二前言今天登上服务器习惯性的升级了yum软件包，结果这一更新后导致Portainer不能正常使用，后续进行成功解决，简单记录一下解决过程事故过程模拟当时顺手升级下docker版本(V26.0.1) 结果Porta…

Golang 状态机设计模式

本文介绍了Golang状态机模式的一个实现示例，通过该模式，可以解耦调用链，有助于实现测试友好的代码，提高代码质量。原文: Go State Machine Patterns 导言在我们开发的许多项目中，都需要依赖某种运行状态从而实现连续操…

LeetCode-62. 不同路径【数学动态规划组合数学】

LeetCode-62. 不同路径【数学动态规划组合数学】题目描述：解题思路一：动态规划，动规五部曲解题思路二：动态规划（版本二）解题思路三：数论题目描述： 一个机器人位于一个 m x n 网…

麦肯锡问题分析七步法

麦肯锡七步分析法又称“七步分析法”是麦肯锡公司根据他们做过的大量案例，总结出的一套对商业机遇的分析方法。它是一种在实际运用中，对新创公司及成熟公司都很重要的思维、工作方法。麦肯锡问题分析7步法为企业提供了一个结构化的问题解决框架&#xff…

分类算法（数据挖掘）

目录 1. 逻辑回归（Logistic Regression） 2. 支持向量机（Support Vector Machine, SVM） 3. 决策树（Decision Tree） 4. 随机森林（Random Forest） 5. K近邻（K-Nearest …

Mongodb入门--头歌实验MongoDB 复制集分片

一、MongoDB之副本集配置 1.1MongoDB主从复制主从复制是MongoDB最早使用的复制方式， 该复制方式易于配置，并且可以支持任意数量的从节点服务器，与使用单节点模式相比有如下优点： 在从服务器上存储数据副本，提高了数…

【已解决】VMware Horizon Client: 无法建立安全加密链路连接

文章目录问题原因解决方法方法1：在HTTPS拦截中添加VMware忽略列表 (推荐)方法2： 只拦截浏览器进程的请求 / 取消 HTTPS 拦截（如果没有拦截HTTPS的必要 / 只针对浏览器请求，可以使用此方法） 当前使用mac 编辑&#xf…

淘宝扭蛋机小程序：扭出惊喜，乐享购物新体验

在快节奏的现代生活中，人们总是在寻找新鲜、有趣的娱乐方式。淘宝扭蛋机小程序应运而生，为您带来前所未有的购物与娱乐结合新体验。在这里，每一次的扭动都充满惊喜，每一次的点击都带来乐趣，让您在购物的同时&#xff0…

OpenResty，Nginx实现接口验签与黑名单控制

介绍 nginx与openresty是两种优秀知名的7层负载均衡软件，nginx以其出色的性能和稳定性成为首选，而openresty则是在Nginx基础上构建的，支持嵌入Lua语言，大幅提升了开发效率。安装OpenResty 版本 openresty-1.25.3.1-win64下载地…

D. Solve The Maze Codeforces Round 648 (Div. 2)

题目链接： Problem - 1365D - CodeforcesCodeforces. Programming competitions and contests, programming communityhttps://codeforces.com/problemset/problem/1365/D 题目大意： 有一张地图n行m列（地图外面全是墙）&#xff0c…

阿里云服务器配置选择详细指导

云服务器配置如何选择？云服务器配置包括CPU内存、公网带宽和系统盘，阿里云服务器还要注意云服务器规格及轻量应用服务器的选择，云服务器吧以阿里云服务器为例来详细说下小白用户选择云服务器配置攻略： 一、准备工作如果你不注册…

文献速递：深度学习肝脏肿瘤诊断---基于多相增强 CT 和临床数据的恶性肝肿瘤鉴别诊断深度学习

Title 题目 Deep learning for diferential diagnosisof malignant hepatic tumors based on multi-phase contrast-enhanced CT and clinical data 基于多相增强 CT 和临床数据的恶性肝肿瘤鉴别诊断深度学习 Abstract 摘要 Liver cancer remains the leading cause of can…

2024 年 AI代码助手AI Coding Assistant智能工具

AI代码助手（AI Coding Assistant）是一种利用人工智能帮助开发人员更快、更准确地编写代码的软件工具。它可以通过根据提示生成代码或在你实时编写代码时建议自动完成代码来实现此目的。以下是AI代码助手可以做的一些事情： 与你使用的流行代…

指令集体系简读

这一部分，采用问答的方式来进行梳理； 什么是指令集体系？ 指令集体系(Instruction Set Architecture,ISA)是规定处理器的外在行为的一系列内容的统称，它包括： 基本数据类型(data types)、指令(instructions)、寄存器…

Socks5代理IP如何使用？详细教程解析

当我们在互联网上浏览网页、下载文件或者进行在线活动时，隐私和安全问题常常被提及。在这样的环境下，一个有效的解决方案是使用Sock5IP。本教程将向您介绍Sock5IP的使用方法，帮助您保护个人隐私并提升网络安全。一、什么是Sock5IP&#xff1…