LLMs之RAG:解读RAG主流的七类架构(Naive RAG/Retrieve-and-rerank/Multimodal RAG/GraphRAG/HybridRAG/Agentic RAG(Router)/Agentic RAG(Multi-Agent))
目录
解读RAG主流的七类架构(Naive RAG/Retrieve-and-rerank/Multimodal RAG/GraphRAG/HybridRAG/Agentic RAG(Router)/Agentic RAG(Multi-Agent))
解读RAG主流的七类架构(Naive RAG/Retrieve-and-rerank/Multimodal RAG/GraphRAG/HybridRAG/Agentic RAG(Router)/Agentic RAG(Multi-Agent))
原图地址:https://x.com/weaviate_io/status/1866528335884325070
2024年12月11日,Weaviate(开源向量数据库)在官方社交媒体帖子,发布了七种最流行的RAG架构原理图。从图中可以看出,Retrieval-Augmented Generation(RAG)被划分为多种架构,每种架构在检索与生成的结合方式上有所不同,适用于不同的场景需求。这些RAG架构的多样性展示了技术的发展趋势,针对不同应用场景进行了优化设计。从简单的检索生成到复杂的多模态、多代理协作,每种架构都有其独特的优点和适用范围。博主进一步解读,如下表格所示:
架构名称 | 核心原理 | 优点 | 缺点 | 适应场景 |
Naive RAG | 基于文档分块,通过检索机制获取相关内容,直接将结果输入生成模型生成答案。 >> 文本分块、检索机制、生成模型 | 简单易实现,计算成本低。 | 容易出现事实错误或语义不一致,无法处理复杂的上下文管理任务。 | 基础的问答任务,对精度要求不高,数据量较小的情况。 |
Retrieve-and-rerank | 在基础RAG上新增重排序模块,对检索结果重新排序优化其相关性,确保生成模型输入更加相关的上下文信息。 >> 初步检索、重排序模型、生成模型 | 可以提高检索结果的准确性,减少噪声数据的影响。 | 计算成本相对较高,需要设计有效的重排序算法。 | 高精度问答,如法律文档、技术文档的精准查询和回答。 |
Multimodal RAG | 支持多模态输入(文本、图像、视频等),利用多模态嵌入和生成模型进行检索和生成。 >> 文本与图像处理、模态融合 | 能够处理和理解多模态数据,适配能力强,可提高生成结果的准确性和丰富性。 | 实现复杂,计算成本高,需要大量的多模态数据。 | 涉及图片、视频等多模态数据的问答,如电商推荐、图像描述生成、视频问答。 |
Graph RAG | 将文档表示为图结构(图数据库),通过图节点和边(图神经网络)的关联挖掘文档之间的语义和逻辑关系,强化上下文关系理解。 >> 图数据库、知识图谱、语义关联 | 可以有效地捕捉文档之间的关联关系,提高检索结果的准确性。 | 需要构建和维护图数据库,计算成本相对较高。 | 需要处理文档之间关系的任务,例如知识图谱问答、复杂关系推理(如医学或科研领域)。适用于知识推理场景。 |
Hybrid RAG | 结合多种检索策略(例如关键词检索、语义向量检索等)进行检索和生成。 >> 图结构、传统检索、知识融合 | 可以提高检索结果的多样性和覆盖率。 | 实现复杂,需要协调多种检索方法。 | 需要同时考虑多种检索策略才能更好地满足需求的场景。 |
Agentic RAG (Router) | 利用路由机制,根据查询动态选择检索源和生成模型,针对性地生成响应。 >> AI Agent、智能路由、资源选择 | 动态选择能力强,资源利用效率高,能够应对多变的任务需求。 | 路由策略设计较复杂,对任务分类准确性依赖高。 | 多数据源、多任务类型场景,如需要跨API、数据库和生成模型的集成应用。 |
Agentic RAG (Multi-Agent) | 利用多个AI Agent分别负责不同的检索任务或数据源,多代理协作,每个代理专注于不同的数据源或任务(如搜索引擎、企业应用、邮件系统等,然后将结果整合到一起生成答案。 >> 多智能体、任务分配、工具协作 | 高度模块化,强大的并行处理多个检索任务,适应性极高,高效率。 | 代理之间的协调较复杂,对系统设计和通信机制要求高。 | 超复杂的大规模任务,需要多个代理协同完成的场景,例如多轮对话、复杂推理等。 |