简单介绍下RAG的基础知识和RAG开源应用 “茴香豆"
一. RAG 基础知识
1. RAG工作原理
RAG是将向量数据库和大模型问答能力的有效结合,从而达到让大模型的知识能力增加的目的。首先将知识源存储在向量数据库中,当提出问题时,去向量数据库检索,找到相关的部分后,一起送给大模型生成最终的回答。
2.RAG工作流程
3.RAG发展进程
RAG最早由Meta的Lewis提出,其中有三类RAG,分别是Naive RAG,Advanced RAG, Modular RAG。
4. RAG常见优化方法
常见的优化方法有嵌入优化,索引优化,查询优化,上下文管理,迭代检索,递归检索,自适应检索,LLM微调等。
5. RAG对比大模型微调
使用的RAG的优势在于可以动态更新知识,处理长尾知识问题,但依赖外部知识库的质量和覆盖范围,依赖大模型能力。
大模型微调的优势可以让模型性能针对特定任务优化,但需要大量的标注主句,且对新任务的适应性较差。
6. 评估框架和基准测试
7. RAG总结
二. RAG开源项目 -- 茴香豆
1. 茴香豆介绍
茴香豆是一个基于LLMs的领域知识助手,由书生浦语团队开发的大模型应用。
2. 茴香豆的特性
茴香豆具有 免费开源且可商用,高效准确,领域知识,部署成本低,安全,扩展性强等特点。
3. 茴香豆构建
构建一个基于茴香豆的RAG应用,需要前端如微信,飞书;知识库文档;大模型后端(可支持主流大模型远程或本地)