1.说明
RAG结合LLM(通用大预言模型)构件基于私有文档、专业领域知识、实时信息的charbot。
2.RAG的主要步骤
- 知识切片成chunk
- 向量化chunk入库
- query检索知识chunk
- 构件prompts
- 调用llm生成回答
3.优势
- 快速构件demo
- 快速理解rag
- 社区支持
4.痛点
- 投入大
- 效果差
- 调优难
5.RAG应用的效果
整体效果=文档处理效果*embedding效果*retrieval效果*LLM效果
6.数据处理的难点:解析和拆分
1.PDF格式的多样性(eg:标准格式、跨页表格、离散等),会有复杂多变的文档格式,提高效果的困难度。
解决办法:
2.文档内容质量将很有程度影响最终效果。