相比传统 RAG 仅能独立检索文本片段的局限性,GraphRAG通过构建实体关系图谱实现了信息间的连接,让 AI 能更完整地理解和检索复杂的关联信息,从而生成更准确和连贯的回答
问题背景:
想象有一本详细记录某人(X)成就的传记,每个章节都描述了他的一项成就。现在我们想要总结这个人的所有成就
传统 RAG 的局限性:
- 只能获取有限数量(top-k)的相关文本片段
- 各个文本片段是独立检索的
- LLM 需要自行推断这些片段之间的联系
- 可能会遗漏重要信息
GraphRAG 的解决方案:
- 首先用 LLM 理解文档内容,构建实体关系图
- 创建完整的实体和关系网络,例如:
X → 完成了 → 成就1
X → 完成了 → 成就2
…以此类推 - 检索时可以通过图遍历获取所有相关context
- 能够提供更连贯和完整的答案
GraphRAG 的优势:
- LLM 天生擅长处理结构化数据
- GraphRAG 的检索机制提供了这种结构化的数据格式
- 可以更好地保持实体间的关系完整性