检索增强生成(RAG)技术作为自大模型兴起后爆火的方向之一,已经广受研发者们追捧,大型语言模型(LLMs)如GPT系列和LLama系列在自然语言处理领域取得了显著的成功,但它们面临着幻觉、过时知识和不透明、不可追溯的推理过程等挑战。检索增强生成(RAG)通过整合外部数据库的知识,作为一种有前景的解决方案,增强了模型的准确性和可信度,特别是对于知识密集型任务。RAG将LLMs的内在知识与外部数据库的庞大、动态的知识库相结合。其中包括以下关键步骤:
- 向量存储库: 使用向量存储库来存储非结构化文档,即知识语料库。
- 检索模型: 针对查询使用检索模型,通过嵌入相似性检索语料库中的相关文档。
- 回答模型: 使用合成模型生成响应,结合检索和生成的优势,提高聊天机器人的效果。
RAG关键优势在于在生成响应时结合了检索和生成的优势,从而提高了聊天机器人的性能。 但此种流程也存在的不足之处,如不够精确、可能返回不相关的上下文等问题。
什么是重排序?
重排序是信息检索系统中的一个重要步骤,它发挥着优化检索结果的关键作用。在初始检索阶段,系统根据某种标准(如相似度)返回一组文档。然而,由于初始排序可能并不总是能够准确反映文档与查询的真实相关性,因此需要进行重排序来提升检索结果的质量。
不同的重排序方法
- 使用检索模型进行二次检