最近利用Langchain+ChatGPT实现了上传文档实现个人知识库应用的能力,效果比想象得要好。文末大家可以体验一下效果~~
给大家大致介绍下实现方式,参考了Langchain chatchat。
一、Langchain+ChatGPT
1、概述
LangChain 是一个强大的框架,可以简化构建高级语言模型应用程序的过程。
LangChain是一个强大的框架,旨在帮助开发人员使用语言模型构建端到端的应用程序。它提供了一套工具、组件和接口,可简化创建由大型语言模型 (LLM) 和聊天模型提供支持的应用程序的过程。LangChain 可以轻松管理与语言模型的交互,将多个组件链接在一起,并集成额外的资源,例如 API 和数据库。
本应用借鉴LangChain chatchat 基于 ChatGPT大语言模型与 Langchain 应用框架实现的检索增强生成 (RAG) 大模型的本地知识库问答应用项目
2、实现原理
本项目实现原理如下图所示,过程包括加载文件 -> 读取文本 -> 文本分割 -> 文本向量化 -> 问句向量化 -> 在文本向量中匹配出与问句向量最相似的 top k 个 -> 匹配出的文本作为上下文和问题一起添加到 prompt 中 -> 提交给 LLM 生成回答。
从文档处理角度来看,实现流程如下:
二、Langchain+ChatGPT 使用
1、试试总结文档
user:文档中得内容是做什么的?
assistant:文档中的内容是一个单元测试卷,主要用于评估学生的英语语言能力。测试卷包括选择题、填空题和句子改写等多种类型的题目,旨在考查学生的语法、词汇、阅读理解及书写能力。
总结效果准确,题型、内容、考察范围都是对的。
2、试试解答其中一道试题
3、使用4o对比4o mini的解答区别
Over!
大家如果觉得感兴趣可以试试~