Langchain介绍
- Langchain介绍
- 前言
- 1、Langchain 是什么
- 2、为什么要用 Langchain
- 3、Langchain 的核心
- 4、Langchain 的底层原理
- 5、Langchain 的应用场景
Langchain介绍
前言
想象一下,如果你能让聊天机器人不仅仅回答通用问题,还能从你自己的数据库或文件中提取信息,并根据这些信息执行具体操作,比如发邮件,那会是什么情况?Langchain 正是为了实现这一目标而诞生的。
备注:本系列文章基于B站课程: 马士兵-AI大模型全套教程(学习路线+LLM大语言模型+RAG实战+Langchain+ChatGLM-4+Transformer+DeepSeek) 学习整理得到。
1、Langchain 是什么
Langchain 是一个用于开发由大型语言模型 (LLM) 提供支持的应用程序的框架。
它允许开发人员像 GPT-4 这样的大型语言模型与外部的计算和数据源结合起来。
Lanchain 通过三个核心组件实现增强:
- 首先是 Compents “组件”,为 LLMs 提供接口封装、模版提示和信息检索索引;
- 其次是 Chains “链”,它将不同的组件结合起来解决特定的任务,比如在大量文本中查找信息;
- 最后是 Agents “代理”,它们使得 LLMs 能够与外部环境进行交互,例如通过 API 请求执行操作。
2、为什么要用 Langchain
理由:
- 数据连接:Langchain 允许你将大型语言模式连接到你自己的数据源,比如数据库、PDF文件或其他文档。这意味着你可以使模型从你的私有数据中提取信息。
- 行动执行:不仅可以提取信息,Langchain 还可以帮助你根据这些信息执行特定操作,比如发送邮件。
3、Langchain 的核心
- 模型 Models:包装器允许你连接到大型语言模型,如 GPT-4 或 Hugging Face 也包括 GLM 提供的模型;
- Prompt Templates:这些模版让你避免硬编码文本输入。你可以动态地将用户输入插入到模版中,并发送给语言模型;
- Chains:链允许你将多个组价组合在一起,解决特定的任务,并构建完整的语言模型应用程序;
- Agents:代理允许语言模型与外部 API 交互;
- Embeddings 嵌入与向量存储 VectorStore 是数据表示和检索的手段,为模型提供必要的语言理解基础;
- Indexes:索引帮助你从语言模型中提取相关信息。
4、Langchain 的底层原理
举例:如上图所示展示了一个智能问答系统的工作流程:
- 从用户提出的问题(Question)开始,然后通过相似性搜索(Similarity Search)在一个大型数据库或向量空间中找到与之相关的信息;
- 得到的信息与原始问题结合后,由一个处理模型分析,以产生一个答案(Anwser);
- 这个答案接着被用来指导一个代理采取行动(Action),这个代理可能会执行一个 API 调用或与外部系统交互以完成任务
整个流程反应了数据驱动的决策过程,其中包含了从信息检索到处理,再到最终行动的自动化步骤。
5、Langchain 的应用场景
Langchain 的应用场景非常广泛,包括但不限于:
- 个人助手:可以帮助预定航班、转账、减税等;
- 学习辅助:可以参考整个课程大纲,帮助你更快地学习材料;
- 数据分析和数据科学:连接到公司的客户数据或市场数据,极大地促进数据分析的进展。