LangGraph实战:构建智能文本分析流水线
1. 智能文本分析
LangGraph是基于图结构的工作流开发框架,通过节点函数和条件流转实现复杂业务逻辑。四大核心能力:
1.1 状态容器
统一管理流程执行上下文,支持JSON序列化存储
1.2 智能路由
基于条件判断实现动态分支跳转
1.3 可视化调试
自动生成Mermaid流程图,直观展示业务流程
1.4 持久化存储
支持流程状态的保存与恢复
根据自身业务自定义文本数据处理流程:
2. 环境准备
2.1 安装依赖库
!pip install langgraph langchain langchain-openai python-dotenv
2.2 配置API密钥
import os
from dotenv import load_dotenv
load_dotenv()
os.environ["OPENAI_API_KEY"] = os.getenv('OPENAI_API_KEY') # 从.env加载密钥
3. 构建文本处理流水线
本案例实现文本分类->实体抽取->摘要生成的三步流水线
3.1 状态容器定义
from typing import TypedDict, List
class ProcessState(TypedDict):
raw_text: str # 原始文本
category: str # 分类结果
entities: List[str] # 实体列表
summary: str # 摘要结果
3.2 初始化大模型
from langchain_openai import ChatOpenAI
#llm = ChatOpenAI(model="gpt-4-mini", temperature=0)
# 这里把gpt替换成deepseek
llm = ChatOpenAI(
base_url="https://api.deepseek.com/v1", # DeepSeek API端点
model="deepseek-chat", # DeepSeek模型标识
openai_api_key="sk-eddxxxxxxxxxxxxxxxxxxxx", # 替换为DeepSeek密钥
max_tokens=1000