学习使用LangGraph x GPT-Researcher构建一个多智能体架构的AI自主研究助理

原文:学习使用LangGraph x GPT-Researcher构建一个多智能体架构的AI自主研究助理 - 百度智能云千帆社区

本文为大家剖析一个通过多智能体协作来完成的AI研究助理,可以用来帮助进行各种综合的在线研究任务并输出报告。该应用基于LangGraph以及开源的GPT-Researcher项目而构建,我们将为大家介绍与剖析这个应用,你可以在此基础上做简单改造(如修改分析数据源、提示词等),以适应自身需要。



业务场景

通常,如果需要从头开始一个主题(比如“生成式人工智能中的伦理偏见与公平性")的深入研究,我们最期望的是能够快速的获取多个来源的值得信赖的信息,这可能需要在多个网站之间不断点击与浏览,通过一系列检索、聚合、细化、整理等工作来完成任务。当然,现在你可以借助大模型,但是简单的模型输出或者RAG(检索增强生成)会面临这样的问题:

  • 大模型训练的信息过时,容易产生幻觉
  • 受限于上下文限制,不太适合输出长篇研究报告
  • 网络搜索获得的参考资源不足,导致不全面与偏见
  • RAG系统更适合回答问题而不是编写长篇报告



所以期望有一个设计合理的AI智能体,能够自主的完成这样的研究任务:

  • 对输入的研究主题进行细分,生成研究提纲与子课题
  • 对子课题来获取相关的参考信息(本地或网络)
  • 对获取的信息整理、汇总、分析,得出研究结论或报告
  • 对报告进行自我反省与审核,并提出问题与指出不足
  • 根据审核结果修订研究报告,并能获得人类反馈
  • 结合研究的中间成果,输出最终的全面研究报告



架构设计

随着AI Agent理论与框架的演进,多智能体系统(Multi-Agent System)以其更灵活的架构,以及更接近人类社会组织与分工形式的设计而获得广泛关注。







多智能体系统相对单智能体展现出了一些独有的特点与优势:

  • 通过多个相互独立但协作的智能体来完成复杂任务,每个智能体拥有不同的视角或能力,可以更全面地理解和处理复杂问题
  • 任务可以被分解并分配给不同的智能体,并行处理后再综合结果。能够加速任务完成,并提高系统的整体效率和准确性
  • 可以根据任务需求动态地调整各智能体的角色与职责,更好地适应变化的环境,通过调整智能体之间的互动模式,应对不同的挑战



多智能体更适用于需要多角度、多角色参与,需要分工协作、任务分解的场景与复杂任务。这个项目中设计的多智能体研究助理架构如下:







图中展示出涉及的角色(智能体)包括:

  • Researcher:研究员。针对研究主题采集网络资源,做自主研究
  • Editor:编辑。负责初期规划研究大纲和整体结构
  • Reviewer:审阅。根据设定的标准对研究结果进行检查验证
  • Revisor:修订。根据审阅结果对研究结果进行修订
  • Writer:撰写。根据研究输出撰写最终报告内容
  • Publisher:发布。负责用不同的格式发布最终研究报告



除了智能体以外,也支持人类(Human)角色参与到流程,并在适当的时机给出反馈。这在多智能体系统中也很常见,通常用于审核或给出额外任务指令。



这里的基本工作流程为:

  1. 根据给定的研究主题,参考互联网资源进行初步研究
  1. 根据初步研究结果制定报告提纲(子课题)
  1. 对每个子课题做深入研究、审阅与修改,直到满意为止
  1. 汇总子课题的研究结果撰写最终报告,并输出多格式文档er q



基于LangGraph的实现

LangGraph是大模型应用开发框架LangChain的扩展包。LangGraph通过把一个Single-Agent或Multi-Agent系统的工作流用Graph(图结构)来设计与表示,从而能够支持最复杂的任务节点与关系,以支持构建更强大、能支持循环流的Agent应用。

如果对LangGraph不熟悉,请参考以下两篇:

 彻底搞懂LangGraph:构建强大的Multi-Agent多智能体应用的LangChain新利器 

 彻底搞懂LangGraph:构建一个可自我纠正的增强知识库RAG应用



【Graph设计】

这里对上面的AI研究助理设计Graph图如下:









【State设计】

LangGraph中需要定义的State对象是用来保存在各个节点之间传递的必需信息,这样每个节点可以访问这个统一的数据对象实现数据共享。这个项目中的State的结构设计如下:

State中的信息分成研究任务相关(比如任务内容、子课题、参考数据、人类反馈等)与输出报告相关(标题、简介、内容等)两个部分。



【基于LangGraph的主流程】

现在,假设已经准备好所有的Agent及其行为(比如研究、审核等),就可以根据上面的Graph图开发Workflow。步骤是:

  • 创建多个agent
  • 创建主workflow
  • 增加workflow中的节点(agent及其动作)
  • 增加workflow中的边(节点之间的关系)

注意到这里有个条件边(conditional_edge),用来根据人类的不同反馈决定下一步的动作(继续还是重新做初步研究)。

【并行子流程:子课题研究】



在规划完任务研究提纲后,需要对提纲中的每个子课题进行深入研究。这可以通过并行的方式启动多个子研究任务来完成,以提升速度与效率。为了能够实现并行,需要设计并开发一个独立的子Workflow,且其运行时不会相互影响,也不会影响到主流程。这个子Workflow创建如下:

需要注意的是为了让每个子任务运行时具有独立的状态,必须设计一个用于子Workflow的State(即代码中的DraftState)对象,用来保存子任务运行过程中的子课题、草稿内容、审查结果、修订说明等。



【Agent设计】

在这个多智能体系统中,AI的职责被设计与分工到不同的Agent,因此单个Agent的功能其实是比较简单的,而且这里除了browser与researcher这两个Agent(这两个借助了现成的GPT-Researcher库),不需要借助外部的Tools,只需要借助大模型提示来完成即可。以上面的planner这个agent的实现为例,其动作提示词如下(翻译成中文):

而对于“人类”这个特殊的角色,无需借助大模型,简单的获得人类反馈信息即可,并保存到State对象即可:



Plain Text

收起

 

async def review_plan(self, research_state: dict):

layout = research_state.get("sections")



user_feedback = None

user_feedback = input(f"Any feedback on this plan? {layout}? If not, please reply with 'no'.\n>> ")

if user_feedback and "no" in user_feedback.lower():

user_feedback = None



return {"human_feedback": user_feedback}



其他的Agent可以参考项目的详细代码,这里不再做一一介绍。

最后,在完成Agent与Workflow的创建后,就可以运行已经创建好的Workflow,输入任务信息即可启动一个自主运行的AI研究助理,等待最终输出即可(中间需要给出人类的确认反馈)。



Plain Text

收起

 

...

#创建主workflow

research_team = init_research_team()

chain = research_team.compile()

result = await chain.ainvoke({"task": "研究任务"})



以上介绍了一个基于LangGraph与GPT-Researcher项目构建的多智能体AI研究助理,用来根据输入的任务自主的借助互联网进行规划、研究、反思、修订并最终输出研究报告。这个项目很好地演示了多智能体系统的应用场景,以及LangGraph与GPT-Researcher项目的应用。有兴趣的朋友可以参考源项目做进一步探索:



 https://github.com/assafelovic/gpt-researcher/tree/master/multi_agents

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/875755.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

electron有关mac构建

针对 Mac M1/2/3 芯片的设备,proces.archarm64. 执行下面命令,检查下按照的 node.js 版本是不是 intel x64 指令集,如果是的话安装下 arm64 指令集的 node.js终端中执行以下命令:node -p process.arch 对应的node版本也是arm版 …

YoloV10 训练自己的数据集(推理,转化,C#部署)

目录 一、下载 三、开始训练 train.py detect.py export.py 超参数都在这个路径下 四、C#读取yolov10模型进行部署推理 如下程序是用来配置openvino 配置好引用后就可以生成dll了 再创建一个控件,作为显示 net framework 4.8版本的 再nuget工具箱里下载 …

春之学习:SpringBoot在线教育平台构建

第三章 系统分析 3.1 系统设计目标 在线视频教育平台主要是为了用户方便对首页、个人中心、用户管理、教师管理、课程信息管理、课程类型管理、我的收藏管理、系统管理、订单管理等信息进行查询,也是为了更好的让管理员进行更好存储所有数据信息及快速方便的检索功能…

僵尸网络开发了新的攻击技术和基础设施

臭名昭著的 Quad7 僵尸网络(也称为 7777 僵尸网络)不断发展其运营,最近的发现表明其目标和攻击方法都发生了重大变化。 根据 Sekoia.io 的最新报告,Quad7 的运营商正在开发新的后门和基础设施,以增强僵尸网络的弹性&a…

K8s利用etcd定时备份集群结合钉钉机器人通知

如何通过脚本的方式进行K8s集群的备份 查看K8s中master节点中etcd集群的状态 kubectl get pods -n kube-system | grep etcd由于使用的etcd服务是K8s搭建时自身携带的,并不是独立搭建的etcd集群信息。使用 K8s 搭建集群时,etcd 是 Kubernetes 集成的一个重要组件因此需要查…

DDR3AXI4接口读写仿真

前文已经介绍了DDR3和AXI4总线的相关知识,我们知道MIG ip核除了可以生成native接口还能生成AXI4接口,今天就练习一下将AXI4接口的DDR3打包成FIFO。首先我们生成一个AXI4接口的MIG ip核,其余步骤与Native接口的ip核相同,如果我们勾…

vue3.0 使用echarts与echarts-gl 实现3D饼图

效果 安装echarts npm install echarts npm install echarts-gl 3d饼图组件&#xff1a; <template><div style"width: 100%; height: 100%" ref"echart"></div> </template><script setup> import { reactive, ref, onMou…

质量追溯管理在MES系统中举足轻重

1. 质量追溯管理概述 质量追溯管理是指通过记录和监控产品在生产过程中的关键信息&#xff0c;确保在产品出现质量问题时&#xff0c;能够迅速追踪到问题源头&#xff0c;并采取相应措施的一种管理方法。在现代制造业中&#xff0c;质量追溯管理对于保障产品质量、提升客户满意…

关于 vue/cli 脚手架实现项目编译运行的源码解析

1.vue项目运行命令解析 在日常开发中&#xff0c;vue 项目通过vue-cli-service脚手架包将项目运行起来&#xff0c;常用的命令例如&#xff1a; npm run serve npm run build 上述执行命令实际一般对应为项目中 package.json 文件的 scripts属性中编写的脚本命令&#xff0c;在…

Python 课程5-NumPy库

在数据处理和科学计算中&#xff0c;NumPy 是一个非常强大且基础的库。除了基本的创建数组功能之外&#xff0c;NumPy 提供了许多强大的函数和方法&#xff0c;用于执行高级的矩阵运算、统计分析、逻辑操作等。以下是一些常用且非常有用的 NumPy 指令&#xff0c;涵盖了创建数组…

java: 程序包org.junit.jupiter.api不存在

明明idea没有报错&#xff0c;引用包也没问题&#xff0c;为啥提示java: 程序包org.junit.jupiter.api不存在&#xff1f; 配置&#xff01;还TMD是配置&#xff01; 如果是引用包的版本不对或者其他&#xff0c;直接就是引用报错或者pom里面飘红了。 这个应该是把generat…

设置使用阿里云服务器DNS

由于云服务器是从腾讯云迁移到阿里云&#xff0c;然后使用ssl验证时一直无法使用dns验证&#xff0c;也无法创建三级域名&#xff0c;原来需要把阿里云服务器改成阿里云的dns使用 如果使用其他服务器DNS会下面会显示当前DNS服务器&#xff0c;

冯诺依曼体结构与系统

冯诺依曼结构 我们的计算机&#xff0c;以及服务器&#xff0c;还有我我们日常使用的洗衣机都遵循冯诺依曼体结构。 以我们日常使用qq聊天时举例&#xff0c;冯诺依曼体结构可以这样画 截至目前&#xff0c;我们所认识的计算机&#xff0c;都是有一个个的硬件组件组成 输入单元…

基于SpringBoot+Vue+MySQL的美术馆管理系统

系统展示 用户前台界面 管理员后台界面 系统背景 随着文化艺术产业的蓬勃发展&#xff0c;美术馆作为展示与传播艺术的重要场所&#xff0c;其管理工作变得日益复杂。为了提升美术馆的运营效率、优化参观体验并加强艺术品管理&#xff0c;我们开发了基于SpringBootVueMySQL的美…

SAP B1 营销单据 - 单据字段介绍(中)

背景 营销单据&#xff0c;SAP B1 中一群神秘的单据&#xff0c;在官方说明文档中并未指明【营销单据】范围&#xff0c;却经常使用这一说法。它们结构相似&#xff0c;在 用户定义字段(UDF) 功能里统一受【营销单据】部分增加字段的影响&#xff0c;可以相互复制&#xff08;…

POI生成Excel文件增加数据验证(下拉序列)

POI版本为5.2.2 正常的如果不超过255字符的数据验证可以参照如下代码&#xff1a; /*** <p>设置某列的数据验证</p>* param Sheet 作用于哪一个sheet* param colIndex 需要增加数据验证的列的索引* String[] names 数据验证的序列&#xff0c;就是excel下拉列表的内…

codesys将自定义的功能块或者函数保存到本地库

将通过ST代码实现的自定义功能保存到codesys的本地库&#xff0c;其他project可以直接实现调用。提高灵活性和效率。 1、创建库工程 这里可能会提示涉及个别库没有安装或版本更新&#xff0c;根据提示安装对应库或更新即可。 2、添加功能块和函数 3、编写功能块和函数的参数定…

【Linux】查看操作系统开机时初始化的驱动模块列表的一个方法

这个方法是摸索出来的&#xff0c;也不一定对&#xff1a; 1、驱动层module_init(module_init_function)作为模块初始化&#xff0c;并且提供模块内部初始化的函数名&#xff1b; 2、找到所有驱动目录drivers下所有module_init(module_init_function)&#xff0c;在内核6.9.0…

js 深入理解生成器

目录 概述1 . 生成器基础2. 与普通函数的区别3. 通过 yield 中断执行3.1 yield 是干嘛的&#xff1f;3.2 yield 和 return 的区别3.3 每个生成器对象作用域都是独立的3.4 yeild 的使用位置3.5 生成器对象作为可迭代对象3.6 使用 yield 实现输入和输出3.6.1 yield实现输入3.6.1 …

4G物联网智能电表是什么?什么叫4G物联网智能电表?

4G物联网智能电表是一种结合了4G无线通信技术的新型电能计量设备&#xff0c;用于实时采集和传输用户的用电数据。它通过集成现代信息技术和电力电子技术&#xff0c;不仅能够精确测量电力消耗&#xff0c;还能实现远程数据传输、数据分析、远程控制等多种功能。本文将详细介绍…