让AI像人一样思考和使用工具,reAct机制详解

reAct机制详解

  • reAct是什么
  • reAct的关键要素
  • reAct的思维过程
  • reAct的代码实现
    • 查看效果
    • 引入依赖,定义模型
    • 定义相关工具
    • 集合工具创建代理
    • 启动测试
    • 完整代码
  • 思考

reAct是什么

reAct的核心思想是将**推理(Reasoning)和行动(Acting)**结合起来。具体来说,reAct 赋予了 AI agent 思维链Cot的思考能力和使用工具Action的能力。对于一个复杂问题agent首先利用其强大的推理能力对环境进行分析和理解,识别出需要解决的问题和可用的资源。然后,它根据推理结果制定行动计划,并选择合适的工具或方法来执行计划。最后达到像人一样分析和使用工具最后解决问题的效果。

reAct的关键要素

  • 强大的推理能力
  • 丰富的工具库
  • 灵活的行动策略
  • 持续的反馈机制

reAct的思维过程

举个例子比如问模型一个问题羊村旁边的地方是什么?它的面积加上它的面积是多少?,正常模型肯定回答不了,可是添加上reAct他就被赋予了思考和使用工具获取信息的能力,分析过程大概如下:

分析1:我需要先搜索羊村旁边的地方,然后获取该地方的面积,最后计算面积的总和,首先我得先知道羊村旁边是什么地方

行动1:调用地点搜索工具

分析2:获取到的地点是狼堡,我需要搜索狼堡的面积,然后计算面积的总和

行动2:调用地点面积搜索工具

分析3:获取到面积是500,我已经获取了狼堡的面积,现在需要计算面积的总和。

行动3:调用数字相加计算工具(如果数字比较复杂可能需要专业的数学工具计算)

分析4:计算出结果是1000

行动4:进行最终答复:羊村旁边的地方是狼堡,狼堡的面积是500,加上它的面积是1000。

就这样模型通过reAct完成了一整个复杂问题的拆解和逐步解决。我们可以通过代码来实现并查看一整个过程

reAct的代码实现

我们用langChain搭配deepseek模型去实现reAct的一整个过程,我们先来看看最终结果。

查看效果

在这里插入图片描述
可以看到利用reAct机制LLM确实跟我们预想的一样完成了推理和使用工具。下面我们来看实现。

引入依赖,定义模型

注意key换成deepseek的key

from langchain import hub
from langchain.agents import create_structured_chat_agent, AgentExecutor
from langchain.memory import ConversationBufferMemory
from langchain.tools import BaseTool
from langchain_openai import ChatOpenAI

model = ChatOpenAI(
    model='deepseek-chat', 
    openai_api_key='xxx',
    openai_api_base='https://api.deepseek.com',
    max_tokens=4096
)

定义相关工具

# 定义数字计算工具
class SumNumber_tool(BaseTool):
    name = "数字相加计算工具"
    description = "当你被要求计算数字相加时,使用此工具"

    def _run(self, a, b):
        return a + b  # 直接返回两个数的和
        

# 模拟地点搜索工具(实际使用可以调用内置的google-serper)
class PlaceSearch_tool(BaseTool):
    name= "地点搜索工具"
    description = "当你需要搜索地点时,使用这个工具"

    def _run(self, query):
        return "狼堡"
    
# 创建地点面积搜索工具
class AreaSearch_tool(BaseTool):
    name= "地点面积搜索工具"
    description = "当你需要搜索地点面积时,使用这个工具"

    def _run(self, query):
        return 500

集合工具创建代理

# 工具集合
tools = [SumNumber_tool(), PlaceSearch_tool(), AreaSearch_tool()]
# 提示词,langchain hub内置提示词,之后文章会再做详细分析
prompt = hub.pull("hwchase17/structured-chat-agent")
# 定义AI Agent
agent = create_structured_chat_agent(
    llm=model,
    tools=tools,
    prompt=prompt
)
# 记录上下文
memory = ConversationBufferMemory(
    memory_key='chat_history',
    return_messages=True
)
# 创建一个代理执行器
agent_executor = AgentExecutor.from_agent_and_tools(
    agent=agent, tools=tools, memory=memory, verbose=True, handle_parsing_errors=True
)

启动测试

# 测试场景
agent_executor.invoke({"input": "羊村旁边的地方是什么?它的面积加上它的面积是多少?"}) 

完整代码

from langchain import hub
from langchain.agents import create_structured_chat_agent, AgentExecutor
from langchain.memory import ConversationBufferMemory
from langchain.tools import BaseTool
from langchain_openai import ChatOpenAI

# 模型
model = ChatOpenAI(
    model='deepseek-chat', 
    openai_api_key='xxx',
    openai_api_base='https://api.deepseek.com',
    max_tokens=4096
)

# 定义数字计算工具
class SumNumber_tool(BaseTool):
    name = "数字相加计算工具"
    description = "当你被要求计算数字相加时,使用此工具"

    def _run(self, a, b):
        return a + b  # 直接返回两个数的和
        

# 模拟地点搜索工具(实际使用可以调用内置的google-serper)
class PlaceSearch_tool(BaseTool):
    name= "地点搜索工具"
    description = "当你需要搜索地点时,使用这个工具"

    def _run(self, query):
        return "狼堡"
    
# 创建地点面积搜索工具
class AreaSearch_tool(BaseTool):
    name= "地点面积搜索工具"
    description = "当你需要搜索地点面积时,使用这个工具"

    def _run(self, query):
        return 500

# 工具集合
tools = [SumNumber_tool(), PlaceSearch_tool(), AreaSearch_tool()]
# 提示词,langchain hub内置提示词,之后文章会再做详细分析
prompt = hub.pull("hwchase17/structured-chat-agent")
# 定义AI Agent
agent = create_structured_chat_agent(
    llm=model,
    tools=tools,
    prompt=prompt
)
# 记录上下文
memory = ConversationBufferMemory(
    memory_key='chat_history',
    return_messages=True
)
# 创建一个代理执行器
agent_executor = AgentExecutor.from_agent_and_tools(
    agent=agent, tools=tools, memory=memory, verbose=True, handle_parsing_errors=True
)


# 测试场景
agent_executor.invoke({"input": "羊村旁边的地方是什么?它的面积加上它的面积是多少?"})

思考

reAct是AI agent很重要的一个概念,它赋予了agent能够逐步推理和执行任务的能力。通过将复杂的任务分解为一系列简单的步骤,并通过使用工具去解决问题,让agent能够更高效地解决问题,最终让agent像人一样能够处理复杂问题。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/889738.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

SDH8303直插DIP8,7W-12W非隔离升压降压转换器

SDH8303是用于开关电源的内置高压 MOSFET 的电流模式 PWM 控制器,采用DIP-8封装,全电压下典型功率7W-12W。 SDH8303芯片内置高压启动电路,在轻载下会进入打嗝模式,具有降频、抖频、软启动、VDD 打嗝功能,还集成了 VDD …

猿人学 — 第1届第17题(解题思路附源码)

猿人学 — 第1届第17题 根据题目“天杀的Http2.0”大概知道,请求的协议应该遵照的是Http2.0协议,并且目标网站专门对此进行了检测,在Network面板中右键表头,勾选Protocol 果不其然,一堆请求都是遵照Http2.0协议。而u…

论文阅读 BLIP-2

Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language Models 使用冻结的图像编码器和大型语言模型进行语言-图像预训练的引导 BLIP-2 通过一个轻量级的查询变换器弥合了模态之间的差距。 Querying Transformer 第一阶段通过冻结的图像编…

Word排版 | 如何文字部分固定行距、图片(嵌入型)单倍行距

问题描述 在写一个要求比较高的项目报告,总共有109页 89张图片,而且必须用word写 因此: 文字部分需要固定行距23磅图片部分需要单倍行距(不然无法使用嵌入式) 难点 文字和图片难以有效分离,无法分别设…

3D渲图软件推荐:打造高质量渲染效果

在现代设计领域,3D渲图已经成为展示设计方案和产品外观的重要手段。无论是建筑设计、产品设计还是影视动画,都需要借助专业的3D渲染图软件来实现逼真的视觉效果。 本文将为您介绍几款备受好评的3D渲染图软件,帮助您在项目中选择合适的工具。…

筛选因数快速法+map

前言:老是忘记怎么快速筛选因数,我们只需要枚举小于sqrt( num ) 的数,这样可以降低很多复杂度,而且我们的因数一定是成对出现的,所以我们遇到一个因数的时候x,判断 x 2 x^2 x2 是否…

【华为】配置RIP协议

RIP(Routing Information Protocol)是一种内部网关协议(IGP),主要用于小型网络中的动态路由。RIP有两个主要版本:‌RIPv1和‌RIPv2,它们之间存在一些关键区别: ‌分类支持‌&#xf…

STM32之CAN外设

相信大家在学习STM32系列的单片机时,在翻阅芯片的数据手册时,都会看到这么一个寄存器外设——CAN外设寄存器。那么,大家知道这个外设的工作原理以及该如何使用吗?这节的内容将会详细介绍STM32上的CAN外设,文章结尾附有…

树的中心——dfs

题目 代码 #include <bits/stdc.h> using namespace std; const int N 1e510, M N*2; int h[N], e[M], ne[M], idx; int n; int ans 2e9; bool st[N]; void add(int a, int b) // 添加一条边a->b {e[idx] b, ne[idx] h[a], h[a] idx ; } int dfs(int u) {int…

系统移植一

使用设备是fs4412开发板 一、系统移植 系统移植是将一个操作系统或软件从一个硬件平台或处理器架构转移到另一个平台的过程。系统移植的主要目标是使软件在新的硬件环境下能够正常运行。在系统移植过程中&#xff0c;主要的改动集中在硬件相关的底层部分以及操作系统的核心模…

低代码工单管理app评测,功能与效率解析

预计到2030年&#xff0c;低代码平台市场将达1870亿美元。ZohoCreator助力企业构建定制化软件应用&#xff0c;以建筑行业工作订单管理app为例&#xff0c;简化流程&#xff0c;提升管理效率&#xff0c;降低成本。其用户友好界面、自动化管理、跨平台使用及全面报告功能受企业…

【高频SQL基础50题】31-35

又到SQL。 目录 1.查询结果的质量和占比 2.求关注者的数量 3.指定日期的产品价格 4.好友申请 II &#xff1a;谁有最多的好友 5.按日期分组销售产品 1.查询结果的质量和占比 聚合题。 # Write your MySQL query statement below SELECT t1.query_name,ROUND((SUM(t1.r…

【Linux探索学习】第四弹——Linux权限管理详解:理解用户、组和权限之间的关系

前言&#xff1a; 在前面我们已经学习了Linux的基础指令&#xff0c;相信大家对Linux已经有了一定的认识&#xff0c;今天我们来学习Linux权限的相关知识点&#xff0c;Linux权限是Linux初学者必须要掌握的内容 目录 一、Linux下用户类型 二、权限基本概念 三、权限的表示 四…

WebGoat JAVA反序列化漏洞源码分析

目录 InsecureDeserializationTask.java 代码分析 反序列化漏洞知识补充 VulnerableTaskHolder类分析 poc 编写 WebGoat 靶场地址&#xff1a;GitHub - WebGoat/WebGoat: WebGoat is a deliberately insecure application 这里就不介绍怎么搭建了&#xff0c;可以参考其他…

数据结构修炼——树?二叉树?堆?从入门到代码实现,第一弹!!!

目录 一、树的概念与结构1.1 树的概念1.2 树的相关概念1.3 树的表示及实际应用 二、二叉树概念及结构2.1 二叉树的概念2.2 特殊的二叉树2.2.1 满二叉树2.2.2 完全二叉树 2.3 二叉树的存储结构 三、二叉树的顺序结构与实现3.1 堆的概念及结构3.2 堆的实现3.2.1 堆的创建与销毁3.…

安卓13禁止用户打开开发者选项 android13禁止用户打开开发者选项

总纲 android13 rom 开发总纲说明 文章目录 1.前言2.问题分析3.代码分析4.代码修改5.编译6.彩蛋1.前言 设置 =》关于平板电脑 =》版本号,一般的话,在这里连续点击就可以打开我们的开发者选项了。但是有些系统要进行保密,因此要禁止用户进入。 2.问题分析 这里我们是通过点…

Android Framework AMS(02)AMS启动及相关初始化5-8

该系列文章总纲链接&#xff1a;专题总纲目录 Android Framework 总纲 本章关键点总结 & 说明&#xff1a; 说明&#xff1a;本章节主要涉及systemserver启动AMS及初始化AMS相关操作。同时由于该部分内容过多&#xff0c;因此拆成2个章节&#xff0c;本章节是第二章节&…

【技术】Jaskson的序列化与反序列化

文章目录 概念解释1.Jasksona.JSONJSON 的基本特点JSON 的基本结构JSON 示例 b.ObjectMapper类 2.序列化与反序列化a.序列化对象序列化集合序列化ListSetMap b.反序列化反序列化单个对象反序列化集合对象 概念解释 1.Jaskson Jackson 是一个用于处理 JSON 数据的 Java 库,所以…

vue-插槽作用域实用场景

vue-插槽作用域实用场景 1.插槽1.1 自定义列表渲染1.2 数据表格组件1.3 树形组件1.4 表单验证组件1.5 无限滚动组件 1.插槽 插槽感觉知道有这个东西&#xff0c;但是挺少用过的&#xff0c;每次看到基本都会再去看一遍用法和概念。但是在项目里&#xff0c;自己还是没有用到过…

基于SpringBoot+Vue的疫情物资管理系统(带1w+文档)

基于SpringBootVue的疫情物资管理系统(带1w文档) 基于SpringBootVue的疫情物资管理系统(带1w文档) 本课题研究和开发疫情物资管理系统管理系统&#xff0c;让安装在计算机上的该系统变成管理人员的小帮手&#xff0c;提高疫情物资管理系统信息处理速度&#xff0c;规范疫情物资…