Lagent AgentLego 智能体应用搭建——笔记

Lagent & AgentLego 智能体应用搭建——笔记

  • 一、智能体简介
    • 1.1、为什么要有智能体
      • 1.1.1、幻觉问题
      • 1.1.2、时效性
      • 1.1.3、可靠性
    • 1.2、智能体的含义
    • 1.3、智能体的组成
      • 1.3.1、大脑
      • 1.3.2、感知
      • 1.3.3、动作
    • 1.4、智能体范式
      • 1.4.1、AutoGPT
      • 1.4.2、Rewoo
      • 1.4.3、ReAct
  • 二、Lagent 和 AgentLego
    • 2.1、Lagent 简介
    • 2.2、AgentLego 简介
    • 2.3、两者的关系

详细视频:Lagent & AgentLego 智能体应用搭建

一、智能体简介

1.1、为什么要有智能体

主要因为随着大语言模型的快速发展,即使如 GPT-4 这样的大模型,在某些场景下也会出现不能满足实际需求的情况,有诸多的局限性。

1.1.1、幻觉问题

如果大模型对于提问的问题所设计的知识不清楚,模型可能会生成虚假信息,与现实严重不符或脱节。

在这里插入图片描述

1.1.2、时效性

因为大模型的训练数据往往都是截止在某一个时间点,并不能随着时间流逝而同步更新,如果没有类似于 RAG 这种技术,那么模型训就无法反映最新趋势和信息。

在这里插入图片描述

1.1.3、可靠性

当面对较为复杂的任务时,大模型可能频发错误输出现象,影响信任度。

在这里插入图片描述

1.2、智能体的含义

根据 Barbara Hayes-Roth 在 An architecture for adaptive intelligent systems 论文中所说,一个智能体应当满足以下三个条件:

  • 可以感知环境中的动态条件
    (perception of dynamic conditions in the environment)
  • 能采取动作影响环境
    (action to affect conditions in the environment)
  • 能运用推理能力理解信息、解决问题、产生推断、决定动作
    (reasoning to interpret perceptions, solve problems, draw inferences, and determine actions)

1.3、智能体的组成

1.3.1、大脑

作为控制器,承担记忆、思考和决策任务。接受来自感知模块的信息,并采取相应动作。

1.3.2、感知

对外部环境的多模态信息进行感知和处理。包括但不限于图像、音频、视频、传感器等。

1.3.3、动作

利用并执行工具以影响环境。工具可能包括文本的检索、调用相关 API、操控机械臂等。

1.4、智能体范式

1.4.1、AutoGPT

AutoGPT 是一种自动化文本生成模型 ,它是基于 GPT 的改进版,通过自动搜索算法来优化 GPT 的超参数,从而提高其在各种任务上的表现。

AutoGPT 通过 Zero-shot learning 理解人类给它设定的角色和目标,再通过 多任务学习 ( Multi-task Learning, MTL ) 将人类设定的目标进行任务拆解成各个子任务,期间以 Few-shot learning 的方式生成提示,最后利用 Meta-learning 评估任务是否达标。

在这里插入图片描述

1.4.2、Rewoo

可以阅读原论文 ReWOO: Decoupling Reasoning from Observations for Efficient Augmented Language Models

以往大模型调用外部工具的流程是:获取响应,根据响应进行下一步操作。虽然简单易行,但通常会导致巨大的计算量,因为假如一个问题没法一次性解决,最后模型的输入就是随着询问次数增加而倍增的。

在本文中作者提出了将这些步骤都独立开来,也就是假设一个问题没法一次性解决,需要调用 k 次外部工具时,首先利用一个 planner 安排好 k 次独立的询问,利用 worker 对着 k 次询问分别进行查询,最后将 planner 设计好的独立询问、从worker得到的对于每一个询问的查询结果以及一些 prompt 信息输入给 solver,由 solver 给出最终的结果。

感觉可以理解为一个空间换空间的思路,就是通过增加模型参数,换取更多的外部信息辅助LM进行回复
![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/02504b6184a643448777a2021d12718

1.4.3、ReAct

原论文为 ReAct: Synergizing Reasoning and Acting in Language Models

想快速了解含义的,可以参考这篇文章 ReAct论文解读:LLM ReAct范式,在大语言模型中结合推理和动作

我们知道在大语言模型(LLM),通过思维链(chain-of-thought)机制进行适当的提示后,这些 LLM 展示了出色的能力。它们能执行各种任务,如算术计算、常识推理和符号问题解决。然而,这种思维链受限于模型内部表示的依赖,更严重的后果是限制了其基于现实世界数据主动探索、推理或更新知识的能力。

相反地,一些最新的研究在交互式场景中应用了预训练的语言模型的推理与行动能力,例如基于文本的游戏、网页导航和机器人技术。这些研究主要专注于通过语言模型的内部知识将文本上下文转化为可行动的步骤。然而,这些方法缺乏对高层次目标的抽象思考能力,或维护用于长期任务的工作记忆。

ReACT,即 Reason + Action 的新范式融合了推理和行动的优点,能够让语言模型以交错方式生成语言推理轨迹和文本行动。动作会影响外部环境,从而返回观察反馈。与此不同,推理轨迹不会影响外部环境。相反,它们会通过在上下文中进行推理并用有用的信息更新它,从而影响模型的内部状态。这些内部状态被用来更新模型的预测算法,以支持未来的推理和行动。

在这里插入图片描述

二、Lagent 和 AgentLego

2.1、Lagent 简介

Lagent 是一个轻量级开源智能体框架,旨在让用户可以高效地构建基于大语言模型的智能体。它支持多种智能体范式,如 AutoGPT、ReWoo、ReAct。同时,它也支持多种工具 ,如谷歌搜索、Python解释器等。

下图为 Lagent 的基本流程。

在这里插入图片描述

2.2、AgentLego 简介

AgentLego 是一个提供了多种开源工具 API 的多模态工具包,旨在像是乐高积木一样,让用户可以快速简便地拓展自定义工具,从而组装出自己的智能体。通过 AgentLego 算法库,不仅可以直接使用多种工具,也可以利用这些工具,在相关智能体框架(如 Lagent,Transformers Agent 等)的帮助下,快速构建可以增强大语言模型能力的智能体。

AgentLego 的宣传图如下。
在这里插入图片描述

2.3、两者的关系

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/573131.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

账号安全及应用

一、账号安全控制 1.1系统账号清理 将用户设置为无法登陆 锁定账户 删除账户 设定账户密码,本质锁定 锁定配置文件-chattr: -a 让文件或目录仅供附加用途。只能追加 -i 不得任意更动文件或目录。 1.2密码安全控制 chage 1.3历史命令 history&am…

Unity 踩坑记录 Rigidbody 刚体重力失效

playerSetting > physics > Gravity > 设置 Y 的值为负数

SpringBoot 根据不同环境切换不同文件路径

最简单的办法就是使用多个 application.yml 配置文件 。一个叫 application-test.yml 测试用;另一个是正式使用的 application-prod.yml 。win环境下大部分是开发测试时候使用的,服务正式上线需要部署在Linux服务器上又换成了Linux。但开发初期或者项目…

Docker容器概念介绍与基本管理

前言 在软件开发和部署环境中,使用 Docker 等容器技术可以帮助团队实现快速、一致、可靠的应用程序部署,提高开发效率和应用程序的可移植性。 目录 一、虚拟化产品介绍 1. 云服务模型 1.1 IaaS 1.2 PaaS 1.3 SaaS 1.4 DaaS 2. 产品介绍 2.1 虚…

5款好用的监控员工电脑软件推荐 (如何监控员工上班工作情况)

在现代的商业环境中,管理和监控员工的工作内容是至关重要的。 为了确保员工的工作效率和质量,公司需要使用一些工具来监控他们的工作进程。 以下是五款实用的监控员工工作内容的软件。 域智盾软件 域智盾是一款专为企业打造的智能管理系统。 它借助人…

FPGA设计篇——波形绘制软件

FPGA设计篇——波形绘制软件 写在前面一、Visio二、TimeGen三、WaveDrom写在最后 写在前面 在FPGA设计过程中,经常需要编写设计文档,其中,不可缺少的就是仿真波形的绘制,可以直接截取Vivado或者Modelsim平台实际仿真波形&#xff…

JVM学习笔记(四)类加载与字节码技术

目录 一、类文件结构 二、字节码指令 2.3 图解方法执行流程 1)原始 java 代码 2)编译后的字节码文件 3)常量池载入运行时常量池 4)方法字节码载入方法区 5)main 线程开始运行,分配栈帧内存 6&…

分布式-知识体系

分布式系统 本质就是一堆机器的协同,要做的就是用各种手段来让机器的运行达到预期 分布式业务场景 分布式四纵四横说 基于 MSA(微服务架构)的分布式知识体系 相关概念 – 【摘自网络原文】 节点与网络 节点 传统的节点也就是一台单体的物…

搞嵌入式到底属于程序员吗?

搞嵌入式到底属不属于程序员呢?毫无疑问,当然算啊!而且我十分赞同另一位朋友所说的:嵌入式程序员是难得的全栈型程序员。尽管嵌入式领域方向众多且繁杂,但他们同样也是会写代码的程序员。 嵌入式行业主要分为硬件和软…

《从零开始的Java世界》11网络编程

《从零开始的Java世界》系列主要讲解Javase部分,从最简单的程序设计到面向对象编程,再到异常处理、常用API的使用,最后到注解、反射,涵盖Java基础所需的所有知识点。学习者应该从学会如何使用,到知道其实现原理全方位式…

打开IIS网站网页错误提示Argument ‘Key must not be null‘ cannot be null.解决方案 Oracle数据库监听

打开网页异常如下: /“应用程序中的服务器错误。 Argument Key must not be null cannot be null.参数名:Key must not be null 客户端 连接oracle 提示:ORA-12541:TNS:无监听程序 按组合键WindowsR,打开运行 输入命令:lsnrctl s…

周报不止是汇报进度,如何用周报轻松提升团队协作效率?

周报是工作中常见的沟通工具,对于项目经理来说尤其重要。写周报不仅仅是为了完成一项任务,它更是项目管理中不可或缺的环节,它不仅有助于项目经理跟踪项目进度,还加强了团队成员间的沟通与协作。以下是几个关键的原因:…

Geoserver的RESTful接口使用

概述 GeoServer提供了一个RESTful接口,客户端可以通过该接口获取有关实例的信息并进行配置更改。REST接口使用简单的HTTP调用,通过客户端就可以配置GeoServer,而无需使用Web管理接口。 Geoserver中的关系 工作区、数据源、图层、图层组以及…

用 LMDeploy 高效部署 Llama-3-8B,1.8倍vLLM推理效率

节前,我们星球组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学,针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。 汇总…

微信小程序Vue+nodejs+uniapp课堂教学辅助在线学习系统

uni-app框架:使用Vue.js开发跨平台应用的前端框架,编写一套代码,可编译到Android、小程序等平台。 后台主要实现功能:一、用户的管理(用户的信息管理) 二、 课程的管理(课程发布,课后成绩的查看&#xff0c…

【C语言__联合和枚举__复习篇10】

目录 前言 一、联合体 1.1 联合体的概念 1.2 联合体与结构体关于声明和内存布局的比较 1.3 联合体的大小如何计算 1.4 使用联合体的2个示例 二、枚举体 2.2 枚举体的概念 2.2 枚举体的优点 前言 本篇主要讨论以下问题: 1. 联合体是什么,它有什么特点 …

每天一题crypto(1)---RSA(小明文攻击)

零.做题: 看到N很大,如果满足 就表示模过程中,没有丢失信息,所以 直接解即可,不要管pq等等 一.题目: N很大 from Crypto.Util.number import * from gmpy2 import *flag bNSSCTF{******}p getPrime(5…

【SpringBoot整合系列】SpringBoot配置多数据源

目录 背景技术选型配置多数据源思路(以两个为例)代码实现1.导入依赖2.各自的配置 3.各自的dataSourcenews数据库的smbms数据库的注意:Primary注解 4.各自的SqlSessionFactory等news数据库的smbms数据库的 5.去掉启动类头上的MapperScan6.各自的mapper接口7.各自的ma…

防火墙分为哪三类以及他们的优缺点

1. 包过滤防火墙(Packet Filtering Firewall)2. 状态检查防火墙(Stateful Inspection Firewall)3. 应用层防火墙(Application Layer Firewall)零基础入门学习路线视频配套资料&国内外网安书籍、文档网络…

Spring Cloud Alibaba Sentinel 使用

初识Sentinel Sentinel是阿里巴巴开源的一款微服务流量控制组件。官网地址: home | Sentinel 需要了解的概念 簇点链路 在学习 Sentinel 的使用之前,我们有必要首先了解一下簇点链路。当请求进入微服务时,首先会访Controller、Service、Ma…