【InternLM实战营---第六节课笔记】

一、本期课程内容概述

本节课的主讲老师是【樊奇】。教学内容主要包括以下三个部分:
1.大模型智能体的背景及介绍
2. Lagent&AgentLego框架介绍
3.Lagent&AgentLego框架实战

二、学习收获

  1. 智能体出现的背景
    智能体的引入旨在克服大模型在应对复杂、动态任务时的局限性,主要体现在以下三个方面:
    • 减少幻觉: 智能体利用知识图谱、符号推理或交互式学习,增强对输入信息的理解与推理,降低生成与事实不符或逻辑混乱输出的风险。
    • 提升时效性: 智能体具备在线学习和实时适应环境变化的能力,能快速吸收新知识、响应新事件,确保决策紧跟时代步伐。
    • 增强可靠性: 通过提高可解释性、确保决策一致性及优化泛化能力,智能体在高风险场景中提供更为可信的服务。
  2. 大语言模型智能体
    大语言模型智能体(Language Model-based Intelligent Agent)是一种先进的复合型人工智能系统,它结合了大语言模型的强大自然语言处理能力和智能体的自主行为决策机制,能够在特定环境中感知动态条件、采取有目的的动作以影响环境,并运用强大的推理能力来理解信息、解决复杂问题、产生合理推断以及据此作出行动决策。
    • 感知环境中的动态条件: 大语言模型智能体具备实时或近实时的环境感知能力,能够通过各种输入接口(如文本、语音、图像等,经由相应的传感器或数据接口转化成文本描述)来捕捉环境中的关键信息和动态变化。这种感知能力不仅包括对当前状态的识别,还涵盖对环境趋势、潜在风险、机会点等复杂情况的理解。大语言模型在此过程中扮演着解析、理解和语义建模的角色,将非结构化或半结构化的感知数据转化为可操作的知识表示,使智能体能够准确理解其所在环境的状态及其演化。

    • 采取动作影响环境: 智能体的核心特征之一是其行动能力,即根据对环境的感知和内部目标导向,采取具体的操作或决策来改变或响应环境。大语言模型智能体能够利用其生成能力,制定清晰、有针对性的指令、建议或交互话语,通过输出接口传达给外部系统或直接与人进行沟通,从而引导或直接影响环境的变化。这些动作可以是执行物理任务(、进行信息检索和传递、调整系统设置、参与社交互动等。大语言模型在此过程中提供语言生成支持,确保智能体所采取的动作以恰当、有效且符合语境的方式表达和执行。

    • 深度推理: 大语言模型智能体的核心智力来源于其内置的大语言模型组件,这类模型经过大规模数据训练,拥有强大的上下文理解、逻辑推理、常识推理和联想思维能力。它们能够:

      • 理解信息:快速消化大量文本输入,准确提取关键信息,理解其中的隐含意义、情感色彩、专业术语等复杂语义元素。
      • 解决问题:面对复杂问题,智能体能运用推理能力分析问题结构,调用相关知识,模拟可能的解决方案路径,甚至进行多步骤推理以达到问题解决的目的。
      • 产生推断:基于现有信息和背景知识,大语言模型智能体能够进行逻辑推理、类比推理、因果推理等,生成关于未来事件可能性、未知变量估计、情境假设等方面的合理推断。
      • 决定动作:在理解信息、解决问题和产生推断的基础上,智能体能够根据其内在目标函数、环境约束、伦理规范等因素,综合评估各种可能的行动选项,选择最有利于达成目标或优化环境状态的行动方案。
  3. 智能体范式
    智能体范式
  4. Lagent框架
    Lagent 是一个轻量级开源智能体框架,旨在让用户可以高效地构建基于大语言模型的智能体。同时它也提供了一些典型工具以增强大语言模型的能力。整个框架如下所示:
    框架图
    Lagent由三个主要部分组成,agents,llms和actions:
    • agents:提供代理实现,如ReAct、AutoGPT等。
    • llms:支持各种大型语言模型,包括通过HuggingFace模型的开源模型(Llama-2,InterLM)或GPT3.5/4等闭源模型。
    • actions:包含一系列的action,以及一个action executor来管理所有的action。Agent Lego
  5. Agent Lego框架
    Agent Lego 是一个开源的多功能工具 API 库,用于扩展和增强基于大型语言模型(LLM)的智能体(Agent),具有以下突出特点:
    • 丰富的多模态扩展工具集,包括视觉感知、图像生成和编辑、语音处理和视觉语言推理等。
    • 灵活的工具接口,允许用户轻松扩展具有任意类型参数和输出的自定义工具。
    • 与基于LLM的代理程序框架轻松集成,如 LangChain、Transformers Agent、Lagent。
    • 支持部署工具服务和远程访问,这对于需要大型机器学习模型(例如 ViT)或特殊环境(例如 GPU 和 CUDA)的工具特别有用。
      AgentLego 目前提供了如下工具:
      工具

三、个人体会

  • AgentLego提供的工具是真不少呀,希望自己也能够开发属于自己的智能体

四、本期作业

https://blog.csdn.net/weixin_45609124/article/details/138097181

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/570197.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

redis单线程模型

工作原理 在Redis中,当两个客户端同时发送相同的请求时,Redis采用单线程模型来处理所有的客户端请求,会依次处理这些请求,每个请求都会按照先后顺序被执行,不会同时处理多个请求。使得Redis能够避免多线程并发访问数据…

【无标题】w

import requests , sys , edge _ tts , os , asyncio from pydub import AudioSegment , playback url http://localhost:8080/v1/chat/ completions ’ def send _ message ( message ): headers {" Content - Type “:” application / json "} data { " mode…

【MySQL 数据宝典】【磁盘结构】- InnoDb 数据文件-Page结构、行记录格式

一、 数据文件 1.1 表空间文件结构 InnoDB表空间文件结构主要包括:Tablespace(表空间)、Segment(段)、Extent(区)、Page(页)、Row(行)。 Tables…

SAP DMS创建文档操作简介

前面的博文中我们创建了根目录的文档类型,下面我们需要创建我们后台已经配置到的文档类型 1、事务代码CV01N 框出的部分表示是用什么界面进行维护 当我们选择浏览器就 会变成一下界面 因为我们配置的是内部给号所以输入文档类型即可。 输入文档的描述。回车后输入状态的描…

【电路笔记】-Hartley振荡器

Hartley振荡器 文章目录 Hartley振荡器1、概述2、Hartley振荡器电路3、并联Hartley振荡器电路4、示例5、使用运算放大器的Hartley振荡器6、总结1、概述 Hartley振荡器设计使用两个电感线圈与一个并联电容器串联,形成产生正弦振荡的谐振储能电路。 与Hartley振荡器不同,我们…

第一讲 - Java入门

第一讲 - Java入门 文章目录 第一讲 - Java入门1. 人机交互1.1 什么是cmd?1.2 如何打开CMD窗口?1.3 常用CMD命令1.4 CMD练习1.5 环境变量 2. Java概述1.1 Java是什么?1.2下载和安装1.2.1 下载1.2.2 安装1.2.3 JDK的安装目录介绍 1.3 HelloWor…

机器学习模型效果不好及其解决办法

当训练出来的机器学习模型效果不佳时,可能涉及多个方面的原因。为了改善模型的效果,需要系统地检查和分析问题的根源,并采取相应的措施进行优化。 一、数据问题 数据质量 检查数据是否干净、完整,是否存在噪声、异常值或缺失值。…

OCP Java17 SE Developers 复习题13

答案 D, F. There is no such class within the Java API called ParallelStream, so options A and E are incorrect. The method defined in the Stream class to create a parallel stream from an existing stream is parallel(); therefore, option F is correct, and o…

2024年区块链链游即将迎来大爆发

随着区块链技术的不断发展和成熟,其应用领域也在不断扩展。其中,区块链链游(Blockchain Games)作为区块链技术在游戏行业中的应用,备受关注。2024年,区块链链游行业即将迎来爆发,这一趋势不容忽…

4款黑科技软件,其中三款功能过于强大,被误认为是外国佬开发的

国人对国产软件的刻板印象往往是“捆绑安装、弹窗广告、高昂收费”,这使得许多优秀的国产软件如同明珠蒙尘,鲜为人知。甚至有些软件的功能之强大,以至于常被人们误以为是出自外国佬开发,这实在是令人遗憾的事情。 1、VeryCapture…

docker快速搭建部署mqtt

文章目录 前言一、mqtt是什么?二、使用步骤1.引入库2.创建临时容器3.创建挂在目录4.将临时容器的配置挂载到宿主机中5.删除临时容器6.运行容器并挂载文件7.登录EMQX内置的管理控制台 总结 前言 一、mqtt是什么? MQTT(Message Queuing Teleme…

内容+货架“攻防一体”,京东能否上演“后来居上”?

又一家货架电商出手了。 2023年底,阿里进一步融合内容电商板块,合并淘宝直播与逛逛成立内容电商事业部,推动内容电商进入了新的阶段。近日,京东也开始发力视频赛道,宣布将拿出10亿现金、10亿流量补贴,全力…

C语言-结构体尺寸

CPU字长 字长的概念指的是处理器在一条指令中的数据处理能力,当然这个能力还需要搭配操作系统的设定,比如常见的32位系统、64位系统,指的是在此系统环境下,处理器一次存储处理的数据可以达32位或64位。 地址对齐 当计算机系统的…

Day 32 122.买卖股票的最佳时机II 55. 跳跃游戏 45.跳跃游戏II

买卖股票的最佳时期Ⅱ 给定一个数组,它的第 i 个元素是一支给定股票第 i 天的价格。 设计一个算法来计算你所能获取的最大利润。你可以尽可能地完成更多的交易(多次买卖一支股票)。 注意:你不能同时参与多笔交易(你…

RAKsmart洛杉矶大带宽服务器支持哪些操作系统?

RAKsmart洛杉矶大带宽服务器支持多种操作系统。具体包括以下几种,rak部落小编为您整理发布RAKsmart洛杉矶大带宽服务器支持哪些操作系统? RAKsmart作为一家提供海外服务器租用服务的公司,其洛杉矶大带宽服务器支持安装和运行多种操作系统。 这些操作系统…

WebServer项目介绍文章【四叶专属】

Linux项目实战C轻量级Web服务器源码分析TinyWebServer 书接上文,学习开源项目的笔记没想到居然有不少阅读量,后面结合另一个前端开源项目简单做了点修改,没想到居然有需要的同学,那么我就专门为四叶开一篇文章吧,【源码…

探索区块链世界:赋能创新,揭示区块链媒体发稿的影响力-世媒讯

区块链,这个由“区块”和“链”组成的概念,可能在您眼中充满神秘和复杂,但其实甚至无所不在,它正静悄悄地改变着我们日常生活的方方面面,从金融到媒体,从医疗到教育。 我们来揭开区块链的神秘面纱。区块链…

前端零代码开发实践:页面嵌套+逻辑连线0开发扩展组件,实现切换开关控制扇叶转动。能无代码封装扩展组件,有别于常规的web组态或低代码平台

前言: 官网:http://www.uiotos.net/ 什么是 UIOTOS? 这是一款拥有独创专利技术的前端零代码工具,专注于解决前端界面开发定制难题,原型即应用!具有页面嵌套、属性继承、节点连线等全新特性,学习门槛低…

AI 智能工具以及热门AI开源项目整理,包含国内中科院版GPT

AI 智能工具以及热门AI开源项目整理,包含国内中科院版GPT。 不用xx即可访问的镜像网站 https://chat1.yqcloud.top https://chat.bnu120.space https://chat.aidutu.cn https://hzdjs.cn/chatgpt https://chats.fenqubiao.com/zh 需要xx才能访问的网站 https://o…

金融时报:波场亮相哈佛大学并举办TRON Builder Tour活动

近日,波场TRON作为顶级白金赞助商出席哈佛区块链会议并成功举办TRON Builder Tour哈佛站活动,引发海外媒体热议。美联社、金融时报、Cointelegraph等国际主流媒体及加密知名媒体均对此给予了高度评价,认为本次大会对TRON Builder Tour活动具有里程碑意义,彰显了波场TRON致力于促…