Agents 要点

一、Agents概念

      人类是这个星球上最强大的 Agent。Agent是一个能感知并自主地采取行动的实体,这里的自主性极其关键,Agent要能够实现设定的目标,其中包括具备学习和获取知识的能力以提高自身性能。

关键点:感知环境、自主决策、具备行动能力,设定明确的目标和任务,适应环境及学习能力

例如 Agent 的复杂程度各不相同,一个简单的恒温器可以是一个 Agent

                一个大型的国家或者一个生物群体也可能是个 Agent。

垂直领域 Agent :

比如 Alphago,还有使用强化学习打游戏的DeepMind的Agent57,更加通用的Gato,OpenAI玩“躲猫猫”的多智能体。

二、prompt 工程

提示词万能公式

角色+角色技能+

任务核心关键词+任务目标+任务背景+任务范围+任务解决与否判定+任务限制条件
输出格式/形式+输出量

 

https://github.com/JushBJJ/Mr.-Ranedeer-AI-Tutor

 三、Prompt外挂

外挂知识库数据库

这些还不够,尝试让 GPT 调用函数和使用工具,ChatGPT也推出了插件体系。当人们发现大模型的推理能力很差时,开始试图让模型自身清楚地描述问题,把问题转化为 PDDL (Planning Domain Definition Language)格式的描述语言,通过调用通用规划器来解决规划问题 。

四、分解与组合

 大模型在大任务执行能力上分解和组合。例如,

 1.MapReduce 模式

将一个大型文本进行摘要,分开摘要在获得整体摘要

2、思维链(Chain of Thought,CoT),

它要求模型展示其思考过程

两种方式实现,一种是具体说明,即要求模型详细地、一步步地思考;

另一种是示例说明,即通过给定问题和答案的同时,提供思考过程。当询问模型时,模型会模仿此过程,逐渐思考并给出答案。

尝试多种思路来解决问题,然后投票选择最佳答案,这就是CoT-SC

3、思维树(ToT, Tree of Thought)

发散的方法也有局限性,例如24点问题,它不能很好地解决,解决方法垂直分解,思维树(ToT, Tree of Thought)的一个主要思路,它会根据当前的问题分解出多个可能,然后每一个树节点就是父节点的一个子问题,逐层扩散,遍布整个解空间,一些节点就直接会发现不合适而终止掉,达到了有效剪枝的作用。

 

比如排序问题,排序你可能需要分解和排序,然后再merge,COT就不行了

4、Graph of Tree,GoT

为了解决这个问题,一种名为思维图(Graph of Tree,GoT)的方法被提出。这种思维图既可以分解,也可以合并。 

2023年9月26日,清华姚期智团队又提出了更新的方法——累计推理 

首先会提出一个初步的想法,然后再对这个想法进行验证,看这个提案是否合适。如果提案合适,就将它添加到图的下一个节点,每一步都基于已经建立的图节点进行下一个思考节点的创建,这样发散、合并或删除直到达到最终目标状态,完备性和灵活性大大增强。24点问题上成功率已经达到98%

4、反馈 

分解和组合,不能与外界进行互动,反馈是整个控制论的基石,也是动物体从诞生之初就具备的基本能力。

ReACT让大模型先进行思考,思考完再进行行动,然后根据行动的结果再进行观察,再进行思考,这样一步一步循环下去。基本上就是人类这样的智能体主要模式。

Agent的框架都会让模型输出JSON进行函数调用,OpenAI也就推出了Funtion Calling 

五、Agents

1、AutoGPT

AutoGPT横空出世,短短数周Star数就超过PyTorch达到90k 

创建一个初始的计划,然后进入主循环。系统会让模型判断在当前计划下该进行何种行动,接着会执行行动。执行完毕后,结果会写入下一次循环中。如此,每次决策都会基于之前的结果、记忆和计划,从而制定出新的行动方案。

2、jarvis gpt

微软的贾维斯 (Jarvis)一个深度学习任务调度系统,也采用了类似思想。他们主要关注如何调用模型来执行各种深度学习任务,涉及到了先做计划,再选择模型,然后执行任务,获取反馈,然后进入下一轮循环等环节。

 3、Xagents

清华联合面壁发布了XAgent,提出了双循环机制在效果上碾压了AutoGPT

GPT-4也是一种Agent,Agent的概念是大模型的超集

 1.6 Multi-Agent

斯坦福小镇"开了一个好头。在这个虚拟的小镇里,每个角色都是一个单独的智能体,每天依据制定的计划按照设定的角色去活动和做事情,

MetaGPT的项目

引起了广泛关注,这个项目中定义了产品经理、架构师、项目管理员、工程师和质量保证等角色,各角色之间通过相互协作,基本可以胜任完成500行左右代码的小工程了。 

ChatDev的系统

清华开发了一个名为ChatDev的系统,进一步引入了CEO等角色,这里就不再展开描述。

RPA Agents

 RPA 公司实在智能把 Agent 用于他们的产品调用常见桌面软件,如淘宝网、钉钉,来自动完成桌面任务。 

Agent 的实现,共性:长短时记忆能力、工具使用能力、通信能力,甚至包括 SOP 的能力

AI在一定程度上模仿了人脑的工作方式,但实际上,机器人和人脑在处理信息时采用的策略有很大的不同。因此,即使在未来,我们也需要继续改进 AI 框架,以解决这种差距。比如一个百万位数的加法任务,GPT-4囿于token数的限制是不可能完成这个任务的,但人类却可以,这恰是人类和AI需要弥补的Gap。

 

五、智能本质

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/793124.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

windows中超详细深度学习环境配置之安装显卡驱动、cuda、cudnn、pytorch、torchvision、pycharm

超详细介绍安装Gpu版本的pytorch深度学习环境 一、显卡驱动安装1.1 下载驱动1.2 安装驱动 二、cuda安装2.1 下载cuda2.2 安装cuda2.3 检查cuda是否安装成功 三、安装cudnn3.1 cudnn下载3.2 cudnn安装 四、安装miniconda4.1 miniconda下载4.2 miniconda安装4.3 添加环境变量 五、…

开源模型应用落地-Yi模型小试-Yi-1.5-9B-Chat-16K-入门篇(一)

一、前言 Yi 开源模型是由零一万物公司发布的一系列自然语言和多模态模型。2024年5月13日,零一万物发布了最新的 Yi-1.5系列开源模型,开源了6B/9B/34B的 base 版和 chat 版模型,并第一时间发布在ModelScope、huggingface、 wisemodel 等 AI 开源社区平台。 二、术语 2.1. 零…

无人机之机身保养

一、外观检查 1、检查机器表面整洁无划痕、无针孔凹陷擦伤、畸变等损坏情况; 2、晃动机身,仔细听机身内部有无松动零件或者螺丝在机身内部。 二、桨叶检查 1、有无裂痕、磨损、变形等缺陷,如有明显缺陷建议更换; 2、卡扣、紧…

Figma中文网?比Figma更懂你的神秘网站!

Figma奠定了在线UI设计工具的基本形式,许多国内设计师都在使用Figma。在本文中,我们将解密国内大型设计师使用的Figma灵魂合作伙伴,被称为Figma中文网络的即时设计资源社区。Figma中文网络UI设计工具的魅力是什么?让我们一起看看吧…

基于Java的校园交友网站系统

你好,我是专注于计算机技术研究的学姐码农小野。如果你对校园交友网站系统的构建或者相关技术感兴趣,欢迎私信交流。 开发语言 Java 数据库 MySQL 技术 Java语言、SpringBoot框架、B/S结构 工具 MyEclipse、Navicat、Maven 系统展示 首页 个人…

DID差分模型案例集(传统DID、队列DID、渐近DID、空间DID、PSM-DID)

双重差分(DID)模型是一种广泛应用于经济学、社会学等领域的统计方法,主要用于评估政策或事件的因果效应。以下是DID模型几个重要变体的简要介绍: 1、传统DID(Traditional DID):这是DID模型的基…

使用wxPython和Python-docx创建合同生成器:一个实用的GUI应用程序教程

在当今的商业世界中,合同是不可或缺的。但是,反复修改和生成合同可能会是一个耗时且容易出错的过程。今天,我们将探讨如何使用Python创建一个简单但强大的合同生成器,它不仅可以节省时间,还能减少人为错误。 项目概述 我们将创建一个图形用户界面(GUI)应用程序,允许用户: 选…

Python基础教学之三:函数与模块篇——实现代码重用和模块化

Python基础教学之三:函数与模块篇——实现代码重用和模块化 一、函数的定义与使用 1. 理解函数 函数是组织好的、可重复使用的、用来实现单一或相关联功能的代码块。它可以提高代码的重用性和程序的清晰度。 你可以定义一个由自己想要功能的函数,以下是…

从零写UVC摄像头驱动(一)驱动框架

一、前言 写一个USB摄像头驱动程序1.构造一个usb_driver2.设置video_device probe: 2.1. 分配video_device:video_device_alloc 2.2. 设置 .fops .ioctl_ops (里面需要设置11项) 如果要用内核提供的缓冲区操作函数&#…

Redis基础教程(十六):Redis Stream

💝💝💝首先,欢迎各位来到我的博客,很高兴能够在这里和您见面!希望您在这里不仅可以有所收获,同时也能感受到一份轻松欢乐的氛围,祝你生活愉快! 💝&#x1f49…

附下载 | 100项能源领域网络与数据安全政策全集(2024版)

能源是工业的粮食,能源安全事关国家根本安全。当今国际局势风云变幻,全球地缘政治、经济、科技体系正经历深刻变化,能源局势将更加错综复杂,威胁能源安全的各种“灰犀牛”“黑天鹅”事件时有发生,促使国际能源版图深刻…

Go泛型详解

官网文档:https://go.dev/blog/intro-generics 泛型为该语言添加了三个新的重要功能: 函数和类型的类型参数。将接口类型定义为类型集,包括没有方法的类型。类型推断,在许多情况下允许在调用函数时省略类型参数。 类型参数&…

二分查找算法——部分OJ题详解

目录 关于二分查找算法 部分OJ题详解 704.二分查找 一,分析题目 二,细节处理 三,题目代码 四,*总结朴素模板 *34.在排序数组中查找元素的第一个和最后一个位置 一,查找左端点 二,处理左端点细…

HTML速成学习总结

一、HTML开始 简介&#xff1a; 超文本标记语言&#xff08;英语&#xff1a;HyperText Markup Language&#xff0c;简称&#xff1a;HTML&#xff09;是一种用于创建网页的标准标记语言。 初始网页&#xff1a; <!doctype html> <html><head><meta …

【Java数据结构】初识线性表之一:顺序表

使用Java简单实现一个顺序表 顺序表是用一段物理地址连续的存储单元依次存储数据元素的线性结构&#xff0c;一般情况下采用数组存储。在数组上完成数据的增删查改。 线性表大致包含如下的一些方法&#xff1a; public class MyArrayList { private int[] array; pri…

FastAPI 学习之路(三十五)项目结构优化

之前我们创建的文件都是在一个目录中&#xff0c;但是在我们的实际开发中&#xff0c;肯定不能这样设计&#xff0c;那么我们去创建一个目录&#xff0c;叫models&#xff0c;大致如下。 主要目录是&#xff1a; __init__.py 是一个空文件&#xff0c;说明models是一个package…

2.线性回归

简化的房价模型 假设1&#xff1a;影响房价的关键因素时卧室个数&#xff0c;卫生间和居住面积&#xff0c;记为 x 1 , x 2 , x 3 x_1,x_2,x_3 x1​,x2​,x3​ 假设2&#xff1a;成交价时关键因素的加权和&#xff1a; y w 1 x 1 w 2 x 2 w 3 x 3 b y w_1x_1w_2x_2w_3x…

【LeetCode:1071. 字符串的最大公因子 + 模拟 + 最大公约数】

&#x1f680; 算法题 &#x1f680; &#x1f332; 算法刷题专栏 | 面试必备算法 | 面试高频算法 &#x1f340; &#x1f332; 越难的东西,越要努力坚持&#xff0c;因为它具有很高的价值&#xff0c;算法就是这样✨ &#x1f332; 作者简介&#xff1a;硕风和炜&#xff0c;…

javaweb中的请求与响应--基于postman工具的应用(附带postman的详细安装步骤)

一、前言 后端的第一天感觉难度就上来了&#xff0c;可能是基础太过薄弱了吧。目前看视频已经有点跟不上了&#xff0c;果然15天想要拿下还是太勉强了点。30天还差不多。不知道读者们有没有好好的去学这方面的知识&#xff0c;没有什么是学不会的&#xff0c;关键是坚持。 Po…

# Redis 入门到精通(一)数据类型(3)

Redis 入门到精通&#xff08;一&#xff09;数据类型&#xff08;3&#xff09; 一、redis 数据类型–set 类型介绍与基本操作 1、set 类型 新的存储需求: 存储大量的数据&#xff0c;在查询方面提供更高的效率。需要的存储结构: 能够保存大量的数据&#xff0c;高效的内部…