AI智能体的分级

技术的分级

人们往往通过对一个复杂的技术进行分级,明确性能、适用范围和价值,方便比较、选择和管理,提高使用效率,促进资源合理分配和技术改进和标准化。

比如,国际汽车工程师学会(SAE)定义了自动驾驶技术的六个等级(0到5级),描述了车辆自动化程度的不同阶段。这些等级详细规定了从完全人工驾驶,经过不同程度的人工辅助驾驶,到完全自动驾驶的过渡过程。

71f6910230f16fb11275afe61fd54359.png

图:国际汽车工程师学会的驾驶自动化分级

象自动驾驶技术这样的分级还使得制造商、监管机构和消费者可以更清晰地理解和衡量技术的能力和限制,更有助于技术普及和市场推广。

29e6f25120f927ee96059de3135fbaab.png

图:通过与驾驶自动化分级对应的驾驶场景,大众能够很好地理解技术和技术对世界和生活带来的影响


智能体的分类

AI的应用飞速发展。那么AI,特别是智能体(AI Agent)技术,是不是也可以分级?Dr. Yu Huang的《Levels of AI Agents: from Rules to Large Language Models》(https://arxiv.org/pdf/2405.06643)一文研讨了这个问题,列举了几种相关的分类方式:

1. 基于AI角色的分级 (Morris分级法)

在《Levels of AGI: Operationalizing Progress on the Path to AGI》 一文中,M R Morris, et. al. 从AI产品设计的视角,以AI类比人类现实生活中的角色,从毫无自主性的“工具(Tool)”角色,到“顾问(Consultant)”、 “合作者(Collaborator)”、“专家(Expert)”, 直至完全自主的"智能体(Agent)",将AI的自主性进行分级。

8bd20bd0659e121268a41522c6a63674.png

图:翻译自论文原文,并有编辑和删减

2. 基于AI承担职责的分级 (Li分级法)

Yuanchun Li, et.al. 则从智能体所承担的职责出发,对智能体进行了分析,发表在《Personal LLM Agents: Insights and Survey about the Capability, Efficiency and Security》一文。

在各级系统中,人类和AI分担不同的职责。级别越高,AI承担更多的职责。

480526817acfca88a1d1cc292237a8ea.png

398c8f6d3f97e53851b9818ecf0747d1.png

图:翻译自论文原文,并有编辑和删减

3. 基于AI功能的分级(Huang分级法)

在他的文章中,Yu Huang也提出了基于AI的功能的分级方法。

1f67419aac8ecf11a0739595844b1e42.png图:翻译自论文原文,并有编辑和删减

可以看到,随着级别的提升,AI具有越来越多的功能。

思考和总结

采用以上对智能体的分级,有助于我们在对特定AI应用进行分析的过程中,为我们解构和剖析提供了一定的方法论。

应用Morris方法论,当前智能体技术应该是在L3的早期,AI主要是人类的copilot,人类和AI的互动有趋向于平等的趋势,但人类仍然在主导几乎所有活动,智能体的自主性还非常有限。

现在的智能体技术(比如MemGPT等工具)已经具备了对情景的感知和记忆的能力,而在Li分类法里,这被认为是非常高阶的能力(L4)。现在的智能体框架软件如AutoGen和CrewAI等已经支持了多智能体之间的协作,这在Huang分类法里是被认为是最高级(L5)智能体才具备的能力。

因此,应用Li分级法和Huang方法,则Agent已经部分到达L4和L5了。

相对于自动驾驶的分级体系,当前的智能体分级方法似乎难以量化回答“当前智能体技术处在哪一级”的问题,标准相对模糊。这是因为“自动驾驶”是一个相对明确的场景,而智能体的应用场景并没有给定的原因。

总体来看,Morris分级法的实用性似乎更强一些。我们期待有更好的分级方法出现。

部分参考资料

  • M R Morris, J Sohl-dickstein, N Fiedel, et al., Levels of AGI: Operationalizing Progress on the Path to AGI, arXiv 2311.02462, 2023

  • Yuanchun Li, et.al. Personal LLM Ai的gents: Insights and Survey about the Capability, Efficiency and Security,05.08.2024

  • Yu Huang, Levels of AI Agents: from Rules to Large Language Models, https://arxiv.org/pdf/2405.06643

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/698383.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

诊所管理系统有没有免费的?

随着消费市场的不断变化,消费型医疗领域逐渐受到重视,医疗机构面临激烈的行业竞争。为了提升诊所的经营管理效率和营销能力,选择一款合适的诊所管理系统变得尤为重要。然而,面对市场上众多的系统选择,如何找到适合自己…

Linux 安装ab测试工具

yum -y install httpd-tools ab -help #10个并发连接,100个请求 ab -n 200 -c 100 http://www.baidu.com/

如何制作MapBox个性化地图

我们在《如何在QGIS中加载MapBox图源》一文中,为你分享了在QGIS中加载MapBox的方法。 现在为你分享如何制作MapBox个性化地图的方法,如果你需要最新版本的QGIS及高清图源,请在文末查看获取软件安装包的方法。 新建地图样式 进入Mapbox Stu…

智慧监狱大数据整体解决方案(51页PPT)

方案介绍: 智慧监狱大数据整体解决方案通过集成先进的信息技术和大数据技术,实现对监狱管理的全面升级和智能化改造。该方案不仅提高了监狱管理的安全性和效率,还提升了监狱的智能化水平,为监狱的可持续发展提供了有力支持。 部…

计算机组成原理之计算机的性能指标

目录 计算机的性能指标 复习提示 1.计算机的主要性能指标 1.1机器字长 1.1.1与机器字长位数相同的部件 1.2数据通路带宽 1.3主存容量 1.4运算速度 1.4.1提高系统性能的综合措施 1.4.2时钟脉冲信号和时钟周期的相关概念 1.4.3主频和时钟周期的转换计算 1.4.4IPS的相关…

任务3.8.1 利用RDD实现词频统计

实战:利用RDD实现词频统计 目标 使用Apache Spark的RDD(弹性分布式数据集)模块实现一个词频统计程序。 环境准备 选择实现方式 确定使用Spark RDD进行词频统计。 Spark版本与Scala版本匹配 选择Spark 3.1.3与Scala 2.12.15以匹配现有Spar…

使用seq2seq架构实现英译法

seq2seq介绍 模型架构: Seq2Seq(Sequence-to-Sequence)模型是一种在自然语言处理(NLP)中广泛应用的架构,其核心思想是将一个序列作为输入,并输出另一个序列。这种模型特别适用于机器翻译、聊天…

定个小目标之刷LeetCode热题(11)

这是道简单题,只想到了暴力解法,就是用集合存储起来,然后找出其中的众数,看了一下题解,发现有多种解法,我觉得Boyer-Moore 投票算法是最优解,看了官方对这个算法的解释,我是这样理解…

每天一个数据分析题(三百五十九)- 多维分析模型

图中是某公司记录销售情况相关的表建立好的多维分析模型,请根据模型回答以下问题: 2)产品表左连接品牌表的对应关系属于? A. 一对多 B. 一对一 C. 多对一 D. 多对多 数据分析认证考试介绍:点击进入 题目来源于CD…

高光谱成像光源 实现对细微色差的分类--51camera

光源在机器视觉中的重要性不容小觑,它直接影响到图像的质量,进而影响整个系统的性能。然而自然光LED光源不能完全满足实际需求,比如对细微的色差进行分类,我们就需要考虑红外高光谱光源。 所谓高光谱成像,是指使用具有…

实现思路:Vue 子组件高度不固定下实现瀑布流布局

实现思路:Vue 子组件高度不固定下实现瀑布流布局 一、瀑布流布局基础实现原理 在深入解说不定高度子组件的瀑布流如何实现之前,先大体说一下子组件高度固定已知的这种实现原理: 有一个已知组件高度的数组。定义好这个瀑布流的列数&#xff…

【回调函数】

1.回调函数是什么? 回调函数就是⼀个通过函数指针调用的函数。 如果你把函数的指针(地址)作为参数传递给另⼀个函数,当这个指针被用来调用其所指向的函数 时,被调用的函数就是回调函数。回调函数不是由该函数的实现方…

linux的持续性学习

安装php 第一步:配置yum源 第二步:下载php。 yum install php php-gd php-fpm php-mysql -y 第三步:启动php。 systemctl start php-fpm 第四步:检查php是否启动 lsof -i :9000 计划任务 作用&am…

问题:下列关于信息的说法,错误的是( )。 #媒体#知识分享#学习方法

问题:下列关于信息的说法,错误的是( )。 A. 信息无时不在,无时不有 B. 信息随着时间的推移,效用会越来越小 C. 信息具有可处理性 D. 信息是同一时刻只能被单方使用 参考答案如图所示

pnpm : 无法加载文件 C:\Users\xxxxx\AppData\Roaming\npm\pnpm.ps1,因为在此系统上禁止运行脚本。

vscode中执行pnpm install的时候,直接报了上面的错误。 解决: 然后输入:set-ExecutionPolicy RemoteSigned,按回车,然后根据提示,我们选A。 然后回车。 这样我们再次回到vscode中的我们就会发现可以了。 …

C++:SLT容器-->stack

C:SLT容器--&#xff1e;stack 1. stack容器2. stack 常用接口 1. stack容器 先进后出&#xff0c;后进先出不允许有遍历行为可以判断容器是否为空可以返回元素的个数 2. stack 常用接口 构造函数 stack<T> stk; // stack采用模板类实现&#xff0c;stack对象的默认构造形…

认识Spring 中的BeanPostProcessor

关于BeanPostProcessor和BeanFactoryPostProcessors&#xff0c;将分2篇文章来写&#xff0c;这篇文章是对Spring 中BeanPostProcessor进行了总结 先看下大模型对这个类的介绍&#xff0c;随后再看下这两个类的示例&#xff0c;最后看下这两个类的实现。 这两个类从名字看都很类…

三丰云免费服务器

云网址&#xff1a; https://www.sanfengyun.com 可申请免费云服务器&#xff0c;1核/1G内存/5M宽带/有公网IP/10G SSD硬盘/免备案。 收费云服务器&#xff0c;买2年送1年&#xff0c;有很多优惠

MAVEN架构项目管理工具(下)

1、maven工程约定目录结构 每一个maven在磁盘中都是一个文件夹&#xff08;即项目&#xff0c;以hello项目为例&#xff09; Hello/---/src------/main #放置主程序Java代码和配置文件-----------/java #程序的包和包中的文件-----------/resource #java程…

敏捷风险管理:识别和应对项目威胁与机会

项目风险是一种不确定的事件或条件&#xff0c;一旦发生&#xff0c;就会对项目目标造成积极或消极的影响。 现实中&#xff0c;风险可能是微妙而复杂的&#xff0c;缺少经验的人很难对其进行识别和管理。 敏捷风险管理是敏捷项目治理的基础。在敏捷环境下&#xff0c;敏捷风险…