为何整个 AI 领域都朝着 AI Agents 这一方向发展?

编者按: 当前大热的大语言模型和检索增强生成模型,虽然在语言理解和内容生成方面取得了突破性的进展,但仍然存在诸多限制。它们缺乏根据目标导引行为、持续学习和与环境交互的能力,难以应对复杂多变的现实场景需求。

今天为大家带来的这篇文章,作者的观点是人工智能领域正朝着开发更智能、更自主的 AI Agent 系统迈进,这将彻底改变我们使用人工智能的方式。

作者相信人工智能的未来必将呈现出更智能、更自主的 AI Agent 形态。这种新型人工智能系统不再是简单的语言模型,而是集成了推理引擎、知识库、工具集成等多种能力于一体,能够深入理解环境、制定目标并自主采取行动,从而在诸多领域大显身手。我们有理由相信,AI Agent 将成为人工智能发展的新引擎,并最终改变人类的工作和生活方式。

本文对 AI Agent 这一概念进行了较为全面的解读,让我们一同认识 AI Agent ,认清发展趋势,做好迎接未来的准备。

生成式 AI 只是人工智能发展的开端,未来可能会出现更先进的 AI 智能体系统(AI Agent),我们应当重视 Andrew Ng(译者注:Andrew Ng 是斯坦福大学计算机科学系和电气工程系的客座教授,曾任斯坦福人工智能实验室主任。他与达芙妮·科勒一起创建了在线教育平台Coursera。)、Andrej Karpathy (译者注:Andrej Karpathy 是一名斯洛伐克裔加拿大计算机科学家,曾担任特斯拉人工智能和自动驾驶视觉总监。他曾任职于OpenAI,专门研究深度学习和计算机视觉。)等 AI 领域权威人士对于这一趋势的分析和看法。

图片

01 本文主题

人工智能的未来将会是 Agentic(译者注:能够像人类一样,根据环境、知识和目标来自主进行决策和做出相应行为。)!本文将探讨什么是 AI Agents ,并梳理 AI 行业内部对这一概念的理解和定义。

图片

文章的核心内容是阐释和探索 “AI Agents” 这一概念,这种技术将在决定和影响未来发展方向上变得越来越关键。期望读者能通过阅读本文对 “AI Agents” 有一个全方位的认识,不仅掌握它们的基本特性,还能了解到它们是如何被运用于各种行业场景中的。接下来,本文将展开讨论这些内容。

02 为何不容错过本文?

我相信本文的内容你绝不会想错过的——因为当前正处于一个工作模式和工作环境快速变化的关键时期。

人工智能领域正不断发展,不再局限于狭窄、专业化的应用模型,而是朝着创造高度智能、较为自主的 AI Agent 这一技术方向前进。 这些 Agent 能够在大多数领域中真正帮助人类提高思维能力、工作效率或解决问题的能力,实现与人类智能的有效互补和增强。

阅读本文,我十分相信你将理解为什么整个 AI 领域都倾向于开发 advanced AI agents ,这些 Agent 有可能彻底改变我们处理和利用人工智能的方式。

无论您是对人工智能有着丰富经验的“老鸟”,还是刚踏入这个领域的“菜鸟”,了解 AI Agent 的发展轨迹对于保持信息畅通和积极参与未来的变革之旅都至关重要。

若你想要探究以下内容,本文必定不容错过:

  • 洞悉行业革新路径:洞悉 AI Agent 将如何革新各行各业及个人职业生涯?
  • 成为 Agent 的先行者:掌握创建并用好 AI Agent 的秘诀。
  • 突出重围,抢占高地:在瞬息万变的科技浪潮中不掉队,甚至成为 AI Agent 时代的“弄潮儿”。

03 LLMs 和 RAG 不好用吗,为什么还需要 AI Agent 呢?

尽管大语言模型(LLMs)和检索增强生成(RAG)模型已经极大地扩展了我们在语言生成任务方面所能达到的界限。但是 AI Agent 强调的是综合智能,包括但不限于决策制定、环境交互和跨领域的知识应用,这样的智能系统能够适应更复杂的任务需求,并在与人的交流合作中展现出更强的灵活性和实用性。

AI Agent 之所以不可或缺,归结于几个核心因素:

  • 根据目标任务导引行为(Goal-oriented behavior) :大语言模型(LLMs)与检索增强生成模型(RAG)的主要任务是根据训练数据中的 patterns (译者注:指代算法在训练过程中从大量输入数据中学习到的常规性特征或规律,在此处应当是指语言模型通过分析文本学习到的词汇使用、句法结构或语境含义的规律。)创造出类似人类创造的文本内容。尽管如此,它们在灵活且智能地设定和追求具体目标等方面仍存在一定的劣势。反之,AI Agent 则能够被设计为具备清晰目标,并能够策略性地规划和采取行动,实现既定目标。
  • 记忆和状态跟踪的能力(Memory and state tracking) :目前大多数语言模型并不具备持续记忆或跟踪状态的功能,每个输入信息(input)都会被单独处理,不会考虑前后关联。相比之下,AI Agent 设计有 internal state (译者注:Agent 在运行过程中维护的一种数据结构,存储了到目前为止处理的所有信息和过去的经验。能够表现出某种形式的记忆能力,基于过去的信息来影响当前的决策或输出。)维护机制,能够不断积累知识,并运用这些累积的 state 信息为后续的决策(decisions)和行为(actions)提供依据,实现更加智能化的 AI 系统运作模式。
  • 与环境进行互动的能力(Interaction with the environment) :大语言模型(LLMs)的工作局限于文本范畴,一般不涉及与物理现实世界的直接互动。相比之下,AI Agent 能够感知并干预它们所处的环境,无论是数字世界(digital world)、机器人系统(robotic systems),乃至通过传感器(sensors)与执行元件(actuators)感知的真实物理世界。
  • 知识迁移与场景泛化(Transfer and generalization) :虽然 LLMs 擅长与其训练数据类似的语言任务,但它们往往难以将知识迁移到全新的领域或任务中。而 AI Agent ,凭借其学习、推理及策略规划的综合能力,有能力更好地将知识迁移和推广应用到新的场景中。
  • 长期学习能力(Continual learning) :大多数语言模型一旦训练完毕,其状态就会趋于静态固定。而 AI Agent 则可以在与新环境进行交互和不断处理新情况的过程中,边学习边优化自身知识体系与掌握的技能。
  • 多领域任务处理能力(Multi-task capability) :LLMs 通常是针对特定语言任务(比如文本生成、机器翻译等)而专门设计的,它们的能力比较专一。而 AI agents 则可以被设计为通用的、多任务的 AI 系统,擅长无缝融合语言处理、逻辑推理、感知理解及控制操作等多种技能,来与人类一同应对那些既繁复又多元的难题。

04 AI Agent 将如何改变世界?

图片

假定你正在规划一次行程繁复的旅行:

LLM:能为你介绍各色旅游景点,或分享一些旅行小贴士。

RAG:擅长寻找、挖掘关于旅行✈️目的地的精彩博客与深度文章。

AI Agent在此基础之上,更能:

  • 根据你的旅行预算精挑细选航班与住宿信息
  • 一键完成所有预订流程
  • 自动整合个人旅行行程至个人日历
  • 出发前搭配相关温馨提醒,附上必备资讯,确保无忧出行。

05 清晰理解 LLM、RAG 和 AI Agent 等概念

图片

1. 任务导向(Task Orientation) vs. 通用知识(General Knowledge)

  • LLM:在语言理解和内容生成方面表现出色,堪比包罗万象的信息宝库。
  • RAG:通过查找、搜寻相关关键信息来增强 LLMs 的能力,但其重点仍聚焦于知识整合与文本内容创造。
  • AI Agent:因实现特定任务而生,能够在理解语言和在现实世界或数字系统中采取行动之间架起一座桥梁。

2. 环环相扣的多步逻辑推理

  • LLM 和 RAG:通常聚焦于单个输入(input)的即时解析与反馈。
  • AI Agent:能步步为营,执行复杂任务链条。
    • 首先,检索信息(类似 RAG 策略)
    • 继而,处理信息,并基于这些信息做出决策
    • 最后,付诸行动,例如:
      • 发送电子邮件
      • 自动预约服务
      • 智能家居设备操控

3. 掌握主动权

  • LLM 和 RAG:通常仅对 prompt 直接做出回应。
  • AI Agent:可以主动行动、操作。它们能够:
    • 监控数据流,并提醒出现的关键性变化
    • 根据用户偏好主动行动
    • 随着对用户的了解加深,能够学习并逐步调整行为,以便更好地符合用户需求

4. 能够与现有系统进行集成

  • LLM 和 RAG:倾向于在独立环境中运行。
  • AI Agent:则被设计为与多种系统及 API 接口进行对接:
    • 可以无缝接入、访问用户电子邮件或日程信息
    • 能够与数据库进行交互
    • 调度管理用户授予权限的软件与硬件设备

06 AI Agent 架构主要包含哪些核心要素?

图片

AI Agent 拥有构建一个能够自主地理解环境、做出决策并执行任务的 AI 系统所需的核心结构元素和关键组成部分。通常涵盖了以下几个基本方面:

  • 智能推理引擎(A Reasoning Engine) :AI Agent 的核心,通过利用强大的大语言模型(LLM)来深度理解自然语言、获取知识并推理复杂问题。
  • 知识库(Knowledge Base) :作为 AI Agent 的“大脑”,存储着与任务相关的事实资料、过往经验和执行任务相关的个性化设定。
  • 工具集成、联结平台(Tool Integration) :允许 AI Agent 通过应用程序接口(API)与各种软件应用程序和服务进行交互,从而扩展其操纵和控制环境的能力广度和深度。
  • 环境感知模块(Sensory Input) :为 AI Agent 装备上感知周遭世界的“眼睛”和“耳朵”,从文本、图像乃至各种感应器中获取实时数据。
  • 人机交互界面(应当属于其中的一个关键部分) :一座搭建在用户与 AI Agent 之间的沟通桥梁,促进与人类用户之间的无缝沟通和高效协作。 (虽然目前尚无广泛认可的标准化用户体验框架,但随着技术的飞速进步,出现一套更为成熟或普及的交互标准可计日而待。)

上述所提到的这些核心结构元素共同构成了一个能够自主解决问题的智能 AI 系统。AI Agent 能够分析问题,制定分步骤执行的解决方案和行动计划,并且具备充分的能力和决心去实施其解决方案,从而使得它们成为人工智能领域内一股变革性的新力量,有望推动 AI 向更高级阶段迈进。

读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用

对于0基础小白入门:

如果你是零基础小白,想快速入门大模型是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

资源分享

图片

大模型AGI学习包

图片

图片

资料目录

  1. 成长路线图&学习规划
  2. 配套视频教程
  3. 实战LLM
  4. 人工智能比赛资料
  5. AI人工智能必读书单
  6. 面试题合集

人工智能\大模型入门学习大礼包》,可以扫描下方二维码免费领取

1.成长路线图&学习规划

要学习一门新的技术,作为新手一定要先学习成长路线图方向不对,努力白费

对于从来没有接触过网络安全的同学,我们帮你准备了详细的学习成长路线图&学习规划。可以说是最科学最系统的学习路线,大家跟着这个大的方向学习准没问题。

图片

2.视频教程

很多朋友都不喜欢晦涩的文字,我也为大家准备了视频教程,其中一共有21个章节,每个章节都是当前板块的精华浓缩

图片

3.LLM

大家最喜欢也是最关心的LLM(大语言模型)

图片

人工智能\大模型入门学习大礼包》,可以扫描下方二维码免费领取

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/773931.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

国信华源全力守护湖南水库安全,汛期坚守岗位

连日来,湖南省遭受持续强降雨侵袭,部分地区暴雨倾盆,山塘河库水位急剧上升,防汛形势极为严峻。面对这场防汛大考,北京国信华源公司迅速响应,技术团队以高度的责任感和使命感,全力投入防汛减灾工…

ASP.NET Core Blazor 5:Blazor表单和数据

本章将描述 Blazor 为处理 HTML 表单提供的特性&#xff0c;包括对数据验证的支持。 1 准备工作 继续使用上一章项目。   创建 Blazor/Forms 文件夹并添加一个名为 EmptyLayout.razor 的 Razor 组件。本章使用这个组件作为主要的布局。 inherits LayoutComponentBase<div …

vue表单增加合计

vue表单增加合计&#xff0c;有两种方式&#xff1a; 第一种前端获取所有数据&#xff1a; 将 show-summary 设置为true就会在表格尾部展示合计行。 默认情况下&#xff0c;对于合计行&#xff0c;第一列不进行数据求合操作&#xff0c;而是显示「合计」二字&#xff08;可通…

LeetCode刷题记录:(14)文本左右对齐

遇见困难题不要怕&#xff0c;说不定就是一个简单模拟题 . 执行用时 相关企业 leetcode 传送通道 class Solution {List<String> ans new ArrayList<>(); // 本题答案列表int[] lens; // 记录每个单词长度&#xff0c;方便后续补齐空格操作int maxRowLen; // 替代…

sql业务场景分析思路参考

1、时间可以进行排序&#xff0c;也可以用聚合函数对时间求最大值max&#xff08;时间&#xff09; 例如下面的例子&#xff1a;取最晚入职的人&#xff0c;那就是将入职时间倒序排序&#xff0c;然后limit 1 表&#xff1a; 场景&#xff1a;查找最晚入职员工的所有信息 se…

【数据集】中国农田栅格数据CACD(1986-2021)

中国农田栅格数据(1986-2021) 数据概述数据下载参考精确、详细和及时的耕地范围信息对于保障食品安全和环境可持续性至关重要。然而,由于农业景观的复杂性以及缺乏足够的训练样本,要在大范围地理区域内高空间和时间分辨率下监测耕地动态仍然具有挑战性,特别是对于农业土地…

抖音本地生活服务商入驻要求中暗含哪些信息?入局要点都在里面了!

随着抖音外卖的正式开放&#xff0c;许多创业者对于做抖音本地生活服务商的意向愈发强烈&#xff0c;抖音本地生活服务商入驻要求及相关话题更是在多个创业者群内被翻来覆去地讨论&#xff0c;且多次刷屏。 而就抖音目前在本地生活市场的布局来看&#xff0c;其主要的重心还是…

哪里还可以申请免费一年期的SSL证书?

目前&#xff0c;要申请免费一年期的SSL证书&#xff0c;选项较为有限&#xff0c;因为多数供应商已转向提供短期的免费证书&#xff0c;通常有效期为90天。不过&#xff0c;有一个例外是JoySSL&#xff0c;它仍然提供一年期的免费SSL证书&#xff0c;但是只针对教育版和政务版…

【人工智能】--强化学习(2.0)

个人主页&#xff1a;欢迎来到 Papicatch的博客 课设专栏 &#xff1a;学生成绩管理系统 专业知识专栏&#xff1a; 专业知识 文章目录 &#x1f349;强化学习与有监督学习的区别 &#x1f348;数据特点 &#x1f348;学习目标 &#x1f348;反馈机制 &#x1f348;策略…

如何在word中敲出可以点击打勾和取消打勾的方框呢?

文章目录 要解决的问题网上出现的几种不可行的方案发现解决措施 要解决的问题 在word中敲出 点击就可以打对勾和取消对钩的方框 网上出现的几种不可行的方案 插入-> 符号&#xff0c;此方法打出的方框是fixed的&#xff0c;不是我想要的可以自己自主打勾和不打勾的方式。 …

Python获取QQ音乐歌单歌曲

准备工作 歌单分享的url地址 比如&#xff1a; https://i.y.qq.com/n2/m/share/details/taoge.html?hosteuinoKvzoK4l7evk7n**&id9102222552&appversion130605&ADTAGwxfshare&appshareiphone_wx 代码实现 def mu(share_url):share_url share_url.split(id…

CFS三层内网渗透——外网打点(一)

目录 外网打点 先爆破一下看看有没有啥可进攻路径 尝试那个可疑的路径发现是thinkphp这个框架&#xff0c;同时也知道了版本&#xff0c;那就nday打吧 写入php ​编辑写入php成功&#xff0c;简简单单nday拿下​编辑 蚁剑rce尝试链接 打点成功 外网打点 先爆破一下看看有…

Odoo 16 采购仪表盘概述

Odoo 16 的高级采购管理系统可让您轻松跟踪采购订单、定义产品、管理供应商和准备产品/服务。您可以在采购模块中管理与产品采购相关的所有功能。此模块还允许您跟踪采购订单和报价请求。将采购模块的功能与其他 Odoo 16 模块&#xff08;如会计、库存、销售和发票&#xff09;…

用免费的可视化工具制作3D智慧城市大屏,融合数字孪生,引领数据升级

在如今数据驱动的时代&#xff0c;越来越多的场景中都有可视化大屏的身影&#xff0c;许多企业和政府部门也从常规的二维看板渐渐地转向更加炫酷&#xff0c;立体的3D可视化大屏。3D可视化大屏成为了展示复杂数据、实时监控业务动态的重要工具。本文将详细介绍如何使用免费的数…

小型气象站在现代农业中的应用与前景

随着科技的飞速发展&#xff0c;智慧农业已成为现代农业发展的重要趋势。在这一背景下&#xff0c;小型气象站作为智慧农业的重要组成部分&#xff0c;正逐渐展现出其独特的价值和广阔的应用前景。本文将从小型气象站的定义、功能、应用案例以及未来展望等方面&#xff0c;探讨…

【网络安全】第4讲 身份认证技术(笔记)

一、身份认证技术概述 1、身份认证 是网络安全的第一道防线。是最基本的安全服务&#xff0c;其他的安全服务都依赖于它。在物联网应用系统中&#xff0c;身份认证也是整个物联网应用层信息安全体系的基础。 2、基本身份认证技术 &#xff08;1&#xff09;双方认证 是一种双…

工业废水中镍超标怎么办?含镍废水处理方法有哪些?

镍是一种存在于自然界中的过渡金属。镍在土壤和岩石中的存量丰富&#xff0c;大部分镍已被氧化&#xff0c;或与其他元素结合成化合物。   含镍废水主要来源于电镀、合金制造、金属表面处理、电子等行业。这些行业在生产过程中&#xff0c;通常会使用含有镍离子的化学试剂&a…

PyCharm中如何将某个文件设置为默认运行文件

之前在使用JetBrain公司的另一款软件IDEA的时候&#xff0c;如果在选中static main函数后按键altenter可以默认以后运行Main类的main函数。最近在使用PyCharm学习Python&#xff0c;既然同为一家公司的产品而且二者的风格如此之像&#xff0c;所以我怀疑PyCharm中肯定也有类似的…

HttpServer内存马

HttpServer内存马 基础知识 一些基础的方法和类 HttpServer&#xff1a;HttpServer主要是通过带参的create方法来创建&#xff0c;第一个参数InetSocketAddress表示绑定的ip地址和端口号。第二个参数为int类型&#xff0c;表示允许排队的最大TCP连接数&#xff0c;如果该值小…

Android 10.0 关于定制自适应AdaptiveIconDrawable类型的动态时钟图标的功能实现系列一

1.前言 在10.0的系统rom定制化开发中,在关于定制动态时钟图标中,原系统是不支持动态时钟图标的功能,所以就需要从新 定制动态时钟图标关于自适应AdaptiveIconDrawable类型的样式,就是可以支持当改变系统图标样式变化时,动态时钟 图标的背景图形也跟着改变,所以接下来就来…