翻译: LLM工具使用和代理Tool use and agents

在这里插入图片描述
欢迎来到本周的最后一个视频。在这个视频中,我想与您分享LLM(大型语言模型)开始能够使用工具的情况,以及讨论一下前沿的“代理”主题,这是让LLM自己决定下一步采取什么行动的领域。让我们来看看。在早期的食物订单接收聊天机器人示例中,我们看到如果您说“给我送个汉堡”,机器人可能回复“好的,正在路上”。

为了让聊天机器人输入订单并将其发送给您,这是幕后实际发生的事情。LLM不能仅仅说“好的,正在路上”,因为它需要采取一些行动来真正将汉堡送到您手中。因此,LLM可能会输出这样的回应:“为用户9876订购汉堡,送到这个地址”,然后还说用户消息是“好的,正在路上”。经过微调的LLM能够生成这样的订单,这种情况下将触发一个软件应用程序,向餐厅订购系统发出请求,将汉堡送到该用户的地址。用户看到的不是完整的LLM输出。这里的完整LLM输出是全部四行文本,但只有最后一行“好的,正在路上”被发送给用户作为回应。所以,这是LLM使用的工具的一个例子,其中LLM输出的文本可以触发调用软件系统来下达餐厅订单。

在这里插入图片描述
现在,下达错误订单可能是一个代价高昂的错误。因此,可能更好的用户界面是,在最终确定订单之前弹出一个验证对话框,让用户确认订单是否正确,然后在扣款并发送给他们之前再次确认。显然,鉴于LLM的输出并不完全可靠,对于任何安全关键或任务关键的操作,在让LLM自行触发可能造成代价高昂的错误之前,让用户确认所需操作是一个好主意。
在这里插入图片描述

除了用于采取行动的工具外,工具还可用于推理。例如,如果您提示LLM,“如果我将100美元存入银行账户,该账户支付5%的利息,那么8年后我将获得多少钱?”LLM可能会生成像这样的答案,听起来似乎是合理的,但147.74美元并不是正确的答案。事实证明,LLM在经过预测下一个词或指令调整的学习后,并不擅长精确计算。就像UI可能会使用计算器来计算类似问题的正确答案一样,我们也可以给LLM一个计算器工具来帮助它得到正确的答案。
在这里插入图片描述

因此,与其让LLM直接输出答案,不如让LLM输出这样的内容:“复利计算后等于,计算器计算100乘以1.05(即5%的利率)的8次方。”这可以解释为命令,调用外部计算器程序来明确计算正确的答案,即147.74美元,并将其反馈到文本中,以便为用户提供正确的金额。通过给LLM提供调用工具的能力,我们可以显著扩展LLM的推理或采取行动的能力。

工具的使用今天是许多LLM应用的重要部分,当然,这些应用的设计者应该小心确保工具不会以可能造成伤害或不可逆转的损害的方式被触发。
在这里插入图片描述

除了工具之外,进入更多实验性领域,AI研究人员一直在研究代理(agents),它们不仅仅触发工具来执行单一动作,而是探索是否可以选择并执行复杂的动作序列。关于代理的研究充满了兴奋和挑战,但这仍处于AI研究的前沿。它还不够成熟,不能用于大多数重要应用。但我想与您分享许多AI社区成员所兴奋的事情。如果您要求一个基于LLM构建的代理帮助您研究更好的汉堡店的主要竞争对手,那么代理可能会使用LLM作为推理引擎,来确定它需要执行哪些步骤来完成您的研究任务。

  1. 这个推理引擎LLM可能会决定需要搜索竞争对手的名单,
  2. 然后访问每个竞争对手的网站,
  3. 最后,针对每个竞争对手,根据主页内容撰写摘要。

然后,通过对这个推理引擎的一系列调用,它可能会发现为了搜索主要竞争对手,它必须触发工具来调用网络搜索引擎,并查询“BetterBurger的竞争对手”。之后,它可能会访问一些主要竞争对手的网站来下载他们的主页。然后再次调用LLM来总结他们在网站上找到的文本。

虽然互联网上已经有一些不错的代理演示,但这项技术还没有真正准备好进入主流应用。但也许在未来,随着研究人员使其变得更好,它将变得更有用。如果LLM作为推理引擎可以帮助决定采取哪些安全和负责任的步骤来帮助用户完成任务,我认为这将是一个令人兴奋的未来。

感谢您坚持观看至第二周的最后。我们的课程还有最后一周。下周,我们将探讨生成型AI如何影响公司,包括您如何为您的业务提出生成型AI用例,以及探讨生成型AI如何影响社会及其对就业的影响。期待下周与您相见。

参考

https://www.coursera.org/learn/generative-ai-for-everyone/lecture/pOwXb/tool-use-and-agents-optional

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/252176.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

操作系统期末复习-内存管理

一、内存管理 分页存储管理,是将一个进程的逻辑地址空间分成若干个大小相等的片,称为页面或页,并为各页加以编号,从0开始,如第0页、第1页等。相应地,也把内存空间分成与页面相同大小的若干个存储块&#xf…

人工智能文本分类

在本文中,我们全面探讨了文本分类技术的发展历程、基本原理、关键技术、深度学习的应用,以及从RNN到Transformer的技术演进。文章详细介绍了各种模型的原理和实战应用,旨在提供对文本分类技术深入理解的全面视角。 一、引言 文本分类作为人工…

交叉熵在机器学习里做损失的意义

交叉熵是机器学习中常用的损失函数之一,特别适用于分类任务。其背后的核心思想是衡量两个概率分布之间的差异。在分类问题中,通常有一个真实分布(ground truth distribution)和一个模型预测的分布(predicted distribut…

knime 安装Regex Extractor节点

1、在File中,找到install knime extensions 2、接着输入palladian,然后选择select all,最后点击next就可以了,等待安装就可以了 3、然后重启knime就可以看到了Regex Extractor节点

整理了上百个开源中文大语言模型,涵盖模型、应用、数据集、微调、部署、评测

自ChatGPT为代表的大语言模型(Large Language Model, LLM)出现以后,由于其惊人的类通用人工智能(AGI)的能力,掀起了新一轮自然语言处理领域的研究和应用的浪潮。 尤其是以ChatGLM、LLaMA等平民玩家都能跑起…

PADS9.5 : 原理图电源网络 和 地网 络添加

原理图电源网络 和 地网 络添加 添加电源网络 1、点击连线 2、2、连线 3、3、连线时,右键 4、4、点击电源,因为该网络已经有3.3v,它会弹出网络确认,确定即可,如果 需要其他电源网络,双击即可修改 5、双击…

Impala4.x源码阅读笔记(一)——HdfsTextScanner解析

前言 本文为笔者个人阅读Apache Impala源码时的笔记,仅代表我个人对代码的理解,个人水平有限,文章可能存在理解错误、遗漏或者过时之处。如果有任何错误或者有更好的见解,欢迎指正。 在文章Impala3.4源码阅读笔记(七…

环形链表Ⅱ 双指针 Java版本

文章目录 题目解题思路代码 题目 给定一个链表的头节点 head ,返回链表开始入环的第一个节点。 如果链表无环,则返回 null。 如果链表中有某个节点,可以通过连续跟踪 next 指针再次到达,则链表中存在环。 为了表示给定链表中的环…

期货股市联动(期股联动助推资本市场上扬)

期股联动——期货股市助推资本市场上扬 随着我国资本市场的不断发展,期货和股票这两个市场也在逐渐紧密地联系起来。期货和股票的相互作用是一种“期股联动”,它能够促进资本市场的上扬。 期货与股票市场 期货市场是一种标准化的场外交易市场&#xf…

【JavaEE】多线程(4) -- 单例模式

目录 什么是设计模式? 1.饿汉模式 2.懒汉模式 线程安全问题 什么是设计模式? 设计模式好⽐象棋中的 "棋谱". 红⽅当头炮, ⿊⽅⻢来跳. 针对红⽅的⼀些⾛法, ⿊⽅应招的时候有⼀ 些固定的套路. 按照套路来⾛局势就不会吃亏. 软件开发中也有很多常⻅的 "问题…

如何使用Lychee结合内网穿透搭建本地私人图床网站并实现远程访问

文章目录 1.前言2. Lychee网站搭建2.1. Lychee下载和安装2.2 Lychee网页测试2.3 cpolar的安装和注册 3.本地网页发布3.1 Cpolar云端设置3.2 Cpolar本地设置 4.公网访问测试5.结语 1.前言 图床作为图片集中存放的服务网站,可以看做是云存储的一部分,既可…

架构设计系列之基础设施能力建设

周末聊两句: 今天将的基础设施能力建设部分,一般的架构书籍中都不存在的部分,这是我在实践过程中的经验和能力总结部分,希望和大家有一个很好的交流自从在 WeChat 中开了订阅号的两周半的时间,非常感谢大家的支持&…

大数据HCIE成神之路之数据预处理(2)——异常值处理

异常值处理 1 异常值处理1.1 散点图1.1.1 实验任务1.1.1.1 实验背景1.1.1.2 实验目标1.1.1.3 实验数据解析 1.1.2 实验思路1.1.3 实验操作步骤1.1.4 结果验证 1.2 基于分类模型的异常检测1.2.1 实验任务1.2.1.1 实验背景1.2.1.2 实验目标1.2.1.3 实验数据解析 1.2.2 实验思路1.…

手麻、腿麻、麻痛…背后竟隐藏7大疾病!多一个人知道,少一个悲剧!

手脚麻木背后的7大病症:骨病、脑梗、肿瘤…… 1、神经问题 上图四只手上橙色的区域代表了麻木感,如果您的手麻集中在无名指和小指的区域,您可以拿一张纸,用五个手指分别试着夹住,检验您的五个手指力量;您还…

Android动画(三)——属性动画

目录 介绍 属性动画的实现类 对象动画(ObjectAnimator) 方法1:Java代码实现对象动画 其它使用方法 方法2:XML实现对象动画 效果 ​编辑 值动画(ValueAnimator) PropertyValueHolder 效果图 动画组合…

Android动画(四)——属性动画ValueAnimator的妙用

目录 介绍 效果图 代码实现 xml文件 介绍 ValueAnimator是ObjectAnimator的父类,它继承自Animator。ValueAnimaotor同样提供了ofInt、ofFloat、ofObject等静态方法,传入的参数是动画过程的开始值、中间值、结束值来构造动画对象。可以将ValueAnimator看…

11.1.0iPortal之新增【增强其他服务注册能力】

作者:yx 文章目录 前言 一、使用场景二、功能说明三、举例说明 前言 11.1.0版本以前,注册服务的地址必须是可以访问的,否则会注册失败,如下图所示: 11.1.0版本开始新增“服务在线检测”功能,即可以实现注…

QT QWidget - 跑马灯

简介 关于前面画了个圆,怎么样也得跑个灯, 只是基于布局创建LED Widget而非 QTableView/QTableWidget;实现步骤 实现LED Widget LEDWidget.cpp LEDWidget::LEDWidget(QWidget *parent): QWidget(parent), m_on(false) {}void LEDWidget::paintEvent(QPaintEvent …

THEMIS---Beta Sprint Summary Essay Blog

Which course does this assignment belong to2301-MUSE社区-CSDN社区云What are the requirements for this assignmentbeta SprintThe goal of this assignmentTo summarize the beta task progress and the teams sprintsTeam NameThemisTop-of-the-line collection of essa…

单变量、双变量、多变量分析(基于iris数据集)

目录 一、数据处理 二、单变量分析 三、双变量分析 四、多变量分析 利用padas、numpy、matplotlib、seaborn库,对数据进行分析。 Iris数据集是非常著名的机器学习数据集之一,在统计学和机器学习领域被广泛应用。该数据集包含了150个样本,分…