六位一线AI工程师总结Agent构建经验,天工SkyAgents的Agent构建实战。

cover_image
原文链接:(更好排版、视频播放、社群交流、最新AI开源项目、AI工具分享都在这个公众号!)

六位一线AI工程师总结Agent构建经验,天工SkyAgents的Agent构建实战。

🌟我们给人类新手明确的目标和具体的计划,而不是模糊的开放式指示,对Agent也应该这样做。

最成功的Agent开发者可能也是工程师团队的管理者,因为 给AI制定计划的过程和管理初级员工的方式类似

▲ 六位一线AI工程师分享自身总结,公开大模型应用一年心得

我们给人类新手明确的目标和具体的计划,而不是模糊的开放式指示,对Agent也应该这样做,详细展开的话,总的来说有下面 两点

1. 优先考虑确定性工作流程

Agent被期待动态对用户请求做反应,但随着执行步数增加,失败的可能性指数增加,并且从错误中恢复的机会很小。一种有前途的方法是使用Agent系统来生成确定性计划,然后以结构化、可重复的方式执行这些计划,带来的好处包括:

  • • 生成的计划可以作为提示词中的少数样本,或微调数据。

  • • 使系统更加容易测试和调试,失败可以追溯到计划中的具体步骤。

  • • 生成的计划可以表示为有向无环图 (DAG),相对于静态提示词,它更容易理解和适应新情况。

我们如果用 具体的事例 来说的话,可能是这样的:

假设我们有一个AI助手,它的任务是帮用户 在线购买一件商品
。这个任务涉及很多步骤,比如搜索商品、比较价格、选择合适的选项、添加到购物车、填写支付信息等。随着步骤的增加,出错的可能性也增加。

生成确定性计划的好处

  1. 1. 生成的计划可以作为少数样本或微调数据 比如,AI助手生成了一个购物计划:这个具体的计划可以用来教AI助手如何完成类似的任务,也可以作为训练数据来微调AI模型,让它在类似任务中表现得更好。
* •  第一步:在搜索栏输入商品名称。 

* •  第二步:筛选出最低价的商品。 

* •  第三步:选择合适的颜色和尺寸。 

* •  第四步:添加到购物车。 

* •  第五步:填写支付信息并确认订单。 
  1. 2. 让系统更容易测试和调试 如果AI助手在购买过程中出错了,比如没有正确选择颜色,我们可以回溯到“第三步:选择合适的颜色和尺寸”,找到问题所在并进行修正。这比在一个没有明确步骤的任务中找问题要容易得多。

  2. 3. 生成的计划可以表示为有向无环图 (DAG) 我们可以把这个购物计划画成一个图表,每个步骤都是一个节点,节点之间有箭头连接,表示步骤的顺序:

    搜索商品 -> 筛选价格 -> 选择颜色和尺寸 -> 添加到购物车 -> 填写支付信息

这个图表让每个步骤和顺序一目了然,比文字描述更直观。
如果我们需要修改计划,比如在筛选价格之前先检查商品评价,我们只需要在图表上添加一个新节点,并调整箭头连接即可。

通过这种确定性工作流程,我们可以让AI助手在执行任务时更稳定、更可预测、更容易调试和改进,同时也能更好地适应新情况。

你可能会问“ 生成的计划可以作为少数样本或微调数据 ”?具体又是如何操作呢,没关系,我这里也准备了:

以下是一个具体的示例,展示如何生成确定性计划并将其用作训练数据或微调数据,以提高AI助手在完成类似任务中的表现。

向上滑动

2. 增加输出多样性的经验总结

在任务中需要提供多样化的输出,比如根据用户之前购买过的产品推荐新产品时,仅仅通过提高模型的温度参数可能并不足够,甚至会带来一些问题。以下是一些具体的方法和经验:

  1. 1. 谨慎调整温度参数
* •  虽然提高温度参数可以增加输出的随机性,但温度太高时,模型可能会生成不存在的产品或出现乱码。例如,如果温度设为0.9,模型可能会推荐“飞行汽车”,这显然不现实。保持温度在一个合理范围内(如0.7左右)更为稳妥。 
  1. 2. 调整提示词顺序
* •  改变提示词中的元素顺序可以显著影响模型的输出。例如,用户购买历史是“笔记本、手机、耳机”,可以打乱顺序为“耳机、笔记本、手机”或者“手机、耳机、笔记本”,这样模型会根据新的顺序生成不同的推荐。 
  1. 3. 保留前几轮的输出
* •  在每次推荐时,保留前几轮已经推荐过的产品,并明确告诉模型避免重复。例如,如果用户之前购买了“笔记本”和“耳机”,模型在推荐新产品时避免再次推荐这两样产品。这可以通过在提示词中加入“请不要推荐已经购买的产品:笔记本、耳机”来实现。 
  1. 4. 改变提示词措辞

• 使用不同的表达方式可以引导模型生成不同的推荐。例如:

• 提示词1:“推荐用户喜欢经常使用的产品。”

• 提示词2:“推荐用户可能会推荐给朋友的产品。”
通过这样的小变化,模型可能会推荐不同的产品,例如第一个提示词可能会推荐“鼠标”,而第二个提示词可能会推荐“智能音箱”。

这些方法结合起来使用,可以有效增加推荐的多样性,同时避免仅靠提高温度参数带来的问题。

上面两个讲完之后,下面我们来讲讲 实战 内容。

![](https://res.wx.qq.com/t/wx_fed/we-

emoji/res/v1.3.10/assets/newemoji/Party.png) 天工SkyAgents的Agent构建实战

SkyAgents 依靠强大的天工大模型,将 AI 的使用门槛进一步降低。它可以让用户通过 轻松友好 界面搭建,便可拥有自己专属的 AI
Agents, 无需复杂的编程知识,充分发挥你的创意灵感。

SkyAgents:https://model-platform-skyagents.tiangong.cn/home/agent

模块参数配置说明

先聊聊AI模块的一些配置数值。你可能在使用AI模块时注意到有些设置,比如对话模型选择、温度、回复上限等操作。接下来,我会用简单易懂的方式给大家讲解这些功能的含义。

提示词

这是一个固定的引导词,通过调整这个内容,你可以引导模型的聊天方向。这段内容会被固定在上下文的开头。你还可以使用变量,比如
{{language}},来让提示词更灵活。

回复创意性

温度表示AI在回复过程中内容的严谨程度。数值越低,回复越严谨,特别是在知识库回答场景中。严谨的回复会更接近知识库的内容,通常设置为 0。

回复字数上限

这个设置控制AI回复内容的字数。上限越低,回复的字数越少;上限越高,回复的字数越多。但并不是数值越大越好,因为上限越高,AI可能引用的内容越多,结果会出现一些无关的信息。

知识库配置相关数值

知识库相似度

这个数值控制用户提问与搜索结果之间的相似度。相似度越高,搜索出的结果可能越少。

单次搜索上限

当在知识库进行搜索时,这个设置决定了最多取多少条结果。请注意,取的结果并不是越多越好,因为受模型最大 Tokens
和单条知识库内容大小的影响,具体可用数量要根据具体情况而定。建议设置为 1,会有更好的回复体验。

更多 单元模块 说明 (向上滑动)

模块排布与设计

  1. 1. 按照信息流转的顺序进行模块排布 :一个 Agents 的顺利运行,与合理的排布密不可分。在真正着手设计前,先进行一个整体规划,列出编排的目的和希望实现的效果,思考需要哪些模块进行组合,做好提前的规划。

  2. 2. 持续进行调试优化以满足目标需求 :Agent的搭建往往需要多次调试才能满足需求,尤其在复杂的逻辑编排中,更需要仔细进行连线设计与参数设计。持续调整优化节点排布,将提升Agent的体验质量。

  3. 3. 注意模块的必填信息与核心配置 :在使用模块时,注意每个模块都有必填信息与选填信息。在设计画布时,将必填信息设置好,选填信息也进行合理排布规划,有助于理清思路,确保编排顺畅。

  4. 4. 灵活运营信息处理的三大模块 :信息分类、信息提取、信息加工是更多用户使用体验的核心。通过这三个模块,可以实现更复杂的信息处理任务,提升整体系统的效能。

初级:知识库 Agent

在开始知识库 Agent 的创建之前,你可以速览一下这个新手入门: 搭建第一个 Agent (向上滑动)

知识库 Agent 是当前受欢 迎的一类工具,它将个人或企业的专有数据与大型模型相结合,进一步扩展了大模型的知识库范围,使其与业务更紧密地结合。

配置与规划

在 Agent 的配置过程中,如果在 Agent
设置页面中选择关联了“知识库”,我们就能够在规划页面中看到新增加的“知识库搜索”模块。本次案例将着重介绍“知识库搜索”模块的功能设计。

基础配置

本案例中,我们将创建一个名为“大预言模型助手”的 Agent,将整理好的大语言模型相关资料作为知识库。这个 Agent
将充当大语言模型方面的专家,回答关于大语言模型方面的提问。

画布规划

在 Agent 的画布规划中,新增了一个“知识库搜索”模块,借助“知识库”中上传的资料,辅助 AI 完成大模型相关问题的回复。它的具体逻辑如下:

  • • 通过“用户提问”模块获取用户输入信息,并通过“用户提问”输出。

  • • “知识库搜索”模块通过“信息输入”输入用户的问题,然后执行以下步骤:

    1. 1. 将用户提问进行向量化,并与“大语言模型”的知识库中已有的内容切片进行向量检索。

    2. 2. 将搜索结果进行相似度排序,返回相似度排名靠前的切片。

  • • 连线2:如果“知识库搜索”结果中没有符合条件的切片内容,将触发“确定回复”模块,回复用户“抱歉,这个问题暂时无法回答,我还需要更多的学习”。

  • • 连线3:如果“知识库搜索”结果搜索到有符合条件的切片内容,将触发“智能对话”模块,并将提示词、“知识库搜索结果”以及“用户提问”一同传给“智能对话”模块进行处理。

参数设置

在“知识库搜索”模块中,有两个参数:知识库相似度和知识库单次搜索上限。它们控制了知识库向量搜索的结果和返回结果。具体说明如下:

  • 知识库相似度 :控制用户提问与搜索结果之间的相似度。建议调整在 0.6-0.9 左右。

  • 单次搜索上限 :设置最多取 x 条作为搜索结果输出。可通过调整参数并测试,选择更合适的上限数值。

本地知识与互联网搜索的结合Agent

我构建一个 一个结合 ** 知识库和搜索引擎 ** 功能的智能代理系统 Agent :

首先,大模型会在内部知识库中进行问题相关的搜索,然后利用知识库中找到的信息在互联网上进行进一步的搜索。

最终,综合本地知识和互联网搜索结果来回答问题,实现既有本地知识又有网络搜索的效果。

效果演示:

怎么发布呢?: ** 发布上架流程 ** (向上滑动)

One More Thing

6月3日,昆仑万维宣布开源 2 千亿稀疏大模型 Skywork-MoE ,性能强劲,同时推理成本更低。

Skywork-MoE 基于之前昆仑万维开源的 Skywork-13B 模型中间 checkpoint 扩展而来, 是首个完整将 MoE
Upcycling
技术应用并落地的 开源千亿 MoE 大模型,也是首个支持用 单台 4090 服务器推理的开源千亿 MoE大模型。

Skywork-MoE

原文介绍

https://mp.weixin.qq.com/s/FCwzPohoKnSl0lW2NOdiGw

SkyAgents 文档教程 https://www.yuque.com/skyagents/glwn9v 心得原文
https://www.oreilly.com/radar/what-we-learned-from-a-year-of-building-with-
llms-part-i/

知音难求,自我修炼亦艰

抓住前沿技术的机遇,与我们一起成为创新的超级个体

(把握AIGC时代的个人力量)

**
**

** 点这里 👇 关注我,记得标星哦~ **

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

预览时标签不可点

微信扫一扫
关注该公众号

轻触阅读原文

AI进修生



收藏

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/686089.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

浪潮电脑文件消失怎么恢复?原来有这五种方法

无论是工作、学习还是娱乐,电脑都扮演着举足轻重的角色。然而,在使用电脑的过程中,我们有时会遇到一些令人头疼的问题,比如文件突然消失。对于使用浪潮电脑的用户来说,文件消失可能是一个令人焦虑的问题。本文将为您详…

用负载绿原酸的纳米复合水凝胶调节巨噬细胞表型以加速伤口愈合

引用信息 文 章:Modulating macrophage phenotype for accelerated wound healing with chlorogenic acid-loaded nanocomposite hydrogel. 期 刊:Journal of Controlled Release(影响因子:10.8) 发表时间&a…

ubuntu系统(香蕉派)设置开机自启动

基本使用参考我之前发的:OrangePi AIpro从上手到网站部署使用-CSDN博客 以下介绍两种设置开机自启动的方法,分别对应界面中配置和在命令中配置 方法1: 编辑开启自启动命令 sudo nano /etc/rc.local # 在该文件中添加启动执行命令&#xff…

外企跨国大数据迁移的注意事项

跨国数据迁移,对汽车行业来说,是一桩大事。跨国公司在进行这一操作时,会遇到不少挑战,比如网络延迟、数据安全、成本控制等等。今天,咱们就聊聊跨国大数据迁移中,跨国车企需要留意的几个关键点。 跨国大数据…

主流的单片机语言是 C 吗?是的话为啥不是 C++?

是c,而且可以预见在很长很长一段时间,没有巨大变革的情况下都会是c 商业项目开发光讨论语言特性优劣问题,是非常片面的,所以要看待为什么是c,最主要仍然是从收益和成本上来看。 刚好我有一些资料,是我根据…

通过 SFP 接口实现千兆光纤以太网通信4

Tri Mode Ethernet MAC 与 1G/2.5G Ethernet PCS/PMA or SGMII 的连接 在设计中,需要将 Tri Mode Ethernet MAC 与 1G/2.5G Ethernet PCS/PMA or SGMII 之间通过 GMII 接口互联。Tri Mode Ethernet MAC IP 核的工作时钟源为 1G/2.5G Ethernet PCS/PMA or SGMII …

心理咨询系统|心理咨询系统成品开发功能

心理咨询系统开发后端设计是一个复杂且精细的过程,涉及多个关键领域的专业知识和技术。本文将详细探讨心理咨询系统开发后端设计的各个方面,包括系统架构、数据库设计、接口开发、安全性保障以及性能优化等。 首先,我们来谈谈系统架构。在心理…

指针还是学不会?跟着小代老师学,进入深入理解指针(4)

指针还是学不会?跟着小代老师学,进入深入理解指针(4) 1回调函数2qsort使用举例2.1使用qsort函数排序整行数据2.2使用qsort排序结构体数据 3qsort函数的模拟实现 1回调函数 回调函数就是一个通过函数指针调用的函数。 如果你把函数…

【窗口函数的详细使用】

前言: 💞💞大家好,我是书生♡,今天主要和大家分享一下可MySQL中的窗口函数的概念,语法以及常用的窗口函数,希望对大家有所帮助。感谢大家关注点赞。 💞💞前路漫漫,希望大…

【TS】进阶

一、类型别名 类型别名用来给一个类型起个新名字。 type s string; let str: s "123";type NameResolver () > string;: // 定义了一个类型别名NameResolver,它是一个函数类型。这个函数没有参数,返回值类型为string。这意味着任何被…

【轻量化】YOLOv10: Real-Time End-to-End Object Detection

论文题目:YOLOv10: Real-Time End-to-End Object Detection 研究单位:清华大学 论文链接:http://arxiv.org/abs/2405.14458 代码链接:https://github.com/THU-MIG/yolov10 推荐测试博客:YOLOv10最全使用教程&#xff0…

一个月速刷leetcodeHOT100 day14 彻底搞懂二分搜索 以及相关题目

二分查找算法(Binary Search Algorithm) 是一种用于在已排序数组中查找特定元素的高效算法。它的基本思想是每次将待查找的区间分成两部分,并确定目标元素位于哪一部分中,然后只在目标区间中继续查找,直到找到目标元素…

水经微图IOS版5.3.0发布

随时随地,微图一下! 水经微图(以下简称“微图”)IOS版,新版已上线。 当前版本 当前版本号为:5.3.0-beta 如果你发现该版本中存在问题,请及时反馈给我们修订。 关于我们产品的版本控制&…

国产工业级实时数据库

项目功能描述 Mars数据库的核心功能在于其能够高效地处理来自工业现场的大量传感器数据。它通过简化的可视化配置,允许用户轻松接入各种传感器,并进行数据记录和逻辑处理。Mars数据库在单机模式下支持高达120万个传感器信号的接入,而其分布式…

【文末附gpt升级秘笈】埃隆·马斯克芯片调配策略对特斯拉股价的影响分析

埃隆马斯克芯片调配策略对特斯拉股价的影响分析 一、引言 在现代商业环境中,企业间的资源调配与策略布局往往对其股价产生深远影响。据外媒CNBC报道,埃隆马斯克在芯片资源分配上的决策引起了业界的广泛关注。他秘密要求英伟达将原本预留给特斯拉的高端…

TMS320F280049学习3:烧录

TMS320F280049学习3:烧录 文章目录 TMS320F280049学习3:烧录前言一、烧录RAM二、烧录FLASH总结 前言 DSP的烧录分为两种,一种是将程序烧录到RAM中,一种是烧录到FLASH中,烧录ARM中的程序,只要未掉电&#x…

Vue3项目准备:utils工具插件文件夹中封装request.js配置axios请求基地址及超时时间、请求拦截器、响应拦截器

token介绍 概念:访问权限的令牌,本质上是一串字符串 创建:正确登录后,由后端签发并返回 作用:判断是否有登录状态等,控制访问权限 注意:前端只能判断token有无,而后端才能判断tok…

Camtasia Studio2024永久免费版及最新版本功能讲解

在当前数字化时代,视频内容的制作与编辑变得愈发重要。无论是企业宣传、在线教育还是个人Vlog制作,一款功能强大且易于上手的视频编辑软件成为了刚需。Camtasia Studio作为市场上备受欢迎的视频编辑与屏幕录像工具,凭借其强大的功能与用户友好…

在线标注流程

文章目录 在线标注流程标注方法 在线标注流程 登录地址:http://7a27c5e078f644a2a9b734603913c65e.login.bce.baidu.com 出现页面: 登录名: 三个中任意一个 密码:ZNSJ123a 登录之后叉掉。再打开这个网站:https://…

2938. 区分黑球与白球

题目 桌子上有 n 个球,每个球的颜色不是黑色,就是白色。 给你一个长度为 n 、下标从 0 开始的二进制字符串 s,其中 1 和 0 分别代表黑色和白色的球。 在每一步中,你可以选择两个相邻的球并交换它们。 返回「将所有黑色球都移到…