【DataWhale学习】灵境Agent开发——Agent介绍
这次我参加了 DataWhale 的灵境Agent开发者训练营,第一次开发了一款属于自己的Agent,整体体验下来,操作还是非常方便的。灵境Agent和Coze上面创建的bot差不多,零代码开发可以仅仅通过与 bot 对话,不需要任何代码基础,就能创建属于自己的Agent,这种Agent在大模型的基础上,加上你的个性化提示词,最终达到的效果也是非常哇塞的。
我这次是参加了第二期的比赛,赛题是**「文旅」智能体** ,我选择创建了一个 故宫小导游,链接如下 故宫小导游 ,欢迎来体验呀~
参考:
官方文档:零代码智能体开发 - 灵境矩阵文档中心 (baidu.com)
DataWhale教程:零基础创建AI智能体教程 - 飞书云文档 (feishu.cn)
1 Agent基础概念入门
1.1 Agent基础概念
AI Agent(人工智能代理)是一种能够感知环境、进行决策和执行动作的智能实体。 AI Agent也可以称为“智能体”,也可理解为“智能业务助理”,指在大模型技术驱动下,让人们以自然语言为交互方式高自动化地执行和处理专业或繁复的工作任务,从而极大程度释放人员精力。
以上是官方文档对 AI Agent 的介绍,我的理解就是一个以大模型为基础,添加某些插件,并赋予特定的提示词,创建出来的个性化的对话系统。这个系统也可以超过对话的范围,有着多模态的功能,如通过不同的插件可以利用图片、语言进行输入输出等功能。
OpenAI应用研究主管翁丽莲(Lilian Weng)撰写过一篇blog: LLM Powered Autonomous Agents,将 Agents 定义为 LLM + memory + planning skills + tool use ,即大语言模型、记忆、任务规划、工具使用的集合。
在 LLM 驱动的自主 Agent 代理系统中,LLM 充当 Agent 代理的大脑,并由几个关键组件补充:
- 规划 (Planning)
- 子目标和分解:代理将大型任务分解为更小的、可管理的子目标,从而能够高效处理复杂任务。
- 反思和完善:智能体可以对过去的行为进行自我批评和自我反省,从错误中吸取教训,并为未来的步骤进行改进,从而提高最终结果的质量。
- 记忆 (Memory)
- 短期记忆:我认为所有的情境学习(参见提示工程)都是利用模型的短期记忆来学习的。
- 长期记忆:这为代理提供了在较长时间内保留和调用(无限)信息的能力,通常是通过利用外部向量存储和快速检索。
- 工具使用 (Tool use)
- 代理学习调用外部 API 以获取模型权重中缺少的额外信息(在预训练后通常很难更改),包括当前信息、代码执行能力、对专有信息源的访问等。
1.2 Agent应用
Agent 可以具有功能性,如 “论文优化助手” 、“雅思口语考官”等,也可以具有娱乐性,如 “阴阳怪气美羊羊桑”、“V我50机器人”等。像个人智能助手(Siri、小爱同学)、在线客服聊天机器人、智能家居系统,也都属于Agent。
光靠概念可能不太好理解,下面举几个例子,有的是官方案例,有的是DataWhale群里的小伙伴创建的我觉得非常有趣的Agent。
-
疯狂星期四达人
这个 Agent 可以让它随便编一段故事,最后以“V我50结尾”。是衍生与网上许多疯狂星期四V我50的段子。
链接如下:疯狂星期四达人
-
恐怖海龟汤
这个 Agent 就是可以通过你给的场景提示词,帮你一直续写下去一个恐怖故事,有点像海龟汤但也不一样。
链接如下:恐怖海龟汤
-
新媒体文章创作
这个好像是官方创作的一个范例Agent,可以通过让其生成特定主题,特定平台风格的文章。
链接如下:新媒体文章创作
-
国画大师
这个也是官方创作的一个范例Agent,可以根据你的输入创作相应的国画风格图像。
链接如下:国画大师