一、背景
吴恩达在《What’s next for AI agentic workflows ft》分享中提出 AI 智能体的四种模式。
反思(Reflection): LLM 检查自己的工作,以提出改进方法。
使用工具(Tool use):LLM 拥有网络搜索、代码执行或任何其他功能来帮助其收集信息、采取行动或处理数据。
规划(Planning):LLM 提出并执行一个多步骤计划来实现目标。
多智能体协作(Multi-agent collaboration):多个 AI 智能体一起工作,分配任务并讨论和辩论想法,提出比单个智能体更好的解决方案。
二、介绍
1. 反射(Reflection)
- 定义:反射模式允许AI代理自我审视其产出,评估正确性、效率和构造质量。通过这种方式,AI能够识别并修正自身产出中的错误,从而提高最终产物的质量。
- 应用实例:一个典型的应用是代码编写。AI首先生成代码,然后再次审视这段代码,检查是否有逻辑错误或可以优化的地方,并据此进行修改。这种自我修正的过程可能循环进行多次,直到代码达到预期的标准。
2. 多工具使用(Tool Use)
-
定义:这种模式指的是AI代理能够利用多种工具和资源来完成任务,例如进行网络搜索、调用其他软件接口等。这扩展了AI的能力,使其不仅限于单一任务或领域。
-
应用实例:在处理需要外部信息或特定领域工具的任务时,AI代理可以先识别出所需的工具或信息源,然后获取并应用这些资源来完成任务。比如,生成一段代码前,先通过网络搜索相关的算法或逻辑。
3. 计划算法(Planning)
-
定义:计划算法使AI代理能够设计一系列有序的步骤来解决复杂问题,这通常涉及到前瞻性思维和策略规划。
-
应用实例:AI代理可以根据给定的目标自动规划出实现路径,比如在开发一个新项目时,AI能够规划出研究、设计、编码、测试等一系列步骤,并自动执行这一计划,甚至在遇到问题时重新规划以绕过障碍。
4. 多代理合作(Multi-agent Collaboration)
-
定义:这种模式涉及到多个AI代理相互协作,每个代理可能负责不同的任务或扮演不同的角色,通过协作来解决问题或完成任务。
-
应用实例:在软件开发的场景中,一个AI代理可能扮演项目经理的角色,负责规划项目和分配任务,另一个AI代理扮演开发者角色,负责编写代码,还有的AI代理可能专注于测试和代码审查。这些代理通过相互协作,能够自动完成一个软件开发项目。
每种设计模式都体现了AI代理工作流在提高任务处理效率、增强问题解决能力方面的潜力,预示着AI技术在复杂任务处理和自动化方面的未来发展方向。
三、对未来的预测与挑战
吴教授预测,智能体工作流将在未来几年内极大扩展 AI 的能力边界。他强调了快速的 token 生成的重要性,认为这将支持更有效的迭代和改进过程。同时,他提到了对于即时反馈期望的调整,指出在使用AI智能体工作流时,我们需要学会耐心等待。
参考资料:
- 《What’s next for AI agentic workflows ft》
- https://www.deeplearning.ai/the-batch/issue-242/