在三月份英伟达的新品发布会上,黄仁勋反复提及一个词汇— Generalist Embodied Agent,意为“通用具身智能体”,给观众留下了深刻的印象。其实具身智能指的是不同形态的拥有主动感知交互能力的机器人。其实,业界对它还有一个更为熟悉的名称即AI Agent,也称为智能体,是具身智能的核心概念。
大模型发展行至中途,AI Agent(智能体)相继成为各大科技巨头布局的新风口。如果说AGI(Artificial General Intelligence,通用人工智能)是人工智能的终局,那么AI agent则是它的必经之路。
Agent概念脱胎于一个古希腊哲学寓言,它描述了一种拥有欲望、信念、意图以及能够采取行动能力的实体,随着计算机技术的兴起与快速发展,加上人们对人工智能技术的期望,Agent的概念逐渐被引入到人工智能领域里。
AI Agent是指能够感知环境、进行推理和决策,并通过物理或虚拟的方式与环境进行交互的智能体。与传统的AI不同的是,Al Agent具备通过独立思考、调用工具去逐步完成给定目标的能力。在有LLM作为其大脑之后,Agent更是具备了对通用问题的自动化处理能力。简单说来,AI Agent是我们在科幻电影里经常出现并看到的能够感知环境、进行决策和执行动作的智能体,如自动驾驶、机器人、机械狗、智能家居等等。
Agents = LLM +规划技能+记忆 + 工具使用,即AI Agent的构建主要包括四个部分:大模型、规划、记忆和工具使用。本质上Agents是一个LLM的编排与执行系统,如下图所示:
它的四大组成部分中:
大模型:作为AI Agent的“大脑”,它提供推理、规划等能力。
规划:代理能够将大型任务分解为更小的、可管理的子目标,从而更好地处理复杂任务。
记忆:AI代理具备长时间保留和回忆信息的能力,通常通过利用外部向量存储和快速检索实现。
工具使用:代理学习调用外部 API 以获取模型权重中缺失的额外信息,包括当前信息、代码执行能力、对专有信息源的访问等。
目前的AI Agent存在一定的问题,大模型可靠性不足,能力边界不确定,Al Agent对于复杂任务处理不够理想。如处理长期规划和任务拆解时表现欠佳、开销极高等。AI Agent想获得更好发展,还要等待更优秀的大模型出现。
Al Agent交互的灵活稳定性不够。在目前的框架中,系统经常会交互信息设计导致系统不稳定,例如身份信息错乱,AI Agent间能力差异导致对话失败等问题。
目前,AI技术正在蓬勃发展,技术不断更新迭代,并向日益丰富的应用场景渗透。但AI技术的发展离不开基础的AI算力设施。
暴雨最新推出的Intel Eagle Stream平台4U8卡服务器专为加速AIGC应用而推出,采用最新的最新PCIe以及DDR5等技术,实现了性能、灵活、稳定和质量的全方位提升。提供两种扩展方式,可以灵活选择,其中,采用CPU-GPU直通,最多可支持8张600W 主流高性能企业级双宽GPU,满足下一代GPU功耗要求,降低用户平台升级成本。该方案无需Switch芯片,性价比更高。前置硬盘可以灵活选择12盘/8盘/16盘/24盘位,3.5”或2.5”SATA/SAS4.0/GEN5 NVME,提供海量存储和数据读写性能;GPU-GPU通过Switch芯片互联方案则更适用P2P场景,Switch-CPU带宽为PCIe5.0 x32,能够满足高性能GPU运算需求,在LLM推理过程中,可以大幅提升模型响应速度,最多可支持10张600W 主流高性能企业级双宽GPU。它能够广泛适用于作为需要大量计算和图形处理的云计算、虚拟化、大数据分析、数字孪生、深度学习等应用场景。
随着AI技术发展日益深入,不同场景下的应用日益广泛,面对客户需求的多样化和技术迭代的加速,暴雨将始终关注最为前言的技术发展,依托服务器领域深厚技术积淀与丰富实践经验,持续推进AI时代先进技术的探索研究和应用落地。
比尔·盖茨曾今预测5年内,AI Agent将大行其道,用户将拥有专属AI Agent,我们的生活也将被彻底改变,那么,你期待这一天的到来吗?