AI Agent智能化水平提升路径有哪些?

AI Agent智能化水平提升路径有哪些?

最佳答案 匿名用户编辑于2024/07/31 10:14

多路径共同提升 Agent 整体智能化水平,有望逐步通向整体智能。

LLM+Agent 是通向通用人工智能(AGI)的路径之一。AI Agent 用来描述表现出智能行为 并具有自主性、反应性、主动性和社交能力的人工实体,能够使用传感器感知周围环境、 做出决策,然后使用执行器采取行动,具备以上特征的 Agent 是实现 AGI 的关键一步。据 2023 年 11 月 Google DeepMind 发布的论文《Levels of AGI: Operationalizing Progress on the Path to AGI》,考虑 AGI 性能、通用性和自主性级别,AGI 的发展可按 L0-L5 分级。按 该分级方法,目前在狭义 AI 上人类已经实现了在特定的任务上让 AI 超越人类,但是对于广 义的 AGI 仅实现到 L1 阶段,典型代表是 ChatGPT、Bard 和 Llama。从更广义的评判标准 看,基于 LLM 的 Agent 评估工作还从效用、社会性、价值等角度开展,我们认为当前基于 LLM 的 Agent 从能力上看受到 LLM 能力上限的限制,未来随着 Agent 的不断升级,有望逐 步逼近 AGI,具体的路径包括模态丰富、具身智能、多 Agent 协同、系统优化等。

路径一:模态丰富+具身智能+多 Agent 协同。Agent 具有五个层级,信息维度不断丰富有望推动能力提升。Yonatan Bisk 在《Experience Grounds Language》中提出 World Scope (WS),来描述自然语言处理到通用人工智能(AGI) 的研究进展,包括语料库-互联网-感知(多模态 NLP)-具身-社会 5 个层级。当前多数 LLM 建立在互联网层级,具有互联网规模的文本输入和输出。而随着 LLM 进一步配备扩展的感 知空间和行动空间,有望进一步通向感知、具身层级,未来多个 Agent 共同工作,有望产 生涌现的社会现象,达到第五层级。

多 Agent 协同或出现团体行为,提升智能化程度。从 Agent 落地方式看,可分为单 Agent 部署、多 Agent 交互和人-Agent 交互三种方式,其中多 Agent 交互及人-Agent 协同通过不 同的方式给予 Agent 反馈,有助于 Agent 不断强化解决问题的能力。更进一步的模拟 Agent 社会框架中,在个人层面 Agent 表现出计划、推理和反思等内在行为,以及涉及认知、情 感和性格的内在个性特征。Agent 和其他 Agent 可以组成团体并表现出团体行为,如合作。 在环境中其他 Agent 也是环境的一部分,Agent 有能力通过感知和行动与环境互动。

关注基础智能体进展。据英伟达科学家 Jim Fan 的演讲,基础智能体(Foundation Agent) 是掌握广泛技能,控制许多身体,并能够泛化到多个环境中的单一算法。随着模型得到信 息数量的提升及训练速度的加快,理论上模型能够掌握的技能数量、可控制的身体形态或 载体、所能掌握的现实情况有望不断提升。例如在 Minecraft 中,Voyager 通过引入反馈(来 自代码运行错误、虚拟人物状态、虚拟环境状况),使虚拟人物在游戏环境中能够不断学习 新的技能;机器人训练 Agent MetaMorph 通过设计特殊词汇描述机器人的具体身体部位, 利用 Transformer 输出电机控制,实现对机器人的控制。通过对训练进行加速,有望将 Agent 的能力进一步泛化,最终实现自主的基础 Agent。

路径二:通过提升整体性或利用工作流解决复杂问题。通过提升 Agent AI 整体性有助于解决复杂问题。除了单个模块、环节的技术突破,模块间 的互动方式也是 Agent 能力的重要影响因素。当前的 AI Agent 对于被动结构化任务的处理 已有较为丰富的实践,但距离在复杂环境中扮演动态互动角色仍有一定的差距,我们认为 除了单个模块的能力提升,围绕 AI Agent 整体系统的优化或将成为 AI Agent 能力进一步提 升的重要驱动力。据《Agent AI Towards a Holistic Intelligence》,研究人员提出一个将大 型基础模型集成到 Agent 动作中的具体系统——Agent AI 系统,该系统强调 AI 作为有凝聚 力的整体发挥作用。按系统层级看,自下而上分别为数据-预训练模型-调优模型-任务-跨模 态-不可知的现实(新范式/物理世界/虚拟现实/元宇宙/涌现能力等)-整体智能。在数据端, 该系统强调利用不同环境之间的交互获取的跨模态数据,在系统端则结合了大型基础模型 对开放世界环境中感官信息的理解,最终 AI 展示了较好的跨学科、跨任务能力,涵盖了机 器人、游戏和医疗保健系统等新兴领域。长期看该路径或将逐步通向整体智能。

Agent Workflow 通过流程优化提升任务效果。2024 年 3 月,斯坦福大学吴恩达教授在博 客中提出在 HumanEval 数据集中,使用 GPT-3.5(Zero-shot)的测试正确率为 48.1%。 GPT-4(Zero-shot)为 67.0%。而通过与 Agent workflow 配合,GPT-3.5 实现了 95.1%的 正确率。在加入 Agent workflow 后,模型在具体任务中的能力有了明显的提升。Agent workflow 是一种新的工作流程,要求 LLM 多次迭代文档。从设计模式上,Agent 有四种模 式:1)Reflection(反思):让智能体审视和修正自己生成的输出;2)Tool Use(使用工具): LLM 被赋予 Web 搜索、代码执行或其他功能,以帮助它收集信息、采取行动或处理数据;3) Planning(规 划 ): 让 LLM 提出并执行一 个多步骤计划来实现目 标; 4) Multiagent collaboration(多智能体协作):多个智能体合作完成任务。我们认为 Agent Workflow 通过对 LLM 应用的流程优化,有助于提升 Agent 解决具体任务的准确性,LLM 应用端厂商有望借 鉴此方法推动更多垂类 LLM 落地。

参考报告

人工智能行业专题研究:AI Agent,通往AGI的核心基础.pdf

人工智能行业专题研究:AIAgent,通往AGI的核心基础。LLM推动AIAgent进入新阶段,AI应用商业化或加速。AIAgent是一种能够感知环境、进行决策和执行动作的智能实体,从发展历程看,经历了用逻辑规则和符号封装知识、快速响应环境、基于强化学习等发展阶段。随着大语言模型(LLM)的快速发展,AIAgent在感知、记忆、规划、行动等模块方面的能力均得到了进一步的提升。我们认为LLM推动AIAgent进入了新阶段,与LLM结合的AIAgent在智能化程度、自主性方面有进一步提升的潜力,通过与终端的进一步结合,有望推动AI应用商业化加速。AIAgent能力提升:感知/规划/记忆模块强化或工...

查看详情
相关报告
我来回答