Agent定义、架构与局限性分析

Agent定义、架构与局限性分析

最佳答案 匿名用户编辑于2025/09/15 13:16

传统 Agent 架构受限于硬件条件和预编程机制,仅具备有限的自 主性与对动态环境的适应能力,尚不具备当今 AI Agent 的生成、学习和环境感知 的“智能”。

1. Agent 的早期定义

Agent 的概念源于 1959 年约翰·麦卡锡提出的“建议接受者”(advice taker),其 核心是具备感知、推理与行动能力的常识性程序。1995 年,斯图尔特·罗素与彼 得·诺维格将其定义为“能通过传感器感知环境并以执行器作用于环境的任何事 物”。同年,伍尔德里奇与詹宁斯提出了强弱 Agent 的概念,其中 Agent 的“弱定 义”是相对普遍的用法,指任何具备某些基本属性的硬件或(更常见的)软件系 统。这些属性包括:自主性(autonomy)、社交能力(social ability)、反应性 (reactivity)和主动性(pro-activeness)。从概念上讲,这种 Agent 可以看作一个 自包含的、并发执行的软件进程,该定义也因其通用性而被广大学者接受,并成 为后来 AI Agent 技术应用的基础。

2. 传统 Agent 架构发展

在 20 世纪 70 到 90 年代,研究者提出了几种截然不同但影响深远的架构:审议式 (Deliberation)架构基于逻辑以及人类的理性,将智能决策过程建模为严谨的逻 辑推导;反应式(Reactive)架构从生物行为中汲取灵感,强调快速、鲁棒的应激 行为;混合架构则融合了这两种架构的优势。

2.1. 审议式架构:BDI 架构(Belief-Desire-Intention Architecture)

审议式架构,也被称为符号架构(Symbolic-based Architecture),是一种早期的智 能体设计方法,其核心思想是使用符号表示来建模环境和智能体的行为。该架构 建立在艾伦·纽厄尔和赫伯特·西蒙于 1975 年提出的物理符号系统假说之上,该 假说认为通用的智能行为源于物理符号系统。 审议式架构中最杰出的代表是“信念-愿望-意图”(BDI)架构。在该架构中,信念 是所有可能性的集合。而目标是对信念的第一次筛选,只保留期望的结果。意图 则是对目标的第二次筛选,锁定一个具体的、承诺要执行的计划。 在 BDI 架构下,Agent 能够像人类一样,在信念的基础上,从多个愿望中选择并 确定当前意图,然后执行相应的计划。这种架构适合需要进行长期规划、协商和 理性决策的复杂应用场景。

2.2. 反应式架构:包容架构(Subsumption Architecture)

与审议式架构的自上而下、基于模型的思想形成鲜明对比的是反应式架构。其中 最具代表性的是罗德尼·布鲁克斯于 1986 年提出的包容架构,该架构最初被应用 于机器人自动化领域的架构设计。布鲁克斯认为,将智能分解为“感知-规划-行动” 的串行功能模块是错误的,构建复杂的、中心化的世界模型是一条走不通的路。 包容架构的核心创新在于其分解方式:按任务达成的行为进行水平分解,形成一 个由多个能力递增的并行层级组成的控制系统,每一层都是一个自足的行为产生 系统。其中,最底层实现最基本的行为,如等级 0 的能力是“避免与物体接触”。 更高层则实现更复杂的行为,例如等级 1 的“随意漫游”或等级 2 的“探索世界”。

包容架构本质上是一种分布式设计,高层控制系统通过包容低层的角色来取得 控制权。这种机制允许多个目标并行处理,由抑制机制来协调最终采取的行动。 其结果是系统具有很高的鲁棒性:即使高层模块因故无法及时产生结果,底层 已经过充分调试的模块仍会继续运行,确保 Agent 能表现出基础但合理的行为。

2.3. 混合架构:Touring Machine 架构

审议式架构虽然具有远见,但反应迟缓且在意外情况面前显得脆弱;而反应式架 构虽然鲁棒且响应迅速,但行为短视,可能导致次优甚至有害的结果。认识到这 两种极端架构的局限性后,研究者开始探索将二者结合的混合架构,融合反应式 控制的鲁棒性和实时性,以及审议式规划的目标导向性和前瞻性。 Innes Ferguson 于 1992 年提出的的 Touring Machine 架构由三个并行运作、独立驱 动的控制层构成,为动态环境中的自主移动 Agent 提供所需的多样化行为能力。 其关键在于控制框架,通过一套“审查规则”(censor rules)和“压制规则” (suppressor rules)来协调不同层级提出的行动指令。这些规则充当过滤器,确 保在任何时间片内,只有一个行动指令被最终执行。这种机制使得 Agent 能够根 据当前情境和任务需求,在审议式和反应式行为之间进行动态切换,从而兼具两 者的优点。

2.4. 传统 Agent 架构对比

BDI 与包容架构之间的争论,不仅是技术实现上的差异,更反映了关于 Agent 智 能本质的哲学差异:BDI 架构认为智能是对符号表征进行逻辑推演的过程,而包 容架构认为智能是系统与环境交互的产物。Touring Machine 为代表的混合架构, 是技术上的折衷,但也让研究者认识到,一个完整的 Agent 既需要审议式的前瞻 性,也需要反应式的现实根基。

3. 传统 Agent 架构的局限性

传统 Agent 架构的发展,普遍受限于由硬件性能与静态预编程共同构成的系统性 困境:主流硬件 CPU 不擅长处理大规模复杂并行任务,内存发展速度不及 CPU 导致“内存墙”现象;依赖预编程行为,而非学习驱动与情境感知能力,而无法 适应动态环境。 1) 硬件桎梏:CPU 不擅长处理复杂并行指令,且内存发展速度不及 CPU。传 统 Agent 架构的发展,其制约因素之一在于当时的硬件资源限制。彼时的主 流硬件是 CPU,其串行指令处理特性(一次仅能执行单条指令)使基于推理 循环的 BDI 架构成为了主流。此外,20 世纪 90 年代的“内存墙”现象揭示 了处理器与内存子系统发展的严重失衡:处理器性能呈指数级提升,而内存 带宽和延迟的改善却相对缓慢。这种限制使得决策过程耗时过长,难以适应 动态变化的环境需求。 2) 知识更新:静态预编程行为难以实现动态知识更新。传统 Agent 架构,最核 心的局限性在于对预编程行为的依赖。其行为逻辑和计划通常由开发者根据 专家知识预先设计和硬编码。这种方法假定可以为 Agent 面临的大多数情况 预先制定解决方案。然而,这种预设行为的僵化特性使其难以应对复杂、动 态且不可预测的真实世界。

参考报告

AI产业深度报告:AI Agent的技术演进与产业洞察.pdf

AI产业深度报告:AIAgent的技术演进与产业洞察。AIAgent未来的演进核心在于以大语言模型(LLM)为“大脑”的范式革命,其商业价值则率先通过能够解决具体行业痛点、实现高精度和高可靠性的垂直应用和AIAgent开发平台得以体现。AIAgent正从根本上重塑软件开发与人机交互的范式。随着大语言模型(LLM)的革命性突破,AIAgent的发展已从传统架构演进为以LLM为核心的现代范式,具备了自主规划、环境感知与工具调用能力。这一转变开启了由多个专业Agent协同解决宏大问题的多智能体协作时代,驱动了从上游基础模型到下游应用的完整产业链的形成。AIAgent的技术演进...

查看详情
相关报告
我来回答