AI代理架构的发展：从单一到多代理系统的演进及其影响分析

news2026/5/7 18:17:57

每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/

代理人的转变

自从ChatGPT推出以来，初代的生成性AI应用主要围绕着使用检索增强生成（RAG）模式的聊天机器人，以响应用户提示。尽管有持续的工作来增强这些基于RAG的系统的健壮性，研究社区现在正在探索下一代AI应用 —— 其中一个共同的主题是发展自主AI代理人。

代理系统整合了如规划、迭代和反思等高级能力，这些能力利用模型固有的推理能力来完成端到端的任务。配合使用工具、插件和函数调用的能力 —— 代理能够处理更广泛的通用工作。

代理人的推理、规划和有效工具调用的重要性

推理是人类思维的基础构件。没有推理，人们无法做决策、解决问题或在学到新信息时完善计划 —— 本质上是误解了我们周围的世界。如果代理人没有强大的推理技能，他们可能会误解其任务，生成无意义的答案，或未能考虑多步骤的影响。

我们发现大多数代理实现包含一个规划阶段，该阶段采用以下技术之一来创建计划：任务分解、多计划选择、外部模块辅助规划、反思和完善以及记忆增强规划。

相较于仅使用基础语言模型，利用代理实现的另一个好处是，代理人可以通过调用工具解决复杂问题。工具可以使代理执行诸如与API交互、写入第三方应用程序等操作。推理和工具调用紧密相连，有效的工具调用依赖于充分的推理。简而言之，不能期望一个推理能力差的代理人知道何时是调用其工具的合适时机。

单一代理与多代理架构

研究强调，无论是单一代理还是多代理架构，都可以通过采用推理和工具调用步骤来解决具有挑战性的任务。

对于单一代理实现，我们发现成功的目标执行依赖于适当的规划和自我修正。如果没有自我评估和创建有效计划的能力，单一代理可能会陷入无休止的执行循环，永远无法完成既定任务或返回不符合用户期望的结果。我们发现，当任务需要直接函数调用且不需要来自另一代理的反馈时，单一代理架构特别有用。

然而，我们注意到单一代理模式通常难以完成一长串子任务或工具调用。多代理模式可以解决并行任务和鲁棒性问题，因为架构中的多个代理可以分别处理各个子问题。许多多代理模式首先将复杂问题分解为若干个较小的任务。然后，每个代理使用其独立的工具集独立解决各个任务。

涉及多个代理的架构提供了基于能力进行智能劳动分配的机会，以及来自不同代理人格的宝贵反馈。许多多代理架构在规划、执行和评估阶段以阶段方式运作，其中代理团队被动态

组建和重组。这种重组因为利用了专门的代理来完成特定任务，并在不再需要时将其移除，从而产生了优越的结果。通过匹配代理角色和技能以适应手头的任务，代理团队可以提高准确性并缩短完成目标所需的时间。有效的多代理架构的关键特性包括在代理团队中明确的领导、动态团队构建和团队成员之间的有效信息分享，以防重要信息在无关紧要的通信中丢失。

研究突出了诸如ReAct、RAISE、Reflexion、AutoGPT + P、LATS以及多代理实现如DyLAN、AgentVerse和MetaGPT等著名的单一代理方法，这些在全文中有更深入的解释。

我们的关键发现

单一代理模式：

单一代理模式通常最适合工具列表明确且流程明确定义的任务。它们不会受到来自其他代理的不良反馈或来自其他团队成员的分散和无关的闲聊的影响。然而，如果单一代理的推理和完善能力不健全，它们可能会陷入执行循环，并且无法朝着其目标取得进展。

多代理模式：

多代理模式非常适合需要来自多个人格的反馈以完成任务的情况。当需要跨不同任务或工作流的并行处理时，它们很有用，允许各个代理继续进行下一步操作，而不受其他代理处理的任务状态的影响。

反馈和人在循环中

语言模型倾向于在其响应中更早地承诺一个答案，这可能导致与其目标状态日益偏离的“滚雪球效应”。通过实施反馈，代理更有可能纠正其路径并达到其目标。人类的监督通过使代理的回应更贴近人类的期望，改善了即时结果，产生了更可靠和更值得信赖的结果。代理可能会受到来自其他代理的反馈的影响，即使这些反馈并不可靠。这可能会导致代理团队产生一个错误的计划，使他们偏离目标。

信息共享和沟通

多代理模式更倾向于陷入礼节性的交流，代理们可能会互相询问诸如“你好吗”，而单一代理模式则倾向于专注于手头的任务，因为没有团队动态需要管理。这可以通过强有力的提示来减轻。在垂直架构中，代理可能会失败于将关键信息发送给他们的支持代理，没有意识到其他代理不知道完成其任务所需的必要信息。这种失败可能导致团队混乱或结果出现幻觉。解决这个问题的一种方法是在系统提示中明确包括关于访问权的信息，以便代理进行上下文适当的交互。