AI代理架构的发展:从单一到多代理系统的演进及其影响分析

news2024/5/18 18:29:18

  每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

代理人的转变


自从ChatGPT推出以来,初代的生成性AI应用主要围绕着使用检索增强生成(RAG)模式的聊天机器人,以响应用户提示。尽管有持续的工作来增强这些基于RAG的系统的健壮性,研究社区现在正在探索下一代AI应用 —— 其中一个共同的主题是发展自主AI代理人。

代理系统整合了如规划、迭代和反思等高级能力,这些能力利用模型固有的推理能力来完成端到端的任务。配合使用工具、插件和函数调用的能力 —— 代理能够处理更广泛的通用工作。

代理人的推理、规划和有效工具调用的重要性


推理是人类思维的基础构件。没有推理,人们无法做决策、解决问题或在学到新信息时完善计划 —— 本质上是误解了我们周围的世界。如果代理人没有强大的推理技能,他们可能会误解其任务,生成无意义的答案,或未能考虑多步骤的影响。

我们发现大多数代理实现包含一个规划阶段,该阶段采用以下技术之一来创建计划:任务分解、多计划选择、外部模块辅助规划、反思和完善以及记忆增强规划。

相较于仅使用基础语言模型,利用代理实现的另一个好处是,代理人可以通过调用工具解决复杂问题。工具可以使代理执行诸如与API交互、写入第三方应用程序等操作。推理和工具调用紧密相连,有效的工具调用依赖于充分的推理。简而言之,不能期望一个推理能力差的代理人知道何时是调用其工具的合适时机。

单一代理与多代理架构


研究强调,无论是单一代理还是多代理架构,都可以通过采用推理和工具调用步骤来解决具有挑战性的任务。

对于单一代理实现,我们发现成功的目标执行依赖于适当的规划和自我修正。如果没有自我评估和创建有效计划的能力,单一代理可能会陷入无休止的执行循环,永远无法完成既定任务或返回不符合用户期望的结果。我们发现,当任务需要直接函数调用且不需要来自另一代理的反馈时,单一代理架构特别有用。

然而,我们注意到单一代理模式通常难以完成一长串子任务或工具调用。多代理模式可以解决并行任务和鲁棒性问题,因为架构中的多个代理可以分别处理各个子问题。许多多代理模式首先将复杂问题分解为若干个较小的任务。然后,每个代理使用其独立的工具集独立解决各个任务。

涉及多个代理的架构提供了基于能力进行智能劳动分配的机会,以及来自不同代理人格的宝贵反馈。许多多代理架构在规划、执行和评估阶段以阶段方式运作,其中代理团队被动态

组建和重组。这种重组因为利用了专门的代理来完成特定任务,并在不再需要时将其移除,从而产生了优越的结果。通过匹配代理角色和技能以适应手头的任务,代理团队可以提高准确性并缩短完成目标所需的时间。有效的多代理架构的关键特性包括在代理团队中明确的领导、动态团队构建和团队成员之间的有效信息分享,以防重要信息在无关紧要的通信中丢失。

研究突出了诸如ReAct、RAISE、Reflexion、AutoGPT + P、LATS以及多代理实现如DyLAN、AgentVerse和MetaGPT等著名的单一代理方法,这些在全文中有更深入的解释。

我们的关键发现


单一代理模式:

单一代理模式通常最适合工具列表明确且流程明确定义的任务。它们不会受到来自其他代理的不良反馈或来自其他团队成员的分散和无关的闲聊的影响。然而,如果单一代理的推理和完善能力不健全,它们可能会陷入执行循环,并且无法朝着其目标取得进展。

多代理模式:

多代理模式非常适合需要来自多个人格的反馈以完成任务的情况。当需要跨不同任务或工作流的并行处理时,它们很有用,允许各个代理继续进行下一步操作,而不受其他代理处理的任务状态的影响。

反馈和人在循环中

语言模型倾向于在其响应中更早地承诺一个答案,这可能导致与其目标状态日益偏离的“滚雪球效应”。通过实施反馈,代理更有可能纠正其路径并达到其目标。人类的监督通过使代理的回应更贴近人类的期望,改善了即时结果,产生了更可靠和更值得信赖的结果。代理可能会受到来自其他代理的反馈的影响,即使这些反馈并不可靠。这可能会导致代理团队产生一个错误的计划,使他们偏离目标。

信息共享和沟通

多代理模式更倾向于陷入礼节性的交流,代理们可能会互相询问诸如“你好吗”,而单一代理模式则倾向于专注于手头的任务,因为没有团队动态需要管理。这可以通过强有力的提示来减轻。在垂直架构中,代理可能会失败于将关键信息发送给他们的支持代理,没有意识到其他代理不知道完成其任务所需的必要信息。这种失败可能导致团队混乱或结果出现幻觉。解决这个问题的一种方法是在系统提示中明确包括关于访问权的信息,以便代理进行上下文适当的交互。

角色定义和动态团队的影响

对于单一代理和多代理架构而言,清晰的角色定义都至关重要。角色定义确保代理理解其指派的角色,专注于提供的任务,执行适当的工具,并最小化其他能力的幻觉。建立明确的团队领导可以提高多代理团队的整体表现,通过简化任务

分配。动态团队,根据需要将代理引入和移出系统,也被证明是有效的。这确保参与任务的所有代理都是强有力的贡献者。

关键见解摘要

讨论的关键见解表明,最佳的代理架构根据用例的不同而有所不同。无论选择哪种架构,表现最好的代理系统倾向于至少采用以下一种方法:明确定义的系统提示、清晰的领导和任务分配、专门的推理/规划-执行—评估阶段、动态团队结构、人类或代理反馈以及智能信息过滤。利用这些技术的架构在各种基准和问题类型中更为有效。

结论


我们的元分析旨在提供对当前AI代理景观的全面理解,并为那些使用现有代理架构或开发自定义代理架构的人提供洞见。在自主AI代理的设计和开发中存在显著的限制和未来改进的领域,例如缺乏全面的代理基准、现实世界的适用性以及减轻有害语言模型偏见的措施。这些领域将需要在近期内得到解决,以实现可靠的代理。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1641994.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

数字逻辑之“逻辑门电路”

一、基础知识 1、正逻辑和负逻辑 (1)基本的逻辑规定 1——“真”0——“假” (2)正逻辑和负逻辑 在实际的数字系统中,用数字信号(逻辑电平U1,U2)表示“真(1&#xf…

FloodFill-----洪水灌溉算法(DFS例题详解)

目录 一.图像渲染: 代码详解: 二.岛屿数量: 代码详解: 三.岛屿的最大面积: 代码详解: 四.被围绕的区域: 代码详解: 五.太平洋大西洋水流问题: 代码详解&#x…

[leetcode] B树是不是A树的子结构

给定两棵二叉树 tree1 和 tree2,判断 tree2 是否以 tree1 的某个节点为根的子树具有 相同的结构和节点值 。 注意,空树 不会是以 tree1 的某个节点为根的子树具有 相同的结构和节点值 。 示例 1: 输入:tree1 [1,7,5], tree2 [6,…

Docker-compose部署LTC同步节点

1、下载ltc程序包,litecoin下载地址 下载页 mkdir /data/docker-compose/ltc cd /data/docker-compose/ltc https://github.com/litecoin-project/litecoin/releases/download/v0.21.3/litecoin-0.21.3-x86_64-linux-gnu.tar.gz2、编写dockerfile和bitcoin.conf b…

M2M vs. IoT?

有任何关于GSMA\IOT\eSIM\RSP\业务应用场景相关的问题,欢迎W: xiangcunge59 一起讨论, 共同进步 (加的时候请注明: 来自CSDN-iot). 连接设备已经开辟了创造价值和解决重大世界问题的广泛机会,例如可持续发展。 今天,我们网络设备的方式可…

tomcat打开乱码修改端口

将UTF-8改成GBK 如果端口冲突,需要修改tomcat的端口

智慧校园云平台源码,SaaS运营云平台(支持多学校、多校园使用)

智慧班牌系统,又称电子班牌系统,是一种基于互联网技术的综合管理工具。通过在教室内安装显示屏,并连接到学校管理系统,实现教学资源展示、信息发布、学生管理等多种功能的集成。该系统旨在加强学校班级文化建设和班级风采展示&…

Gitea 上传用户签名

在 Gitea 的用户管理部分,有一个 SSH 和 GPG 的选项。 单击这个选项,可以在选项上添加 Key。 Key 的来源 如是 Windows 的用户,可以选择 Kleopatra 这个软件。 通过这个软件生成的 Key 的界面中有一个导出功能。 单击这个导出,…

84、动态规划-完全平方数

思路 第一种递归方式&#xff1a; public static int numSquares3(int n) {if (n<2){return n;}return process(n);}private static int process(int rest) {if (rest<0){return 0;}int minrest;for (int i 2; i*i <rest ; i) {int countrest/(i*i);for (int j 1;…

初始Java篇(JavaSE基础语法)(6)(继承和多态)(下)

找往期文章包括但不限于本期文章中不懂的知识点&#xff1a; 个人主页&#xff1a;我要学编程(ಥ_ಥ)-CSDN博客 所属专栏&#xff1a;JavaSE 多态篇 目录 多态的概念 实现多态的条件 必须在继承体系下实现向上转型&#xff1a; 子类必须对父类中的方法进行重写&#xff1…

Wireshark CLI | 过滤包含特定字符串的流

问题背景 源自于和朋友的一次技术讨论&#xff0c;关于 Wireshark 如何查找特定字符串所在的 TCP 流&#xff0c;原始问题如下&#xff1a; 仔细琢磨了下&#xff0c;基于我对 Wireshark 的使用经验&#xff0c;感觉一步到位实现比较困难&#xff0c;所以想着说用 Wireshark C…

Tomcat启动闪退怎么解决(文末附终极解决方案)

AI是这么告诉我的 Tomcat启动时出现闪退问题可能由多种原因引起&#xff0c;以下是解决此类问题的一些通用方法&#xff1a; 检查环境变量&#xff1a; 确保已经正确设置了JAVA_HOME和JRE_HOME环境变量&#xff0c;并指向正确的Java安装路径。将Java的bin目录添加到系统的PATH…

用户中心(下)

文章目录 计划登录逻辑接口简单说明cookie和session写代码流程后端逻辑层控制层测试用户管理接口 前端简化代码对接后端代理 计划 开发完成后端登录功能 &#xff08;单机登录 > 后续改造为分布式 / 第三方登录&#xff09;✔开发后端用户的管理接口 &#xff08;用户的查询…

LLaMA详细解读

LLaMA 是目前为止&#xff0c;效果最好的开源 LLM 之一。精读 LLaMA 的论文及代码&#xff0c;可以很好的了解 LLM 的内部原理。本文对 LLaMA 论文进行了介绍&#xff0c;同时附上了关键部分的代码&#xff0c;并对代码做了注释。 摘要 LLaMA是一个系列模型&#xff0c;模型参…

u盘格式化后电脑读不出来怎么办?u盘格式化的东西还能恢复吗

随着科技的快速发展&#xff0c;U盘已成为我们日常生活和工作中不可或缺的数据存储工具。然而&#xff0c;有时我们可能会遇到U盘格式化后电脑无法读取的情况&#xff0c;或是误格式化导致重要数据丢失。面对这些问题&#xff0c;我们该如何应对&#xff1f;本文将为您详细解答…

python邮件发送

第一种方式 一&#xff1a;发送的邮件要设置授权码&#xff0c;通过邮箱邮箱授权码去验证&#xff0c;让邮件服务器帮我们去转发邮件到要接收的邮件&#xff0c;代码中的授权码&#xff0c;是需要登录126邮箱&#xff08;我这里是以126邮件发送的&#xff0c;具体的以自己为准…

概念解析 | 互补学习系统

注1:本文系"概念解析"系列之一,致力于简洁清晰地解释、辨析复杂而专业的概念。本次辨析的概念是:互补学习系统(Complementary Learning Systems) 概念解析:互补学习系统 Paper Summary - “Complementary Learning Systems Theory Updated” | Rylan Schaeffer…

数据库MySQL的基本操作

在Linux里面&#xff0c;我们要对数据库MySQL进行操作时&#xff08;例如修改MySQL的密码&#xff09;&#xff0c;不是直接在我们的终端上进行操作&#xff0c;而是通过终端连接进入到MySQL里面去&#xff0c;在进行操作&#xff0c;写SQL语句。 而安装C等的开发库sudo命令&a…

Crocoddyl 使用教程(二)

系列文章目录 前言 小车摆杆是另一个经典的控制实例。在这个系统中&#xff0c;一根欠驱动的杆子被固定在一辆一维驱动的小车顶部。游戏的目的是将杆子升到站立位置。 模型如下&#xff1a; https://en.wikipedia.org/wiki/Inverted_pendulum 我们用 表示小车质量、 表示摆杆质…

Visual studio调试技巧

Visual studio调试技巧 bug是什么&#xff1f;Debug和ReleaseDebugRelease 如何调试VS调试快捷键调试过程中查看程序信息查看临时变量的值查看内存信息查看调用堆栈查看汇编信息查看寄存器信息 编译常见错误编译型错误链接型错误运行时错误 bug是什么&#xff1f; bug的英文释…