吴恩达Agentic AI教程·模块5:高度自主智能体的模式 知识点总结

news2026/3/30 1:24:03
吴恩达Agentic AI教程·模块5高度自主智能体的模式 知识点总结一、规划设计模式高度自主智能体的核心模式1.1 规划设计模式的核心定义与价值1.1.1 核心定义1.1.2 核心价值1.2 规划设计模式的基础流程与示例1.2.1 基础流程1.2.2 示例1太阳镜零售店客服智能体1.2.2.1 用户需求1查询是否有100美元以下的圆形太阳镜1.2.2.2 用户请求2我想退还我买过的金色镜框眼镜但不退金属镜框的1.2.3 示例2邮件助手智能体1.2.4 补充说明1.3 规划的格式优化提升执行可靠性1.3.1 优化核心目的1.3.2 常用规划格式及对比1.3.3 格式优化的实操方法1.4 基于代码执行的规划高级规划方式1.4.1 核心理念1.4.2 应用背景解决传统工具调用的弊端1.4.3 示例咖啡销售数据查询智能体1.4.4 代码执行的优势基于研究数据1.5 规划设计模式的应用现状与挑战1.5.1 应用现状1.5.2 核心挑战二、多智能体系统协作型智能体架构2.1 多智能体系统的核心定义与构建意义2.1.1 核心定义2.1.2 构建意义类比说明2.1.3 核心优势2.2 多智能体系统的构建示例营销资产创建2.2.1 任务目标2.2.2 智能体角色分工与工具配置2.2.3 智能体构建方法2.2.4 协作流程线性流程2.3 多智能体的协作模式任务规划与协调2.3.1 模式1线性协作模式Linear Workflow2.3.2 模式2分层/管理协调模式Hierarchical/Manager Workflow2.4 多智能体系统的常见通信模式2.4.1 核心说明2.4.2 模式1线性通信模式最常用2.4.3 模式2分层/管理通信模式最常用2.4.4 模式3深层分层通信模式Deep Hierarchy小众应用2.4.5 模式4全互联通信模式All-to-All Communication实验性2.5 多智能体系统的补充说明三、课程总结与后续预告3.1 核心知识点总结3.2 模块1-模块5总结3.3 后续预告一、规划设计模式高度自主智能体的核心模式1.1 规划设计模式的核心定义与价值1.1.1 核心定义规划设计模式Planning Design Pattern是构建高度自主智能体的关键模式无需提前硬编码任务步骤智能体可自主灵活地决定完成任务所需的步骤序列核心是让大模型LLM生成步骤计划并逐步执行该计划。1.1.2 核心价值无需开发者提前预设工具调用顺序智能体可应对多种复杂任务适配不同用户需求能调用多种工具、按不同顺序完成任务大幅拓展智能体的任务处理范围。1.2 规划设计模式的基础流程与示例1.2.1 基础流程给LLM配置所需工具集明确工具功能与用途通过提示词引导LLM生成完成用户请求的分步计划将计划的每一步作为新的提示词结合上下文如上一步的输出、原始用户请求、工具描述将每一步依次输入LLM执行该步骤调用对应工具将上一步的执行结果反馈给LLM继续执行下一步直至完成所有步骤将所有步骤的执行结果汇总生成最终答案。1.2.2 示例1太阳镜零售店客服智能体1.2.2.1 用户需求1查询是否有100美元以下的圆形太阳镜配置工具集获取商品描述get_item_descriptions检查库存check_inventory获取商品价格get_item_price处理退货process_item_return检查交易记录check_past_transactions处理商品销售process_item_sale系统提示词你有xxx工具上述工具描述请返回一个分布执行方案来完成用户请求LLM生成计划① 使用“获取商品描述”get_item_descriptions工具筛选圆形太阳镜② 使用“检查库存”check_inventory工具确认筛选出的商品是否有货③ 使用“获取商品价格”get_item_price工具确认有货商品是否低于100美元执行过程依次执行三步计划每一步的输出作为下一步的输入最终生成用户所需的答复。1.2.2.2 用户请求2我想退还我买过的金色镜框眼镜但不退金属镜框的与上面过程类似1.2.3 示例2邮件助手智能体用户需求回复Bob关于纽约晚餐的邀请邮件确认出席并归档该邮件配置工具搜索邮件search_email移动邮件move_email删除邮件delete_email发送邮件send_email系统提示词你有xxx工具上述工具描述请返回一个分布执行方案来完成用户请求LLM生成计划① 使用“搜索邮件”search_email工具找到Bob关于纽约晚餐邀请的邮件② 生成并发送send_email确认出席的邮件回复③ 将该邮件移动move_email到归档文件夹执行过程分步执行计划依次完成邮件搜索、回复发送、归档操作。1.2.4 补充说明原文中提到实际应用中LLM生成的计划会比示例中的简单描述更详细流程核心是“生成计划→分步执行→反馈迭代”确保任务有序完成。1.3 规划的格式优化提升执行可靠性1.3.1 优化核心目的挑战纯文本计划难以被下游代码可靠解析。目的让LLM生成的计划更清晰、无歧义便于下游代码解析和系统可靠执行避免因计划模糊导致执行出错。1.3.2 常用规划格式及对比JSON格式推荐通过明确的键值对定义步骤编号、任务描述、工具选择、工具参数结构清晰易解析是开发者最常用的格式XML格式推荐通过XML标签明确指定步骤细节与JSON功能类似同样具备清晰、无歧义的优势Markdown格式使用频率较低存在一定歧义解析难度高于JSON和XML纯文本格式最不可靠歧义性强难以被下游代码解析不推荐使用。1.3.3 格式优化的实操方法在系统提示词中明确要求LLM生成指定格式如JSON的计划并详细描述格式规范如步骤的键名、参数要求确保LLM输出符合预期。示例结构包含 步骤顺序step, 步骤描述description, 使用的工具tool,解析的参数arguments等键值对的列表。1.4 基于代码执行的规划高级规划方式1.4.1 核心理念基于代码执行的规划Planning with Code Execution不要求LLM生成JSON等格式的步骤计划而是让LLM直接编写可执行代码通过代码来表达复杂的任务步骤如调用函数、处理数据执行代码即可完成整个任务适用于可通过代码实现的场景。1.4.2 应用背景解决传统工具调用的弊端传统方式中为应对不同数据查询类需求需不断创建新工具导致工具集无限膨胀、系统脆弱、效率低下而代码执行规划可利用编程语言如Python及其库如Pandas的内置函数覆盖各类复杂需求无需频繁新增工具。反例当用户查询哪个月的热巧克力销售额最高时LLM处理咖啡销售数据时需分别创建并调用 筛选行、计算最大值、统计唯一值等工具。当再询问其他问题时还需要开发其他更多工具来支持。1.4.3 示例咖啡销售数据查询智能体用户需求查询上周有多少笔唯一交易规划与代码执行通过提示词引导LLM编写Python代码并用标签 execute_python和 /execute_python来包裹生成的代码利用Pandas库加载销售数据表格CSV编写包含清晰的步骤注释的代码即隐含的计划如按特定方式解析日期、定义时间窗口、过滤行、去重、计数系统在安全沙箱中执行代码并返回结果需为代码执行提供安全的运行环境如沙箱Docker容器避免恶意代码带来的风险优势不同的代码包含很多内置库或函数LLM可以从这么多函数中进行选择从而将不同函数串起来。代码可整合多步操作覆盖复杂查询需求无需新增工具灵活性极高。1.4.4 代码执行的优势基于研究数据表达力强代码能精确描述复杂的控制流循环、条件判断和数据操作。研究支持根据Wang等人的研究表明在许多任务上“代码即行动”Code as Action的表现优于 JSON 或纯文本规划。规划方式的效果优先级为代码执行规划 JSON格式规划 纯文本规划代码执行规划在复杂任务中表现最优。1.5 规划设计模式的应用现状与挑战1.5.1 应用现状成熟场景在高度自主的AI编码辅助工具中应用广泛LLM可生成详细的软件开发计划如拆分组件、依次开发、测试并逐步执行效果良好发展中场景在其他领域如客服、邮件处理的应用仍在成长尚未完全成熟。1.5.2 核心挑战可控性降低开发者无法预知运行时智能体会生成何种计划导致系统难以控制增加了调试和保证行为一致性的难度但放弃部分控制能大幅提升智能体的任务处理范围和灵活性。成熟度除编码领域外规划在其他领域的应用仍处于发展和实验阶段。二、多智能体系统协作型智能体架构2.1 多智能体系统的核心定义与构建意义2.1.1 核心定义多智能体系统Multi-Agent Systems是由多个智能体协作组成的系统并非单一智能体完成所有任务而是将复杂任务分解为多个子任务由不同角色和能力的智能体分工完成最终协同达成整体目标。2.1.2 构建意义类比说明类比计算机即使是单CPU计算机也会将任务分解为多个进程/线程执行便于开发和高效运行类比人类团队复杂任务通常需要多个不同角色的人分工协作如营销任务需要研究员、设计师、作家准备一个法律案件需要助理律师、调查员等多智能体系统模拟这一模式降低复杂任务的开发难度提升效率。2.1.3 核心优势可将复杂任务拆解为子任务开发者可专注于单个角色智能体的构建提升单个智能体的性能同时部分智能体可重复利用如通用图形设计智能体可用于营销手册、社交媒体帖子等场景。2.2 多智能体系统的构建示例营销资产创建2.2.1 任务目标为太阳镜产品创建营销手册需完成市场调研、视觉设计、文案撰写等子任务。2.2.2 智能体角色分工与工具配置研究员智能体图形设计师智能体文案智能体任务负责分析太阳镜市场趋势、调研竞争对手负责创建数据可视化图表、太阳镜相关视觉素材负责整合调研结果和视觉素材撰写营销手册文案所需工具网络搜索图像生成/编辑工具、代码执行用于生成图表无需额外工具仅依靠LLM的文本生成能力提示词你是专注于市场趋势分析的研究员智能体使用网络搜索工具进行线上调研分析太阳镜市场趋势及竞争对手动态生成详细调研报告……2.2.3 智能体构建方法通过提示词引导LLM扮演对应角色明确每个智能体的任务、技能和工具。工具集成根据角色需求为每个智能体配备相应的工具集如研究员配网络搜索设计师配图像生成。2.2.4 协作流程线性流程研究员智能体执行调研生成市场趋势与竞争对手分析报告将调研报告反馈给图形设计师智能体设计师基于报告生成图表、创建视觉素材将调研报告和视觉素材反馈给文案智能体撰写最终营销手册。2.3 多智能体的协作模式任务规划与协调2.3.1 模式1线性协作模式Linear Workflow核心逻辑多个智能体按固定顺序依次执行任务上一个智能体的输出作为下一个智能体的输入。适用场景适用于任务步骤明确、无交叉依赖的场景如上述营销资产创建的线性流程。优势流程简单、可控设计简单易于理解和实现便于分工和复用各个智能体可以同时分别优化。2.3.2 模式2分层/管理协调模式Hierarchical/Manager Workflow核心逻辑设置一个“管理者智能体”由其负责接收用户需求、生成任务计划、分配子任务给其他智能体并协调各智能体的工作进度接收各智能体的反馈最终整合结果示例营销任务中设置“营销经理智能体”系统提示词设置营销经理智能体接收用户请求生成一个调用其他智能体的计划分配调研任务给研究员、设计任务给设计师、撰写任务给文案各子智能体将结果返回营销经理智能体接收各智能体的成果必要时进行反思优化最终整合输出营销手册优势分工更清晰便于管理和调整适用于子任务较多、需要统筹协调的场景。2.4 多智能体系统的常见通信模式2.4.1 核心说明通信模式决定了多智能体之间的交互方式是构建多智能体系统的关键设计决策目前有多种模式其中线性和层级模式最常用其他模式仍处于实验或小众应用阶段。2.4.2 模式1线性通信模式最常用智能体按固定顺序依次通信仅相邻智能体之间传递信息如研究员→设计师→作家流程简单、可预测适用于简单的协作任务。2.4.3 模式2分层/管理通信模式最常用由一个顶层管理者智能体如营销经理统一与各执行智能体研究员、设计师、文案通信执行智能体不直接相互通信所有任务分配、成果反馈均通过管理者进行便于统筹控制适用于复杂任务。2.4.4 模式3深层分层通信模式Deep Hierarchy小众应用在分层/管理模式基础上部分执行智能体可进一步调用子智能体形成多层级结构如研究员智能体调用“网络研究员”和“事实核查员”两个子智能体结构更复杂适用于超复杂、多细分任务的场景目前使用较少。2.4.5 模式4全互联通信模式All-to-All Communication实验性核心逻辑所有智能体均可随时与其他任意智能体通信无需通过管理者智能体自主决定何时发送/接收信息直至所有智能体完成自身任务生成最终结果特点灵活性极高但难以预测执行结果可控性差适用于对结果精度要求不高、可接受一定随机性的场景如简单营销文案生成实操方法通过提示词告知所有智能体可相互通信将一个智能体的消息添加到接收智能体的上下文接收智能体自主决定反馈时机。2.5 多智能体系统的补充说明目前已有多种软件框架支持多智能体系统的构建可简化通信模式的实现降低开发难度多智能体系统的核心是“任务分解角色分工协作通信”本质是模拟人类团队的工作模式提升复杂任务的处理效率和质量。三、课程总结与后续预告3.1 核心知识点总结规划设计模式核心是让智能体自主生成任务步骤计划并分步执行可通过JSON/XML格式优化计划可靠性通过代码执行提升复杂任务处理能力在编码领域应用成熟存在控制难度大的挑战多智能体系统将复杂任务拆解为子任务由不同角色智能体分工协作核心是通信模式的设计线性和层级模式最常用深层层级和全对全模式适用于特定场景核心逻辑高度自主智能体的核心是“自主规划”和“协作分工”无需硬编码步骤提升任务处理的灵活性和范围。3.2 模块1-模块5总结3.3 后续预告课程后续将深入讲解规划模式的具体实现细节如如何提示LLM生成规范计划、多智能体通信模式的实操方法以及更多复杂场景的应用案例。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2463319.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…

wordpress后台更新后 前端没变化的解决方法

使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…

网络编程(Modbus进阶)

思维导图 Modbus RTU(先学一点理论) 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议,由 Modicon 公司(现施耐德电气)于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…

UE5 学习系列(二)用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…

利用最小二乘法找圆心和半径

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明&#xff1a;假设每台服务器已…

XML Group端口详解

在XML数据映射过程中&#xff0c;经常需要对数据进行分组聚合操作。例如&#xff0c;当处理包含多个物料明细的XML文件时&#xff0c;可能需要将相同物料号的明细归为一组&#xff0c;或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码&#xff0c;增加了开…

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造&#xff0c;完美适配AGV和无人叉车。同时&#xff0c;集成以太网与语音合成技术&#xff0c;为各类高级系统&#xff08;如MES、调度系统、库位管理、立库等&#xff09;提供高效便捷的语音交互体验。 L…

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)

题目&#xff1a;3442. 奇偶频次间的最大差值 I 思路 &#xff1a;哈希&#xff0c;时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况&#xff0c;哈希表这里用数组即可实现。 C版本&#xff1a; class Solution { public:int maxDifference(string s) {int a[26]…

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…

【Axure高保真原型】引导弹窗

今天和大家中分享引导弹窗的原型模板&#xff0c;载入页面后&#xff0c;会显示引导弹窗&#xff0c;适用于引导用户使用页面&#xff0c;点击完成后&#xff0c;会显示下一个引导弹窗&#xff0c;直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…

接口测试中缓存处理策略

在接口测试中&#xff0c;缓存处理策略是一个关键环节&#xff0c;直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性&#xff0c;避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明&#xff1a; 一、缓存处理的核…

龙虎榜——20250610

上证指数放量收阴线&#xff0c;个股多数下跌&#xff0c;盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型&#xff0c;指数短线有调整的需求&#xff0c;大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的&#xff1a;御银股份、雄帝科技 驱动…

观成科技:隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具&#xff0c;该工具基于TUN接口实现其功能&#xff0c;利用反向TCP/TLS连接建立一条隐蔽的通信信道&#xff0c;支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式&#xff0c;适应复杂网…

铭豹扩展坞 USB转网口 突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…

未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?

编辑&#xff1a;陈萍萍的公主一点人工一点智能 未来机器人的大脑&#xff1a;如何用神经网络模拟器实现更智能的决策&#xff1f;RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战&#xff0c;在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…

Linux应用开发之网络套接字编程(实例篇)

服务端与客户端单连接 服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …

华为云AI开发平台ModelArts

华为云ModelArts&#xff1a;重塑AI开发流程的“智能引擎”与“创新加速器”&#xff01; 在人工智能浪潮席卷全球的2025年&#xff0c;企业拥抱AI的意愿空前高涨&#xff0c;但技术门槛高、流程复杂、资源投入巨大的现实&#xff0c;却让许多创新构想止步于实验室。数据科学家…

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向&#xff1a; 逆向设计 通过神经网络快速预测微纳结构的光学响应&#xff0c;替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…