吴恩达Agentic AI教程·模块5:高度自主智能体的模式 知识点总结
吴恩达Agentic AI教程·模块5高度自主智能体的模式 知识点总结一、规划设计模式高度自主智能体的核心模式1.1 规划设计模式的核心定义与价值1.1.1 核心定义1.1.2 核心价值1.2 规划设计模式的基础流程与示例1.2.1 基础流程1.2.2 示例1太阳镜零售店客服智能体1.2.2.1 用户需求1查询是否有100美元以下的圆形太阳镜1.2.2.2 用户请求2我想退还我买过的金色镜框眼镜但不退金属镜框的1.2.3 示例2邮件助手智能体1.2.4 补充说明1.3 规划的格式优化提升执行可靠性1.3.1 优化核心目的1.3.2 常用规划格式及对比1.3.3 格式优化的实操方法1.4 基于代码执行的规划高级规划方式1.4.1 核心理念1.4.2 应用背景解决传统工具调用的弊端1.4.3 示例咖啡销售数据查询智能体1.4.4 代码执行的优势基于研究数据1.5 规划设计模式的应用现状与挑战1.5.1 应用现状1.5.2 核心挑战二、多智能体系统协作型智能体架构2.1 多智能体系统的核心定义与构建意义2.1.1 核心定义2.1.2 构建意义类比说明2.1.3 核心优势2.2 多智能体系统的构建示例营销资产创建2.2.1 任务目标2.2.2 智能体角色分工与工具配置2.2.3 智能体构建方法2.2.4 协作流程线性流程2.3 多智能体的协作模式任务规划与协调2.3.1 模式1线性协作模式Linear Workflow2.3.2 模式2分层/管理协调模式Hierarchical/Manager Workflow2.4 多智能体系统的常见通信模式2.4.1 核心说明2.4.2 模式1线性通信模式最常用2.4.3 模式2分层/管理通信模式最常用2.4.4 模式3深层分层通信模式Deep Hierarchy小众应用2.4.5 模式4全互联通信模式All-to-All Communication实验性2.5 多智能体系统的补充说明三、课程总结与后续预告3.1 核心知识点总结3.2 模块1-模块5总结3.3 后续预告一、规划设计模式高度自主智能体的核心模式1.1 规划设计模式的核心定义与价值1.1.1 核心定义规划设计模式Planning Design Pattern是构建高度自主智能体的关键模式无需提前硬编码任务步骤智能体可自主灵活地决定完成任务所需的步骤序列核心是让大模型LLM生成步骤计划并逐步执行该计划。1.1.2 核心价值无需开发者提前预设工具调用顺序智能体可应对多种复杂任务适配不同用户需求能调用多种工具、按不同顺序完成任务大幅拓展智能体的任务处理范围。1.2 规划设计模式的基础流程与示例1.2.1 基础流程给LLM配置所需工具集明确工具功能与用途通过提示词引导LLM生成完成用户请求的分步计划将计划的每一步作为新的提示词结合上下文如上一步的输出、原始用户请求、工具描述将每一步依次输入LLM执行该步骤调用对应工具将上一步的执行结果反馈给LLM继续执行下一步直至完成所有步骤将所有步骤的执行结果汇总生成最终答案。1.2.2 示例1太阳镜零售店客服智能体1.2.2.1 用户需求1查询是否有100美元以下的圆形太阳镜配置工具集获取商品描述get_item_descriptions检查库存check_inventory获取商品价格get_item_price处理退货process_item_return检查交易记录check_past_transactions处理商品销售process_item_sale系统提示词你有xxx工具上述工具描述请返回一个分布执行方案来完成用户请求LLM生成计划① 使用“获取商品描述”get_item_descriptions工具筛选圆形太阳镜② 使用“检查库存”check_inventory工具确认筛选出的商品是否有货③ 使用“获取商品价格”get_item_price工具确认有货商品是否低于100美元执行过程依次执行三步计划每一步的输出作为下一步的输入最终生成用户所需的答复。1.2.2.2 用户请求2我想退还我买过的金色镜框眼镜但不退金属镜框的与上面过程类似1.2.3 示例2邮件助手智能体用户需求回复Bob关于纽约晚餐的邀请邮件确认出席并归档该邮件配置工具搜索邮件search_email移动邮件move_email删除邮件delete_email发送邮件send_email系统提示词你有xxx工具上述工具描述请返回一个分布执行方案来完成用户请求LLM生成计划① 使用“搜索邮件”search_email工具找到Bob关于纽约晚餐邀请的邮件② 生成并发送send_email确认出席的邮件回复③ 将该邮件移动move_email到归档文件夹执行过程分步执行计划依次完成邮件搜索、回复发送、归档操作。1.2.4 补充说明原文中提到实际应用中LLM生成的计划会比示例中的简单描述更详细流程核心是“生成计划→分步执行→反馈迭代”确保任务有序完成。1.3 规划的格式优化提升执行可靠性1.3.1 优化核心目的挑战纯文本计划难以被下游代码可靠解析。目的让LLM生成的计划更清晰、无歧义便于下游代码解析和系统可靠执行避免因计划模糊导致执行出错。1.3.2 常用规划格式及对比JSON格式推荐通过明确的键值对定义步骤编号、任务描述、工具选择、工具参数结构清晰易解析是开发者最常用的格式XML格式推荐通过XML标签明确指定步骤细节与JSON功能类似同样具备清晰、无歧义的优势Markdown格式使用频率较低存在一定歧义解析难度高于JSON和XML纯文本格式最不可靠歧义性强难以被下游代码解析不推荐使用。1.3.3 格式优化的实操方法在系统提示词中明确要求LLM生成指定格式如JSON的计划并详细描述格式规范如步骤的键名、参数要求确保LLM输出符合预期。示例结构包含 步骤顺序step, 步骤描述description, 使用的工具tool,解析的参数arguments等键值对的列表。1.4 基于代码执行的规划高级规划方式1.4.1 核心理念基于代码执行的规划Planning with Code Execution不要求LLM生成JSON等格式的步骤计划而是让LLM直接编写可执行代码通过代码来表达复杂的任务步骤如调用函数、处理数据执行代码即可完成整个任务适用于可通过代码实现的场景。1.4.2 应用背景解决传统工具调用的弊端传统方式中为应对不同数据查询类需求需不断创建新工具导致工具集无限膨胀、系统脆弱、效率低下而代码执行规划可利用编程语言如Python及其库如Pandas的内置函数覆盖各类复杂需求无需频繁新增工具。反例当用户查询哪个月的热巧克力销售额最高时LLM处理咖啡销售数据时需分别创建并调用 筛选行、计算最大值、统计唯一值等工具。当再询问其他问题时还需要开发其他更多工具来支持。1.4.3 示例咖啡销售数据查询智能体用户需求查询上周有多少笔唯一交易规划与代码执行通过提示词引导LLM编写Python代码并用标签 execute_python和 /execute_python来包裹生成的代码利用Pandas库加载销售数据表格CSV编写包含清晰的步骤注释的代码即隐含的计划如按特定方式解析日期、定义时间窗口、过滤行、去重、计数系统在安全沙箱中执行代码并返回结果需为代码执行提供安全的运行环境如沙箱Docker容器避免恶意代码带来的风险优势不同的代码包含很多内置库或函数LLM可以从这么多函数中进行选择从而将不同函数串起来。代码可整合多步操作覆盖复杂查询需求无需新增工具灵活性极高。1.4.4 代码执行的优势基于研究数据表达力强代码能精确描述复杂的控制流循环、条件判断和数据操作。研究支持根据Wang等人的研究表明在许多任务上“代码即行动”Code as Action的表现优于 JSON 或纯文本规划。规划方式的效果优先级为代码执行规划 JSON格式规划 纯文本规划代码执行规划在复杂任务中表现最优。1.5 规划设计模式的应用现状与挑战1.5.1 应用现状成熟场景在高度自主的AI编码辅助工具中应用广泛LLM可生成详细的软件开发计划如拆分组件、依次开发、测试并逐步执行效果良好发展中场景在其他领域如客服、邮件处理的应用仍在成长尚未完全成熟。1.5.2 核心挑战可控性降低开发者无法预知运行时智能体会生成何种计划导致系统难以控制增加了调试和保证行为一致性的难度但放弃部分控制能大幅提升智能体的任务处理范围和灵活性。成熟度除编码领域外规划在其他领域的应用仍处于发展和实验阶段。二、多智能体系统协作型智能体架构2.1 多智能体系统的核心定义与构建意义2.1.1 核心定义多智能体系统Multi-Agent Systems是由多个智能体协作组成的系统并非单一智能体完成所有任务而是将复杂任务分解为多个子任务由不同角色和能力的智能体分工完成最终协同达成整体目标。2.1.2 构建意义类比说明类比计算机即使是单CPU计算机也会将任务分解为多个进程/线程执行便于开发和高效运行类比人类团队复杂任务通常需要多个不同角色的人分工协作如营销任务需要研究员、设计师、作家准备一个法律案件需要助理律师、调查员等多智能体系统模拟这一模式降低复杂任务的开发难度提升效率。2.1.3 核心优势可将复杂任务拆解为子任务开发者可专注于单个角色智能体的构建提升单个智能体的性能同时部分智能体可重复利用如通用图形设计智能体可用于营销手册、社交媒体帖子等场景。2.2 多智能体系统的构建示例营销资产创建2.2.1 任务目标为太阳镜产品创建营销手册需完成市场调研、视觉设计、文案撰写等子任务。2.2.2 智能体角色分工与工具配置研究员智能体图形设计师智能体文案智能体任务负责分析太阳镜市场趋势、调研竞争对手负责创建数据可视化图表、太阳镜相关视觉素材负责整合调研结果和视觉素材撰写营销手册文案所需工具网络搜索图像生成/编辑工具、代码执行用于生成图表无需额外工具仅依靠LLM的文本生成能力提示词你是专注于市场趋势分析的研究员智能体使用网络搜索工具进行线上调研分析太阳镜市场趋势及竞争对手动态生成详细调研报告……2.2.3 智能体构建方法通过提示词引导LLM扮演对应角色明确每个智能体的任务、技能和工具。工具集成根据角色需求为每个智能体配备相应的工具集如研究员配网络搜索设计师配图像生成。2.2.4 协作流程线性流程研究员智能体执行调研生成市场趋势与竞争对手分析报告将调研报告反馈给图形设计师智能体设计师基于报告生成图表、创建视觉素材将调研报告和视觉素材反馈给文案智能体撰写最终营销手册。2.3 多智能体的协作模式任务规划与协调2.3.1 模式1线性协作模式Linear Workflow核心逻辑多个智能体按固定顺序依次执行任务上一个智能体的输出作为下一个智能体的输入。适用场景适用于任务步骤明确、无交叉依赖的场景如上述营销资产创建的线性流程。优势流程简单、可控设计简单易于理解和实现便于分工和复用各个智能体可以同时分别优化。2.3.2 模式2分层/管理协调模式Hierarchical/Manager Workflow核心逻辑设置一个“管理者智能体”由其负责接收用户需求、生成任务计划、分配子任务给其他智能体并协调各智能体的工作进度接收各智能体的反馈最终整合结果示例营销任务中设置“营销经理智能体”系统提示词设置营销经理智能体接收用户请求生成一个调用其他智能体的计划分配调研任务给研究员、设计任务给设计师、撰写任务给文案各子智能体将结果返回营销经理智能体接收各智能体的成果必要时进行反思优化最终整合输出营销手册优势分工更清晰便于管理和调整适用于子任务较多、需要统筹协调的场景。2.4 多智能体系统的常见通信模式2.4.1 核心说明通信模式决定了多智能体之间的交互方式是构建多智能体系统的关键设计决策目前有多种模式其中线性和层级模式最常用其他模式仍处于实验或小众应用阶段。2.4.2 模式1线性通信模式最常用智能体按固定顺序依次通信仅相邻智能体之间传递信息如研究员→设计师→作家流程简单、可预测适用于简单的协作任务。2.4.3 模式2分层/管理通信模式最常用由一个顶层管理者智能体如营销经理统一与各执行智能体研究员、设计师、文案通信执行智能体不直接相互通信所有任务分配、成果反馈均通过管理者进行便于统筹控制适用于复杂任务。2.4.4 模式3深层分层通信模式Deep Hierarchy小众应用在分层/管理模式基础上部分执行智能体可进一步调用子智能体形成多层级结构如研究员智能体调用“网络研究员”和“事实核查员”两个子智能体结构更复杂适用于超复杂、多细分任务的场景目前使用较少。2.4.5 模式4全互联通信模式All-to-All Communication实验性核心逻辑所有智能体均可随时与其他任意智能体通信无需通过管理者智能体自主决定何时发送/接收信息直至所有智能体完成自身任务生成最终结果特点灵活性极高但难以预测执行结果可控性差适用于对结果精度要求不高、可接受一定随机性的场景如简单营销文案生成实操方法通过提示词告知所有智能体可相互通信将一个智能体的消息添加到接收智能体的上下文接收智能体自主决定反馈时机。2.5 多智能体系统的补充说明目前已有多种软件框架支持多智能体系统的构建可简化通信模式的实现降低开发难度多智能体系统的核心是“任务分解角色分工协作通信”本质是模拟人类团队的工作模式提升复杂任务的处理效率和质量。三、课程总结与后续预告3.1 核心知识点总结规划设计模式核心是让智能体自主生成任务步骤计划并分步执行可通过JSON/XML格式优化计划可靠性通过代码执行提升复杂任务处理能力在编码领域应用成熟存在控制难度大的挑战多智能体系统将复杂任务拆解为子任务由不同角色智能体分工协作核心是通信模式的设计线性和层级模式最常用深层层级和全对全模式适用于特定场景核心逻辑高度自主智能体的核心是“自主规划”和“协作分工”无需硬编码步骤提升任务处理的灵活性和范围。3.2 模块1-模块5总结3.3 后续预告课程后续将深入讲解规划模式的具体实现细节如如何提示LLM生成规范计划、多智能体通信模式的实操方法以及更多复杂场景的应用案例。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2463319.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!