Agent杂货铺

news2025/5/15 8:19:02

零散记录一些Agent相关的内容。不成体系,看情况是否整理

ReAct

ReAct 是一种实践代理模型的高级框架,通过将大语言模型(LLMs)的推理和执行行动的能力结合起来,增强了它们在处理复杂任务时的决策能力、适应性和与外部环境的交互。ReAct包括许多关键组件,如 LLMs、用于外部交互的工具(Tools)、多种代理类型(Agent Types)、思维链(Chain-of-Thought,CoT)Prompting和 ReAct Prompting。

CoT和ReAct Prompting示例

一、思维链(Chain-of-Thought,CoT)

▋ 核心原理
通过显式要求AI展示推理过程,模仿人类逐步解决问题的思考路径。与直接输出答案不同,AI会先分解问题、执行中间推理,最后得出最终结论。

▋ 核心价值

  • 提升复杂问题(数学/逻辑/多步推理)的解决能力
  • 错误更容易溯源
  • 输出过程可解释性增强

▋ 实现方式

[System]
当解决数学问题时,请按以下步骤执行:
1. 逐句解读题目条件
2. 列出已知变量与未知量
3. 选择适用的公式
4. 分步计算并验证每步合理性
5. 最后用方框标出最终答案

[User]
某商品原价200元,先涨价20%再降价25%,现价多少?

▋ 典型输出

1. 初始价格:200元
2. 第一次涨价:200 × (1+20%) = 240元
3. 第二次降价:240 × (1-25%) = 240 × 0.75 = 180元
4. 验证:20%涨幅与25%降幅并非抵消,实际变化率是(1.2×0.75)=0.9
→ 最终价格:[[180元]]

▋ 适用场景

  • 数学应用题(如折扣计算、追及问题)
  • 逻辑谜题(如谁在说谎类问题)
  • 因果推理(如故障排查)

二、ReAct Prompting

▋ 核心原理
整合推理(Reason)与行动(Act)的交互模式,允许AI在需要时调用外部工具/知识库,形成"思考-行动-观察"循环。

▋ 核心组件

  • Reason:分析当前状况,确定需要采取的行动
  • Act:执行具体操作(如调用API/查询知识库)
  • Observe:获取行动结果,继续推进思考

▋ 实现案例(天气信息查询)

[System]
你拥有查询实时天气的API权限(act.get_weather),请按以下流程处理问题:
1. 解析用户问题中的关键信息(地点/时间/天气要素)
2. 判断是否需要调用API
3. 若需调用,用JSON格式请求:act.get_weather({"city":"北京"})
4. 根据API返回数据生成自然语言回答

[User]
北京明天适合穿什么衣服?

▋ 典型交互过程

Thought:用户询问穿衣建议,需先获取北京明日天气预报
Action:act.get_weather({"city":"北京","date":"2023-08-20"})
Observation:{"temp_min":18℃, "temp_max":26℃, "weather":"小雨"}

Thought:明日气温在18-26℃间有小雨,建议:
1. 外层防水外套
2. 内搭长袖衬衫
3. 携带折叠伞

▋ 技术优势对比

维度CoTReAct
核心能力线性推理动态交互
外部交互可调用工具/API
适用场景封闭问题开放域动态问题
错误处理依赖预设逻辑可实时修正

三、组合应用案例(客服场景)

[System]
处理客户投诉时按ReAct框架执行:
1. Reason:识别问题类型(物流/质量/服务)
2. Act:调用CRM系统查询订单(act.query_order)
3. Reason:根据数据判断责任方
4. Act:生成解决方案模板
5. 最终回复需包含:致歉+处理方案+预防措施

执行过程:

用户:订单#1123还没收到,已经超时3天!

Reason:物流延迟类投诉,需确认物流信息
Action:act.query_order(1123)
Observation:物流状态"运输中",最后节点"杭州分拣中心"

Reason:因极端天气导致延误,需提供补偿方案
→ 方案:1. 优先派送 2. 赠送20元优惠券
→ 预防:开通极端天气物流预警通道

四、最佳实践指南

CoT优化技巧:

  • 让我们逐步思考...开头引导推理
  • 要求用特定符号(如→、◆)标注关键步骤
  • 添加验证环节(“请检查第三步计算是否合理”)

ReAct设计要点:

  • 明确定义可用的 Action 清单
  • 设置行动次数限制(防止死循环)
  • 设计异常处理机制(如API超时响应)

混合使用场景:

  1. 先用 CoT 拆解复杂问题
  2. 对需要外部数据的子任务启用 ReAct
  3. 最后用 CoT 整合所有信息得出结论

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2373891.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Redis】Redis的主从复制

文章目录 1. 单点问题2. 主从模式2.1 建立复制2.2 断开复制 3. 拓扑结构3.1 三种结构3.2 数据同步3.3 复制流程3.3.1 psync运行流程3.3.2 全量复制3.3.3 部分复制3.3.4 实时复制 1. 单点问题 单点问题:某个服务器程序,只有一个节点(只搞一个…

第04章—技术突击篇:如何根据求职意向进行快速提升与复盘

经过上一讲的内容阐述后,咱们定好了一个与自身最匹配的期望薪资,接着又该如何准备呢? 很多人在准备时,通常会选择背面试八股文,这种做法效率的确很高,毕竟能在“八股文”上出现的题,也绝对是面…

Quantum convolutional nerual network

一些问答 1.Convolution: Translationally Invariant Quasilocal Unitaries 理解? Convolution(卷积): 在量子信息或量子多体系统中,"卷积"通常指一种分层、局部操作的结构,类似于经典卷积神经网…

RL之ppo训练

又是一篇之前沉在草稿箱的文章,放出来^V^ PPO原理部分这两篇就够了: 图解大模型RLHF系列之:人人都能看懂的PPO原理与源码解读人人都能看懂的RL-PPO理论知识 那些你或多或少听过的名词 actor-critic: actor表示策略,critic表示价值…

Docker封装深度学习模型

1.安装Docker Desktop 从官网下载DockerDesktop,安装。(默认安装位置在C盘,可进行修改) "D:\Program Files (x86)\Docker\Docker Desktop Installer.exe" install --installation-dir"D:\Program Files (x86)\Do…

11、参数化三维产品设计组件 - /设计与仿真组件/parametric-3d-product-design

76个工业组件库示例汇总 参数化三维产品设计组件 (注塑模具与公差分析) 概述 这是一个交互式的 Web 组件,旨在演示简单的三维零件(如带凸台的方块)的参数化设计过程,并结合注塑模具设计(如开模动画)与公…

OpenAI 30 亿收购 Windsurf:AI 编程助手风口已至

导语: 各位开发者同仁、产品经理伙伴们,从2024年起,一场由AI驱动的研发范式革命已然来临。Cursor等AI代码编辑器凭借与大语言模型的深度集成,正以前所未有的态势挑战,甚至颠覆着IntelliJ、VS Code等传统IDE的固有疆域。根据OpenRouter的API使用数据,Anthropic的Claude 3.…

【linux】倒计时小程序、进度条小程序及其puls版本

小编个人主页详情<—请点击 小编个人gitee代码仓库<—请点击 linux系列专栏<—请点击 倘若命中无此运&#xff0c;孤身亦可登昆仑&#xff0c;送给屏幕面前的读者朋友们和小编自己! 目录 前言一、知识铺垫1. 回车换行2. 缓冲区 二、倒计时小程序1. 实现 三、进度条小…

物流无人机结构与载货设计分析!

一、物流无人机的结构与载货设计模块运行方式 1.结构设计特点 垂直起降与固定翼结合&#xff1a;针对复杂地形&#xff08;如山区、城市&#xff09;需求&#xff0c;采用垂直起降&#xff08;VTOL&#xff09;与固定翼结合的复合布局&#xff0c;例如“天马”H型无人机&am…

【MySQL】表空间结构 - 从何为表空间到段页详解

&#x1f4e2;博客主页&#xff1a;https://blog.csdn.net/2301_779549673 &#x1f4e2;博客仓库&#xff1a;https://gitee.com/JohnKingW/linux_test/tree/master/lesson &#x1f4e2;欢迎点赞 &#x1f44d; 收藏 ⭐留言 &#x1f4dd; 如有错误敬请指正&#xff01; &…

[特殊字符] 免税商品优选购物商城系统 | Java + SpringBoot + Vue | 前后端分离实战项目分享

一、项目简介 本项目为一款功能完备的 免税商品优选购物商城系统&#xff0c;采用 Java 后端 Vue 前端的主流前后端分离架构&#xff0c;支持用户、商家、管理员三类角色&#xff0c;满足商品浏览、下单、商家管理、后台运营等多项功能&#xff0c;适用于实际部署或作为毕业设…

图像处理基础与图像变换

一、目的 通过本次实验&#xff0c;加深对数字图像的理解&#xff0c;熟悉MATLAB中的有关函数&#xff1b;应用DCT对图像进行变换&#xff1b;熟悉图像常见的统计指标&#xff0c;实现图像几何变换的基本方法。 二、内容与设计思想 1、实验内容&#xff1a;选择两幅图像&…

并发笔记-锁(一)

文章目录 1. 基本问题与锁的概念 (The Basic Idea)2. 锁的API与Pthreads (Lock API and Pthreads)3. 构建锁的挑战与评估标准 (Building A Lock & Evaluating Locks)4. 早期/简单的锁实现尝试及其问题 (Early/Simple Attempts)4.1 控制中断 (Controlling Interrupts)4.2 仅…

【Bootstrap V4系列】学习入门教程之 组件-媒体对象(Media object)

Bootstrap V4系列 学习入门教程之 组件-媒体对象&#xff08;Media object&#xff09; 媒体对象&#xff08;Media object&#xff09;一、Example二、Nesting 嵌套三、Alignment 对齐四、Order 顺序五、Media list 媒体列表 媒体对象&#xff08;Media object&#xff09; B…

2025数字中国创新大赛-数字安全赛道数据安全产业积分争夺赛决赛Writeup

文章目录 综合场景赛-模型环境安全-3综合场景赛-数据识别与审计-1综合场景赛-数据识别与审计-2综合场景赛-数据识别与审计-3 有需要题目附件的师傅&#xff0c;可以联系我发送 综合场景赛-模型环境安全-3 upload文件嵌套了多个png图片字节数据&#xff0c;使用foremost直接分离…

无法更新Google Chrome的解决问题

解决问题&#xff1a;原文链接&#xff1a;【百分百成功】Window 10 Google Chrome无法启动更新检查&#xff08;错误代码为1&#xff1a;0x80004005&#xff09; google谷歌chrome浏览器无法更新Chrome无法更新至最新版本&#xff1f; 下载了 就是更新Google Chrome了

数字孪生市场格局生变:中国2025年规模214亿,工业制造领域占比超40%

一、技术深度解析&#xff1a;数字孪生的核心技术栈与演进 1. 从镜像到自治&#xff1a;数字孪生技术架构跃迁 三维重建突破&#xff1a;LiDAR点云精度达2cm&#xff0c;无人机测深刷新频率5Hz&#xff0c;支撑杭州城市大脑内涝预警模型提前6小时预测。AI算法融合&#xff1a…

全球首款无限时长电影生成模型SkyReels-V2本地部署教程:视频时长无限制!

一、简介 SkyReels-V2 模型集成了多模态大语言模型&#xff08;MLLM&#xff09;、多阶段预训练、强化学习以及创新的扩散强迫&#xff08;Diffusion-forcing&#xff09;框架&#xff0c;实现了在提示词遵循、视觉质量、运动动态以及视频时长等方面的全面突破。通过扩散强迫框…

颠覆性技术革命:CAD DWG图形瓦片化实战指南

摘要 CAD DWG图形瓦片化技术通过金字塔模型构建多分辨率地图体系&#xff0c;实现海量工程图纸的Web高效可视化。本文系统解析栅格瓦片与矢量瓦片的技术原理&#xff0c;详细对比两者在生成效率、样式自由度和客户端性能等维度的差异&#xff0c;并结合工程建设、工业设计和智…

不换设备秒通信,PROFINET转Ethercat网关混合生产线集成配置详解

在汽车制造中&#xff0c;连接Profinet控制的PLC&#xff08;如西门子S7&#xff09;与EtherCAT伺服驱动器&#xff08;如倍福AX5000&#xff09;&#xff0c;实现运动控制同步。 在汽车制造的混合生产线集成中&#xff0c;实现西门子S7 PLC与倍福AX5000 EtherCAT伺服驱动器的…