【AI Agent 学习笔记 task1】Day2：初识智能体

news2026/3/18 20:10:06

【AI Agent 学习笔记 task1】Day2初识智能体上一篇【AI Agent 学习笔记】Hello-Agents 环境配置与首个 Agent 实战一、Agent 的本质Agent智能体大模型大脑工具手脚控制循环决策与普通 LLM 调用的区别特性普通 LLMAgent执行方式单次问答多轮循环工具使用无可调用外部 API决策能力无自主规划执行步骤结果反馈直接生成基于观察调整策略二、ReAct 模式Thought-Action-Observation本章核心ReActReasoning Acting是 Agent 的主流实现范式。2.1 三要素结构Thought思考→ Action行动→ Observation观察→ ... → Finish完成以我的运行日志为例循环ThoughtActionObservation1用户要查天气推荐景点先获取天气get_weather(city北京)小雨阵雨10°C2模型输出为空——❌ 解析失败未找到 Action3已获取天气根据雨天推荐景点get_attraction(city北京, weatherLight rain shower)博物馆、海洋馆等室内景点4整合信息生成回答Finish[...]任务完成2.2 关键观察错误循环的价值第 2 轮模型输出为空导致解析失败但 Agent自动重试进入第 3 轮。这说明Agent 具备容错能力控制循环会强制要求模型遵循格式规范失败后会重新调用 LLM而非直接报错退出三、工具Tool的作用本章代码中 Agent 使用了两个工具# 工具定义示例get_weather(city:str)-str# 获取指定城市天气get_attraction(city:str,weather:str)-str# 根据天气推荐景点核心设计LLM 只负责决定调用什么工具、传什么参数实际执行由框架完成。这种分离让 Agent 既能利用大模型的推理能力又能获得精确的外部数据。四、Prompt 工程控制模型行为Agent 能遵循 Thought-Action 格式核心在于System Prompt 的设计你必须按以下格式回复 Thought: 你的思考过程 Action: 工具名(参数值) 或者任务完成时 Action: Finish[最终答案]Prompt 技巧少样本示例Few-shot给 1-2 个正确格式的例子严格格式约束明确分隔符、字段名错误处理提示告知模型输出错误会怎样五、关键代码逻辑max_loops5# 防止无限循环foriinrange(max_loops):# 1. 组装 Prompt历史记录工具描述用户输入promptbuild_prompt(history,tools,user_input)# 2. 调用 LLMresponsellm.chat(prompt)# 3. 解析 Thought 和 Actionthought,actionparse_response(response)# 4. 执行工具ifactionFinish:returnresult# 任务完成else:observationexecute_tool(action)history.append(fObservation:{observation})# 反馈给下一轮六、学习总结Agent 核心认知不是更复杂的 Prompt而是推理-行动的闭环LLM 当决策者工具当执行者观察结果反馈给 LLM实现动态调整与上一篇的衔接Day1环境配置跑通代码Day2理解 ReAct 原理分析运行日志下一步学习第二章——工具的定义与注册机制。运行截图参考资源课程文档第一章初识智能体论文ReAct: Synergizing Reasoning and Acting in Language Models 项目教程地址hello-agents - Datawhale AI Agent 入门教程 https://github.com/datawhalechina/hello-agents版权声明本笔记基于 Datawhale hello-agents 开源项目整理转载请注明出处。记录时间2026年3月17日本文由AI润色输出总结

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2423996.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！