别再死记硬背Agent Types了!用LangChain 0.0.340实战,5分钟搞懂ReAct与Conversational Agent的区别
别再死记硬背Agent Types了用LangChain 0.0.340实战5分钟搞懂ReAct与Conversational Agent的区别当开发者第一次接触LangChain的Agent系统时往往会被各种Agent Types搞得晕头转向。官方文档列出了近十种不同类型的Agent从Zero-shot ReAct到OpenAI Assistants每种都有其特定的使用场景和配置方式。但真正的问题在于我们该如何在实际项目中做出正确的选择今天我们就通过一个具体的案例——构建一个既能查询信息又能进行多轮对话的智能助手来对比分析两种最常用的Agent类型ReAct Agent和Conversational Agent。通过实际的代码演示你将直观地看到它们在提示风格、工具调用逻辑和输出结果上的核心差异。1. 环境准备与基础配置在开始之前我们需要确保开发环境配置正确。以下是使用Python 3.8和LangChain 0.0.340的基本设置pip install langchain0.0.340 openai google-search-results然后设置必要的环境变量import os from getpass import getpass os.environ[OPENAI_API_KEY] getpass(请输入OpenAI API Key: ) os.environ[SERPAPI_API_KEY] getpass(请输入SerpAPI Key: ) # 用于搜索功能为了后续的对比演示我们先准备两个基础工具——搜索和计算器from langchain.utilities import SerpAPIWrapper from langchain.agents import Tool from langchain.chains import LLMMathChain from langchain.chat_models import ChatOpenAI llm ChatOpenAI(temperature0, modelgpt-3.5-turbo) search SerpAPIWrapper() llm_math LLMMathChain.from_llm(llmllm) tools [ Tool( nameSearch, funcsearch.run, description用于回答关于当前事件的查询 ), Tool( nameCalculator, funcllm_math.run, description用于解决数学问题 ) ]2. ReAct Agent实战解析ReActReasoning Acting是LangChain中最通用的Agent类型它通过结合推理和行动来完成任务。让我们创建一个基础的ReAct Agent并观察其行为特点。2.1 初始化ReAct Agent使用initialize_agent函数可以快速创建ReAct Agentfrom langchain.agents import initialize_agent, AgentType react_agent initialize_agent( tools, llm, agentAgentType.ZERO_SHOT_REACT_DESCRIPTION, verboseTrue )2.2 执行简单查询让我们测试一个需要结合搜索和计算的问题response react_agent.run(特斯拉当前股价是多少如果是100股总价值多少) print(response)观察控制台输出你会看到典型的ReAct推理过程 Entering new AgentExecutor chain... 我需要先找到特斯拉的当前股价然后计算100股的总价值。 Action: Search Action Input: 特斯拉当前股价 Observation: 特斯拉(NASDAQ: TSLA)当前股价为$265.28 Thought: 现在计算100股的总价值 Action: Calculator Action Input: 265.28 * 100 Observation: Answer: 26528.0 Thought: 我现在知道最终答案了 Final Answer: 特斯拉当前股价是$265.28100股的总价值是$26,528。 Finished chain.2.3 ReAct的核心特点从上述执行可以看出ReAct Agent的典型特征线性思维过程严格遵循思考-行动-观察的循环工具调用明确每次只调用一个工具等待返回后再继续无状态性默认不保留对话历史每次查询独立处理结构化输出输出包含明确的思考过程和行动步骤这种模式非常适合需要精确控制工具调用顺序的场景但在对话式交互中会显得过于机械。3. Conversational Agent深度剖析Conversational Agent专为对话场景优化它的提示设计更接近自然聊天并能更好地处理多轮对话的上下文。让我们创建并测试这种Agent。3.1 初始化Conversational Agentfrom langchain.memory import ConversationBufferMemory memory ConversationBufferMemory(memory_keychat_history) conversational_agent initialize_agent( tools, llm, agentAgentType.CONVERSATIONAL_REACT_DESCRIPTION, verboseTrue, memorymemory )3.2 多轮对话测试现在让我们模拟一个真实的对话场景# 第一轮对话 response conversational_agent.run(你好我是张工程师) print(fAI: {response}) # 第二轮对话 response conversational_agent.run(你知道特斯拉现在的股价吗) print(fAI: {response}) # 第三轮对话 response conversational_agent.run(如果我持有85股总价值是多少) print(fAI: {response})观察输出你会发现完全不同的交互模式 Entering new AgentExecutor chain... 你好张工程师我是您的AI助手有什么可以帮您的吗 Finished chain. AI: 你好张工程师我是您的AI助手有什么可以帮您的吗 Entering new AgentExecutor chain... 让我查一下特斯拉的最新股价... Action: Search Action Input: 特斯拉当前股价 Observation: 特斯拉(NASDAQ: TSLA)当前股价为$265.28 Thought: 根据查询结果特斯拉当前股价是265.28美元。 Finished chain. AI: 根据最新数据特斯拉(NASDAQ: TSLA)的当前股价是265.28美元。 Entering new AgentExecutor chain... 您持有85股特斯拉股票让我帮您计算总价值... Action: Calculator Action Input: 265.28 * 85 Observation: Answer: 22548.8 Thought: 计算结果出来了。 Finished chain. AI: 您持有的85股特斯拉股票当前总价值约为22,548.80美元。3.3 Conversational Agent的核心优势与ReAct相比Conversational Agent展现出以下关键差异自然语言风格提示设计更接近人类对话减少机械感上下文保持自动维护对话历史能引用之前的交流内容灵活的工具调用在保持对话流畅性的同时适时使用工具用户身份感知能记住用户的自我介绍等个人信息这种Agent特别适合客服机器人、个人助手等需要长期交互的场景。4. 关键差异对比与选型指南通过上述实战我们可以总结出两种Agent的核心差异特性ReAct AgentConversational Agent设计目标任务导向型问题解决自然流畅的对话交互工具调用显式、分步骤隐式、融入对话流记忆能力默认无状态内置对话历史记忆输出风格结构化、带思考过程自然语言、类似人类回复适用场景数据处理、精确操作流程客服、聊天、多轮交互初始化复杂度简单需配置memory参数4.1 何时选择ReAct Agent需要严格按步骤执行的操作如数据ETL流程工具调用顺序至关重要的场景不需要维护对话历史的单次查询需要详细记录决策过程的审计场景4.2 何时选择Conversational Agent面向最终用户的聊天界面需要记住用户偏好的个性化服务多轮信息确认的复杂查询希望隐藏技术细节的自然交互5. 高级技巧与实战建议5.1 混合使用两种Agent模式在某些复杂场景中你可以同时使用两种Agent类型def smart_assistant(query, conversation_modeFalse): if conversation_mode: return conversational_agent.run(query) else: return react_agent.run(query)5.2 优化Conversational Agent的记忆默认的ConversationBufferMemory会保存完整历史对于长对话可能导致提示过长。可以考虑from langchain.memory import ConversationSummaryMemory summary_memory ConversationSummaryMemory( llmllm, memory_keychat_history )5.3 处理工具调用失败两种Agent都支持错误处理可以通过自定义handle_parsing_errors实现agent initialize_agent( tools, llm, agentAgentType.CONVERSATIONAL_REACT_DESCRIPTION, verboseTrue, memorymemory, handle_parsing_errors请检查您的请求并重试我遇到了一些理解困难 )5.4 性能监控与优化使用LangSmith跟踪Agent的执行过程os.environ[LANGCHAIN_TRACING_V2] true os.environ[LANGCHAIN_API_KEY] your_langsmith_key6. 常见问题与解决方案Q: 为什么我的Conversational Agent有时会忘记使用工具A: 这通常是因为对话历史过长导致关键指令被截断。可以尝试缩短max_token_limit参数使用ConversationSummaryMemory替代默认memory在提示中明确要求使用工具Q: 如何控制Agent的工具使用权限A: 可以通过工具描述(description)进行控制Tool( nameSearch, funcsearch.run, description仅限管理员使用需要授权后才能访问网络搜索功能 )Q: 两种Agent可以共享工具集吗A: 完全可以。工具是独立定义的可以被任何Agent类型使用。但要注意Conversational Agent可能需要更详细的工具描述来确保正确调用。通过本文的实战对比你应该已经掌握了ReAct和Conversational Agent的核心区别与应用场景。记住没有最好的Agent类型只有最适合你具体需求的解决方案。建议从简单场景开始逐步测试不同Agent在真实用例中的表现最终构建出既高效又用户友好的AI应用。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2552008.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!