[Deep Agents:LangChain的Agent Harness-01]LangChain、LangGraph和Deep Agents三者之间的关系
Deep Agents是LangChain团队在2025年正式发布的一个开源Agent框架专门用于构建能够处理生产级、长时程、多步骤任务的深度Agent。与传统的浅层Agent仅依赖 LLM 简单工具调用循环不同Deep Agents 旨在模拟像Claude Code或Deep Research那样的复杂执行能力。作为一个Agent开发框架Deep Agents内置了任务规划、文件系统、Sub-Agent生成和长期记忆等功能。我们可以将Deep Agents用于任何任务包括复杂的多步骤任务。在介绍Deep Agents之前我们先来简单概括一下LangChain、LangGraph和Deep Agents三者之间的关系。LangChain是一个Agent开发框架提供了构建Agent的核心模块如工具调用循环、提示管理、记忆管理等。LangGraph是一个运行时系统提供了持久执行、流式传输、人机交互等功能。Deep Agents是一个基于LangChain构建的Agent开发框架它使用LangGraph来实现持久执行、流式传输、人机交互等功能。也许说了这些你还是觉得困惑那我说得更简单一点它们的最终使命都是利用构建的Agent来完成我们给它的任务但是它们创建Agent的方式不同。1. LangGraph将StateGraph编程成Agent它利用一个StateGraph对象作为Builder通过添加节点和边根据推理任务构建具有对应结构的状态图。Agent正是StateGraph编译后的结果它本质上是一个Pregel对象一个由节点和通道组成的Actor模型。StateGraph的节点转换成Pregel的节点状态成员转换成Pregel的通道由边决定的执行流程转换针对通道的订阅规则。原则上任意复杂度的状态图都可以通过为StateGraph添加相应的节点和边构建出来。比如我们利用如下的程序构建了一个包含四个节点foo、bar、baz和qux的状态图并按照流转规则添加了相应的边最终将其编译成一个Agent。fromtypingimportTypedDictfromlanggraph.graphimportStateGraphfromPILimportImageimportioclassState(TypedDict):passasyncdeffoo(state:State):passasyncdefbar(state:State):passasyncdefbaz(state:State):passasyncdefqux(state:State):passagent(StateGraph(State).add_node(foo,foo).add_node(bar,bar).add_node(baz,baz).add_node(qux,qux).set_entry_point(foo).set_finish_point(qux).add_edge(foo,bar).add_edge(foo,baz).add_edge([bar,baz],qux).compile())Image.open(io.BytesIO(agent.get_graph().draw_mermaid_png())).show()我们调用Agent对象的get_graph方法可以得到一个Graph对象调用它的draw_mermaid_png方法可以得到一个PNG格式的状态图字节数组最终利用PIL库将其展示出来。2. LangChain利用create_agent函数创建Agent我们将LangChain和LangGraph和Deep Agents放在一起比较会将关注点落在用来创建Agent的create_agent工厂函数上。create_agent函数根据指定的模型和工具集创建的Agent依然是采用上面这道机制创建的。默认状态类型为AgentState将messages作为核心成员承载了模型、用户和工具三者之间的对话历史。create_agent函数依然会先创建作为Builder的StateGraph并为其添加两个节点一个用于封装模型节点默认名称为model另一个承载所有的工具(节点默认名称为tools)。模型节点与工具节点之间具有一条动态条件边,当LLM返回的AIMessage包含工具调用时被激活的这条边会路由到tools节点完成工具调用反之则意味着AIMessage携带的就是最终的结果整个推理过程就此结束。工具节点与模型节点有一条静态边所以工具执行后会再次回到模型节点后者在新的状态下完成下一步推理。LangChain利用create_agent工厂函数创建Agent一个最简单的Agent只需要指定模型即可但一般情况我们都需要注册相应的工具。下面的代码利用create_agent函数创建了一个由ChatOpenAI模型和两个注册工具组成的Agentfromlangchain.agentsimportcreate_agentfromlangchain.toolsimporttoolfromlangchain_openaiimportChatOpenAIfromPILimportImagefromdotenvimportload_dotenvimportio load_dotenv()toolasyncdeffoo():test tool footoolasyncdefbar():test tool baragentcreate_agent(modelChatOpenAI(namegpt-5.2-chat),tools[foo,bar])Image.open(io.BytesIO(agent.get_graph().draw_mermaid_png())).show()当这个Agent被转换成图后具有如下的结构。这是一个包含两个节点的状态图一个是用于决策和推理的model节点作为决策执行者的工具全部被封装到tools节点中。这种AgentState 双节点的结构虽然简单但却能满足常规的推理任务。对于更复杂的推理任务一方面我们可以扩展AgentState提供更多的状态成员来承载更多的上下文信息另一方面我们也可以通过注册AgentMiddleware来添加更多的节点来完善工作流。具体来说注册的AgentMiddleware提供了如下的功能添加状态字段如果AgentMiddleware涉及到针对状态更新对应的状态字段会定义在state_schema字段返回的状态类型中。此状态状态类型通常是AgentState的子类定义其中的字段最终会转换成通道用于注册工具当Middleware被注册到创建的Agent上时存储在其tools字段中的工具会自动注册到Agent上。这相当于提供了一种模块化的工具开发和注册的方式添加节点当Middleware重写了before_agent/abefore_agent、before_model/abefore_model、after_model/aafter_model、after_agent/aafter_agent方法都会在状态图中相应的位置添加一个节点。Middleware相当于利用此方式完善了Agent的工作流包装模型和工具调用Middleware利用重写的wrap_model_call/awrap_model_call、wrap_tool_call/awrap_tool_call方法对模型和工具的调用进行包装将AOP引入到模型和工具的调用中使得在调用前后添加一些额外的操作变得非常简单。比如很多Middleware都具有各自的系统提示词它们基本上都是利用重写的wrap_model_call/awrap_model_call方法的方式实现针对系统提示词的注入classAgentMiddleware(Generic[StateT,ContextT]):defbefore_agent(self,state:StateT,runtime:Runtime[ContextT])-dict[str,Any]|None:passasyncdefabefore_agent(self,state:StateT,runtime:Runtime[ContextT])-dict[str,Any]|None:passdefbefore_model(self,state:StateT,runtime:Runtime[ContextT])-dict[str,Any]|None:passasyncdefabefore_model(self,state:StateT,runtime:Runtime[ContextT])-dict[str,Any]|None:passdefafter_model(self,state:StateT,runtime:Runtime[ContextT])-dict[str,Any]|None:passasyncdefaafter_model(self,state:StateT,runtime:Runtime[ContextT])-dict[str,Any]|None:passdefafter_agent(self,state:StateT,runtime:Runtime[ContextT])-dict[str,Any]|None:passasyncdefaafter_agent(self,state:StateT,runtime:Runtime[ContextT])-dict[str,Any]|None:passdefwrap_model_call(self,request:ModelRequest,handler:Callable[[ModelRequest],ModelResponse],)-ModelCallResultasyncdefawrap_model_call(self,request:ModelRequest,handler:Callable[[ModelRequest],Awaitable[ModelResponse]],)-ModelCallResultdefwrap_tool_call(self,request:ToolCallRequest,handler:Callable[[ToolCallRequest],ToolMessage|Command[Any]],)-ToolMessage|Command[Any]asyncdefawrap_tool_call(self,request:ToolCallRequest,handler:Callable[[ToolCallRequest],Awaitable[ToolMessage|Command[Any]]],)-ToolMessage|Command[Any]在下面的程序中我们定义了一个FoobarMiddleware并将其注册到Agent上。虽然它没有添加任何新的功能但它会在Agent如下所示的状态图中添加四个新的节点分别是before_agent、before_model、after_model和after_agent节点。fromlangchain.agentsimportcreate_agentfromdotenvimportload_dotenvfromlangchain.agents.middleware.typesimportAgentStatefromlangchain.toolsimporttoolfromlangchain_openaiimportChatOpenAIfromPILimportImagefromlangchain.agents.middlewareimportAgentMiddlewarefromtypingimportAnyfromlanggraph.runtimeimportRuntimeimportio load_dotenv()classFoobarMiddleware(AgentMiddleware):defbefore_agent(self,state:AgentState[Any],runtime:Runtime[None])-dict[str,Any]|None:returnsuper().before_agent(state,runtime)defbefore_model(self,state:AgentState[Any],runtime:Runtime[None])-dict[str,Any]|None:returnsuper().before_model(state,runtime)defafter_agent(self,state:AgentState[Any],runtime:Runtime[None])-dict[str,Any]|None:returnsuper().after_agent(state,runtime)defafter_model(self,state:AgentState[Any],runtime:Runtime[None])-dict[str,Any]|None:returnsuper().after_model(state,runtime)toolasyncdeffoo():test tool footoolasyncdefbar():test tool baragentcreate_agent(modelChatOpenAI(namegpt-5.2-chat),tools[foo,bar],middleware[FoobarMiddleware()])Image.open(io.BytesIO(agent.get_graph().draw_mermaid_png())).show()状态图结构如下所示3. Deep Agents利用create_deep_agent函数创建AgentDeep Agents拥有属于自己的Agent工厂函数create_deep_agent它其实最终也会调用LangChain的create_agent函数来创建Agent它仅仅在调用此方法时利用注册的Middleware为Agent添加了更多的功能如任务规划、用于上下文管理的文件系统、Sub-Agent生成和长期记忆等功能。从LangGraph和LangChain创建Agent的方式可以看出它们相当于是自助餐和套餐的差别。LangGraph赋予完全的自由度我们可以根据具体的推理任务对状态图进行DIY。虽然灵活自由实则对用户提出了更高的要求。相比之下LangChain利用create_agent函数创建的Agent具有固定结构却能满足大部分的推理任务。它相当于提供了一款符合大众口味的基础套餐。在点餐的时候我们可以选择这个基础套餐也可以在此基础上添加、替换和剔除一些配菜来满足个性化的需求这就是Middleware赋予的定制能力。LangChain和Deep Agents的关系就像是基础套餐和升级套餐的关系。LangChain利用create_agent函数构建的Agent只具有基础的功能任务定制的功能都需要通过注册Middleware来提供。企业级Agent来往往具有一些公共的功能需求如任务规划、用于上下文管理的文件系统、Sub-Agent生成和长期记忆等功能。如果任何一个功能都要求用户通过注册Middleware来实现的话无疑也会增加用户的使用门槛。于是Deep Agents对套餐进行了升级在通过create_deep_agent函数创建Agent的时候根据提供的配置自动注册了对应的Middleware。为了探究create_deep_agent函数为创建的Agent注册了怎样的Middleware我们编写了如下的演示程序fromdeepagentsimportcreate_deep_agentfromdeepagents.middlewareimportSubAgent,AsyncSubAgentfromlangchain.toolsimporttoolfromlangchain_openaiimportChatOpenAIfromPILimportImageimportiofromdotenvimportload_dotenv load_dotenv()toolasyncdeffoo():test tool footoolasyncdefbar():test tool barinline_subagent:SubAgent{name:inline-sub-agent,description:A test inline sub-agent,system_prompt:System prompt for inline sub-agent,model:ChatOpenAI(namegpt-5.2-chat),}async_subagent:AsyncSubAgent{name:async-sub-agent,description:A test async sub-agent,graph_id:graph-001,}agentcreate_deep_agent(modelChatOpenAI(namegpt-5.2-chat),memory[/memories/AGENTS.md],skills[/skills/],tools[foo,bar],interrupt_on{foo:True},subagents[inline_subagent,async_subagent],)Image.open(io.BytesIO(agent.get_graph().draw_mermaid_png())).show()在上面的程序中我们通过create_deep_agent函数创建了一个Agent并为它指定了模型、记忆、Skill、工具、中断规则和Sub-Agent同步和异步等配置。最终我们得到的状态图如下所示在上面这张图中我们看到了五个Middleware。但是Deep Agents涉及的Middleware远不止这些因为只有重写了before_agent/abefore_agent、before_model/abefore_model、after_model/aafter_model方法的Middleware才会转换成状态图的节点而且SubAgentMiddleware和AsyncSubAgentMiddleware生成的Sub-Agent也会有自己的Middleware。总的来说整个Deep Agents就建立在如下这几个Middleware之上了解了它们你就了解了Deep Agents的全部。FileSystemMiddleware: 提供一个抽象的文件系统。让Agent拥有读写本地文件的能力如read_file和write_file用于存放中间结果或处理超长内容防止上下文溢出TodoListMiddleware: 利用提供的系统提示词指示LLM将复杂的任务拆分为子任务列表Todo-List并以此为蓝本逐步实施。它同时提供了write_todos工具实时记录每个子任务的完成状态SkillsMiddleware: 允许Agent动态加载预定义的专业能力Skills通过注入系统提示词让Agent快速获得特定领域的专业知识;HumanInTheLoopMiddleware: 实现了人机交互在Agent调用关键/敏感工具前如支付、删除文件暂停并请求人类批准、修改或拒绝;PatchToolCallsMiddleware用于在模型输出不符合规范或需要动态调整时对工具调用的参数进行实时补丁或格式修正提高调用成功率_DeepAgentsSummarizationMiddleware记忆瘦身器。自动对冗长的对话历史进行摘要压缩。它在信息进入模型前执行仅保留关键摘要和最新消息从而节省Token并维持长期对话的连贯性MemoryMiddleware记忆持久化与注入器。它负责将用户偏好、业务规则或跨会话的关键事实提取出来并以系统提示词的形式注入到Agent的大脑中SubAgentMiddleware: 分身指挥官。支持Agent生成具有独立上下文的Sub-Agent来分担任务实现复杂工作的委派与隔离AsyncSubAgentMiddleware: 异步分身。在SubAgent基础上增加了异步执行能力允许Main-Agent在Sub-Agent处理耗时任务时继续执行其他操作或同时管理多个子任务
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2593525.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!