从零到手搓一个Agent：AI Agents新手入门精通

news2026/3/14 9:41:48

这一天你的女朋友问你假设我们有女朋友宝宝什么是Agent啊Agent和LLM有什么区别呀最近大家都在说的Agent究竟是什么包括很多文章都在写的Agent还有之前谷歌发布的Agents白皮书究竟是什么对我们有什么帮助对我们有什么影响呢现在编者专门做了一个系列从最简单的讲起解开这个迷雾这个系列的教程会帮助你了解基本概念并且能够手搓一系列的agent那么chatgpt是Agent还是LLM有了LLM为什么还需要Agent呢这次我们就把概念弄清楚以及有什么用讲清楚一、LLMs的局限与Agents的诞生结合ChatGPT举例你或许已经体验过 ChatGPT 的强大对话能力它能流畅地与你聊天、回答问题甚至帮你写诗、写代码。这背后正是 LLMs大型语言模型在发挥作用。LLMs 就像一个超级博览群书的“大脑”它掌握了海量的文本知识可以根据你的提问生成相应的文本回复那么为什么说 LLMs 仍然存在局限性呢让我们以 ChatGPT 为例来看1. 知识的滞后性举例你问 ChatGPT “今天的天气怎么样” 或者 “最新的股票价格是多少”它很可能无法给出准确的回答。因为它所拥有的知识来源于训练时的数据无法实时获取最新的信息。它可能告诉你的是前几天的天气或者很久之前的股票行情。解释 LLMs 的知识就像一本厚厚的“旧书”书里记载着很多知识但无法知道书出版之后发生的新鲜事。2. 无法与外界交互举例你让 ChatGPT “帮我预订一张明天的机票”它会很热情地告诉你预订机票需要哪些步骤却无法实际帮你预订。你让它 “帮我发送一封邮件给同事”它也只能为你写好邮件内容而不能帮你发送出去。解释 LLMs 只能进行文本理解和生成它就像一个“只会说”的人但没有“手脚”去执行实际操作。3. 缺乏自主行动能力举例你问 ChatGPT “如何制定一个完美的旅行计划”它会给出你很多建议例如选择目的地、预订酒店、规划行程等等。但是它不会主动帮你把这些都安排好。它只是在回答你的问题而不是主动帮你解决问题。解释 LLMs 只能被动地接收指令然后给出回答无法根据目标自主规划行动。就像一个“听话的助手”但是没有自己的想法和主动性。二、为了突破这些限制Agents智能体应运而生。Agents 的核心思想给 LLMs 配备“手脚”和“大脑”我们可以将 Agents 想象成一个升级版的 ChatGPT它不仅具备强大的语言理解和生成能力还拥有了“手脚”工具 Agents 可以利用各种工具例如搜索引擎、数据库查询工具、邮件发送工具与外界互动获取信息、执行操作。就像给 LLMs 配备了可以操作各种工具的 “手脚”。“大脑”编排层 Agents 具备推理和规划能力可以根据目标自主规划行动并合理地调用各种工具。就像给 LLMs 配备了一个可以自主思考和决策的“大脑”。Agents 与 LLMs 的区别特性LLMs (例如 ChatGPT)Agents (智能体)核心能力语言理解和生成语言理解、推理规划、工具使用、自主行动知识来源训练数据训练数据实时信息外部知识库与外界交互无法直接交互可以通过工具与外界交互行动能力无法执行实际操作可以根据目标自主执行操作解决问题方式被动回答问题主动分析问题、规划行动、解决问题例如ChatGPT 可以回答你的问题但无法帮你订机票或查询天气Agent 可以帮你预订机票、查询天气、发送邮件并根据你的需求主动规划行程简而言之LLMs 就像一个知识渊博的“问答机器人”你问什么它答什么。Agents 就像一个“智能助手”它不仅能回答你的问题还能主动帮你完成任务。通过这样的解释希望能够帮助读者更好地理解 LLMs 的局限性以及 Agents 的优势和价值。Agents 的出现标志着人工智能正朝着更智能、更强大的方向发展。知识的局限性 LLMs的知识来源于训练数据无法获取实时的外部信息这使得它在处理需要最新资讯的任务时显得力不从心。行动的局限性 LLMs只能进行文本生成和理解无法与外部环境交互更无法执行实际操作例如查询数据库或发送邮件。为了克服这些局限谷歌的研究人员在《New whitepaper Agents》中详细阐述了“Agent”的概念。他们将LLMs与工具和编排层相结合赋予了LLMs自主行动的能力使其能够像一个真正的“智能体”一样工作。三、Agents的核心组件智能体的“三大支柱”一个完整的Agent通常由三个核心组件构成它们相互协作共同支撑起Agent的智能行为1、模型 (Model): Agent 的“大脑”角色负责理解用户输入、进行推理和规划并选择合适的工具执行任务。类型 ReAct、Chain-of-Thought、Tree-of-Thought等模型提供了不同的推理框架帮助Agent进行多轮交互和决策。重要性模型是Agent的核心其推理能力直接决定了Agent的行动效率和准确性。2、工具 (Tools): Agent 与外界交互的“桥梁”角色允许Agent访问外部数据和服务执行各种任务。类型可以是各种API例如数据库查询、搜索引擎、代码执行器、邮件发送器等。重要性工具极大地扩展了Agent的能力使其能够处理更复杂的任务。3、编排层 (Orchestration Layer): Agent 的“指挥中心”角色负责管理Agent的内部状态协调模型和工具的使用并根据目标指导Agent的行动。类型可以使用各种推理框架如ReAct和Chain-of-Thought等协助Agent进行规划和决策。重要性编排层是Agent的“指挥中心”确保各个组件协同工作最终实现预定目标。四、Agents的运作机制从输入到输出Agent 的运作流程可以概括为以下几个步骤接收输入接收用户的指令或问题。理解输入模型理解用户的意图并提取关键信息。推理规划模型根据用户输入和当前状态进行推理和规划确定下一步行动。选择工具模型根据目标选择合适的工具。执行行动 Agent使用工具执行行动例如查询数据库、发送邮件等。获取结果 Agent获取工具执行的结果。输出结果 Agent将结果输出给用户或进行下一步行动。相较于传统的LLMsAgents 具备以下显著优势知识扩展通过工具Agent可以访问实时信息和外部知识库突破了训练数据的限制提供更准确和可靠的信息。自主行动 Agent 可以根据目标自主决策和行动无需人工干预大大提高了效率和灵活性。多轮交互 Agent 可以管理对话历史和上下文进行多轮交互提供更自然和流畅的用户体验。可扩展性 Agent 可以通过添加新的工具和模型不断扩展其功能和应用范围。五、Agents的应用从智能客服到虚拟助手Agents 的应用场景非常广泛以下仅列举部分智能客服自动回答用户问题、处理订单、解决客户问题。个性化推荐根据用户兴趣和行为推荐商品、内容、服务等。虚拟助手帮助用户管理日程、预订行程、发送邮件等。代码生成根据用户需求自动生成代码。智能创作创作诗歌、小说、剧本等。知识图谱构建从文本中提取知识构建知识图谱。Agents的开发工具从LangChain到Vertex AI为了方便开发者构建 AgentsGoogle 提供了多种工具和平台LangChain 一个开源库方便开发者将LLMs与工具和编排层结合构建功能强大的Agents。LangGraph 一个开源库帮助开发者构建和可视化 Agents提供图形化界面方便设计和测试。Vertex AI 一个云平台提供各种AI工具和服务如Vertex Agent Builder、Vertex Extensions、Vertex Function Calling等帮助开发者快速构建和部署 Agents。Agents 的未来充满无限可能技术发展将推动 Agents 走向更智能化和强大更先进的模型更强大的语言模型将带来更复杂的推理和规划能力。更丰富的工具更多种类的工具将为 Agent 提供更丰富的交互方式例如自然语言处理、图像识别、语音识别和机器人控制等。更智能的编排层更智能的编排层将更好地协调模型和工具提高 Agent 的效率和灵活性。Agent Chaining 更多专业化的 Agents 将协同工作解决更复杂的问题。多模态交互 Agent 将能够处理多种模态数据如文本、图像和语音带来更丰富的用户体验。人机协作 Agent 将与人类更紧密地合作共同完成更复杂的任务。六、结语AgentAI的未来Agents 代表着生成式AI模型的进阶形态它们拥有自主行动能力能够利用工具与外界交互并根据目标进行决策具有更广泛的应用范围和更强大的能力。随着技术的不断发展Agents 将会改变我们的生活和工作方式并推动人工智能进入新的发展阶段。未来Agent 将成为人工智能发展的重要方向为我们带来更智能、更便捷的未来。这里给大家精心整理了一份全面的AI大模型学习资源包括AI大模型全套学习路线图从入门到实战、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等资料免费分享扫码免费领取全部内容1. 成长路线图学习规划要学习一门新的技术作为新手一定要先学习成长路线图方向不对努力白费。这里我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。可以说是最科学最系统的学习成长路线。2. 大模型经典PDF书籍书籍和学习文档资料是学习大模型过程中必不可少的我们精选了一系列深入探讨大模型技术的书籍和学习文档它们由领域内的顶尖专家撰写内容全面、深入、详尽为你学习大模型提供坚实的理论基础。书籍含电子版PDF3. 大模型视频教程对于很多自学或者没有基础的同学来说书籍这些纯文字类的学习教材会觉得比较晦涩难以理解因此我们提供了丰富的大模型视频教程以动态、形象的方式展示技术概念帮助你更快、更轻松地掌握核心知识。4. 2026行业报告行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。5. 大模型项目实战学以致用当你的理论知识积累到一定程度就需要通过项目实战在实际操作中检验和巩固你所学到的知识同时为你找工作和职业发展打下坚实的基础。6. 大模型面试题面试不仅是技术的较量更需要充分的准备。在你已经掌握了大模型技术之后就需要开始准备面试我们将提供精心整理的大模型面试题库涵盖当前面试中可能遇到的各种技术问题让你在面试中游刃有余。7. 资料领取全套内容免费抱走学 AI 不用再找第二份不管你是 0 基础想入门 AI 大模型还是有基础想冲刺大厂、了解行业趋势这份资料都能满足你现在只需按照提示操作就能免费领取扫码免费领取全部内容

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2410688.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！