小白程序员必看:收藏这份上下文工程指南,轻松玩转大模型!
本文深入浅出地介绍了上下文工程在大语言模型中的重要性阐述了指令、示例、知识、记忆、工具和安全护栏等六种上下文类型。文章详细解析了上下文工程的四个基本阶段撰写上下文、选择上下文、压缩上下文和隔离上下文并强调了上下文窗口的作用。通过本文读者可以了解如何构建一个高效的上下文工程工作流以提升大语言模型的性能和安全性。智能体的上下文工程上下文工程正变得日益重要但我们感觉很多人对其真实含义仍有些困惑。今天就让我们以循序渐进的方式涵盖关于上下文工程你需要知道的一切我们开始吧简而言之上下文工程是一门艺术与科学旨在以恰当的格式、在恰当的时机将恰当的信息传达给你的人工智能模型。以下是Andrej Karpathy关于上下文工程的一句引述…补充解释此处的“LLM”指“大语言模型”它是现代人工智能中一种基于海量文本数据训练、能够理解和生成自然语言的模型是驱动聊天机器人和智能体的核心技术之一。其核心原理通常涉及复杂的深度学习架构超越了基础的大学数学范畴。要理解上下文工程首要的是理解『上下文』本身的含义。如今的智能体早已超越简单的聊天机器人范畴。下图总结了一个智能体要正常工作所需的六种上下文类型它们分别是指令Instructions示例Examples知识Knowledge记忆Memory工具Tools安全护栏Guardrails由此可见简单地“提示”Prompt智能体是远远不够的。你必须精心设计和构建它的输入内容即上下文。不妨这样理解• 如果说大语言模型是中央处理器CPU• 那么上下文窗口就是随机存取存储器RAM。这样一来你本质上就是在用完美的指令为你的人工智能“编程”其“内存”。我们该如何做到这一点呢上下文工程可以被分解为四个基本阶段补充说明这里的“上下文窗口”Context Window指的是大语言模型在单次交互或推理时能够接收和处理的最大文本输入长度通常以令牌数衡量。可以想象成是AI的工作记忆区所有需要它在此刻知晓和理解的信息如指令、示例、知识等都必须放置在这个有限的“窗口”内。• 撰写上下文• 选择上下文• 压缩上下文• 隔离上下文让我们逐一理解每个阶段……1) 撰写上下文撰写上下文意味着将其保存在上下文窗口之外以帮助智能体执行任务。你可以通过将上下文写入以下位置来实现• 长期记忆在多个会话间持续存在• 短期记忆在单个会话内持续存在• 状态对象“状态对象”state object是编程中的一个常见概念尤其在智能体Agent设计中它用于封装和管理智能体在运行过程中的各种状态信息如当前任务进度、用户偏好、会话历史等。在这里将上下文写入“状态对象”意味着将这些信息作为智能体内部状态的一部分进行存储和管理。2) 读取上下文读取上下文意味着将其拉入上下文窗口以帮助智能体执行任务。具体而言上下文可以从以下来源中提取• 工具• 记忆• 知识库如文档、向量数据库3) 压缩上下文压缩上下文意味着只为任务保留必要的令牌Token。检索到的上下文中可能包含重复或冗余信息例如在多轮工具调用中这会导致令牌数额外增加与成本上升。此时上下文总结就能派上用场。4) 隔离上下文隔离上下文指的是将其拆分以帮助智能体执行任务。实现隔离上下文的一些流行方法包括• 使用多个智能体或子智能体每个智能体拥有自己的上下文• 使用沙箱环境来存储和执行代码• 以及使用状态对象因此本质上当你构建一个上下文工程工作流时你就是在设计一个“上下文”管道以确保大语言模型能够在正确的时间、以正确的格式看到正确的信息。这里列举的方法都是为了将不同任务或数据源隔离开防止它们互相干扰从而提升智能体的处理效率和安全性。例如多个智能体可以分工合作各自专注处理一部分上下文沙箱环境能安全地运行不受信任的代码避免影响主系统状态对象则用于存储和管理智能体运行过程中的临时数据保持上下文的一致性和独立性。这就是上下文工程的工作方式如何学习大模型 AI 由于新岗位的生产效率要优于被取代岗位的生产效率所以实际上整个社会的生产效率是提升的。但是具体到个人只能说是“最先掌握AI的人将会比较晚掌握AI的人有竞争优势”。这句话放在计算机、互联网、移动互联网的开局时期都是一样的道理。我在一线科技企业深耕十二载见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事早已在效率与薪资上形成代际优势我意识到有很多经验和知识值得分享给大家也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。我们整理出这套AI 大模型突围资料包✅ 从零到一的 AI 学习路径图✅ 大模型调优实战手册附医疗/金融等大厂真实案例✅ 百度/阿里专家闭门录播课✅ 大模型当下最新行业报告✅ 真实大厂面试真题✅ 2026 最新岗位需求图谱所有资料 ⚡️ 朋友们如果有需要《AI大模型入门进阶学习资源包》下方扫码获取~① 全套AI大模型应用开发视频教程包含提示工程、RAG、LangChain、Agent、模型微调与部署、DeepSeek等技术点② 大模型系统化学习路线作为学习AI大模型技术的新手方向至关重要。 正确的学习路线可以为你节省时间少走弯路方向不对努力白费。这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划带你从零基础入门到精通③ 大模型学习书籍文档学习AI大模型离不开书籍文档我精选了一系列大模型技术的书籍和学习文档电子版它们由领域内的顶尖专家撰写内容全面、深入、详尽为你学习大模型提供坚实的理论基础。④ AI大模型最新行业报告2025最新行业报告针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。⑤ 大模型项目实战配套源码学以致用在项目实战中检验和巩固你所学到的知识同时为你找工作就业和职业发展打下坚实的基础。⑥ 大模型大厂面试真题面试不仅是技术的较量更需要充分的准备。在你已经掌握了大模型技术之后就需要开始准备面试我精心整理了一份大模型面试题库涵盖当前面试中可能遇到的各种技术问题让你在面试中游刃有余。以上资料如何领取为什么大家都在学大模型最近科技巨头英特尔宣布裁员2万人传统岗位不断缩减但AI相关技术岗疯狂扩招有3-5年经验大厂薪资就能给到50K*20薪不出1年“有AI项目经验”将成为投递简历的门槛。风口之下与其像“温水煮青蛙”一样坐等被行业淘汰不如先人一步掌握AI大模型原理应用技术项目实操经验“顺风”翻盘这些资料真的有用吗这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理现任上海殷泊信息科技CEO其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证服务航天科工、国家电网等1000企业以第一作者在IEEE Transactions发表论文50篇获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。以上全套大模型资料如何领取
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2455573.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!