从Prompt到Harness:AI工程四层逻辑,助你玩转大模型!

news2026/5/10 2:23:54
本文从生活化的小时工类比出发深入剖析了AI工程中的四层逻辑提示词、提示词工程、上下文工程和Harness工程。文章逐层解析了每个概念的核心内涵及其演进关系强调了Harness工程对于提升AI模型实际应用能力的重要性。通过理解这四层逻辑读者能够更清晰地诊断AI应用中的问题并掌握如何让AI在真实环境中持续、安全、可靠地完成复杂任务的关键。文章最后指出这四层逻辑是AI时代最重要的认知框架之一对于深入理解和应用AI技术具有重要意义。最近AI 圈里又开始流行一个新词Harness Engineering。说实话每次出来新概念我都会想起那句时代经典语录只要你学的够慢明天你就不用学。最开始是 Prompt Engineering前段时间是 Context Engineering现在又蹦出来个 Harness Engineering。AI圈造新词的速度真的比模型迭代还快。搞得人很难不 FOMO那这仨到底是什么关系是一层套一层还是又在炒概念换名字今天这篇文章就是想把这四层逻辑给大家彻底捋清楚。让你真的理解它们为什么会按这个顺序出现以及你在实际使用 AI 的时候问题到底出在哪一层。这个认知一旦建立起来你用AI、看 AI 产品的眼光会完全不一样。00 一个例子把底层逻辑打通为了方便大家理解我用一个生活中的例子来解释这件事。AI这里指大模型 LLM 就像一个通用能力很强的小时工。他啥都会做做饭、打扫卫生、修理东西等等。但他有个怪毛病每次进门都失忆不记得你是谁、你有什么习惯、上次干过啥。所以你每次让他干活都得重新交代一遍。而我们的目的是搞明白怎么和一个失忆但聪明的家伙好好合作理解了这个前提下面的四层逻辑就特别清晰容易理解了。01 第一层提示词Prompt你请了一个小时工回来想让他帮你做点事。于是你跟小时工说“去做个西红柿炒鸡蛋。”这句话就叫提示词。很多人误以为提示词就等于问题或者命令其实不是。你发给模型的那段输入不管是一个问题、一条指令、还是一段待续写的文本全都算作提示词。 它就是一段文本是你交代给小时工的那句话。模型接收到输入之后干嘛呢它就按照预测下一个 token的机制生成回复。就这么简单。02 第二层提示词工程Prompt Engineering你发现光说一句做个西红柿炒鸡蛋不行他做出来的不合口味。于是你琢磨我得把话说清楚点才行。你想了想改成“做个西红柿炒鸡蛋少放盐西红柿先炒出汁鸡蛋要嫩一点少放糖。”这个研究怎么把话说得更明白、让AI更不容易出错的过程就叫提示词工程。说白了就是话该怎么讲的学问。这玩意儿在 2022—2023 年特别火。那时候大家发现同一个模型、同一项任务仅仅是改写了提示词的措辞和结构效果就能产生巨大差异。于是一大堆技巧被总结出来Few-shot少量样本在提示词里先给几个示例让模型照着样子来Chain-of-Thought思维链加一句Let’s think step by step让模型先推理再回答复杂任务准确率直接拉上去Role Prompting角色提示告诉模型你是一位资深律师约束它的语气和专业方向ReAct让模型在想和做之间交替进行是 Agent 的早期雏形这些技巧的共同点都是在研究给大模型的那段输入文本应该怎么写。但这里有一个关键点必须说清楚提示词工程本质上是经验科学。没有严格的理论闭环效果高度依赖迭代测试。工程这两个字的分量在于它要求你把提示词的设计当作一个可测量、可优化、可复用的工作流来对待而不是凭直觉随手一写。03 第三层上下文工程Context Engineering好继续回到我们的小时工。你发现光把话讲清楚还不够。比如今天你想让他帮你做一桌年夜饭光靠你嘴上说根本说不完。于是你提前给他准备好菜谱、冰箱里有啥的清单、全家人的忌口表、客人名单、灶台和烤箱的说明书等等全摆在厨房台面上。他一进门看一眼台面就知道今天该干啥、用啥、注意啥。琢磨该把哪些东西摆到他眼前、什么时候换上别的资料这件事就叫上下文工程。为什么这个概念会在 2025 年火起来因为模型越来越聪明了。上下文窗口从最早的2K、4K tokens扩展到了几十万甚至上百万。同时 RAG、Agent、长对话这些应用形态全面铺开。大家突然意识到一件事单纯打磨那一句话已经不够了。真正决定模型能不能干好活的是你给它准备的那一套资料和工具全不全、对不对。提示词工程关心一段文本怎么写更有效上下文工程关心整个上下文窗口应该被填充成什么样。前者可以看作后者的一个子集提示词处理的是上下文中由人类直接撰写的那部分指令文本而上下文工程处理的是整个上下文的组装流水线。用一句大白话说提示词工程是在研究给小时工的话怎么讲上下文工程是在研究要给小时工准备哪些工具和资料。04 第四层Harness 工程Harness Engineering好重头戏来了。继续回到我们的小时工。你发现光准备好桌上那堆资料还是不够。这小时工干活时还会出别的问题他可能干一半工具坏了不知道咋办、可能把不该动的东西动了、可能干完一件事忘了下一件该干啥、可能要和另一个小时工配合但俩人对不上话。所以你还得给他整一套干活的规矩和装备给他规定干活的流程干完一步先停下来验收验收完毕再进行下一步给他一套工具箱告诉他每个工具啥时候能用、啥时候不准碰给他划好活动范围厨房随便进但卧室抽屉别动教他出岔子怎么办切到手要先包扎别接着切如果今天来俩小时工一起干活还得安排好谁管买菜、谁管下锅、俩人怎么对接这一整套规矩 工具 范围 应急预案 配合方式就叫 Harness 工程。“Harness这个词原意是挽具”——套在马身上、把马和马车连起来、让人能驾驭马的那套装备。在 AI 语境下模型本身只是一个会预测下一个 token 的大脑而 harness 就是让这个大脑能真正干活的整副身体和装备。这个概念在 2025—2026 年随着编码 AgentClaude Code、Cursor、Codex CLI 等的普及而爆发。Anthropic 公开说过一个非常有意思的判断当代编码 Agent 的能力提升中模型本身的进步只占一半另一半来自 harness 的演进。也就是说同一个模型放进不同的 harness 里能力表现可以天差地别。这就是为什么不同的编码 Agent 产品底层用的是同一个模型体验差距却巨大的根本原因。一个成熟的 Agent Harness 通常包括六层还是用小时工来对应上下文管理每次干活前在桌上摆好他需要的资料。上下文工程其实就是 harness 的一个子模块。工具系统给他准备一套工具箱告诉他每个工具怎么用、什么时候该用哪个。执行编排给他规定干活流程干完一步先汇报你说继续再继续而不是让他自己闷头干到底。这是整个循环的调度中枢。记忆与状态管理给他一个笔记本让他记住上次干了啥、干到哪了别每次进门都从头来。评估与观测装个监控知道他干得好不好、哪一步出了问题事后能追溯。约束与恢复划好规矩厨房随便进卧室别动切到手了先包扎别硬撑着继续切。同一个 Agent 项目在同样的模型、同样的提示词的情况下把任务拆分、状态管理、校验恢复等这些模型外围的工程做好之后能让项目的成功率大幅提升。这就是 Harness 的力量。不是模型变聪明了是给它配的装备变好了。05 四层关系一张图看懂说到这里我们把四层关系整理一下提示词 ⊂ 提示词工程 ⊂ 上下文工程 ⊂ Harness 工程四个概念是逐层包含、层层向外扩展的关系提示词那段输入文本本身你交代的那句话提示词工程这段文本应该怎么写研究话怎么讲上下文工程整个上下文窗口该填什么研究该把哪些资料递到他手上Harness 工程模型外部的整套运行系统研究整套让他能持续、安全、靠谱干活的规矩和装备。这条演进路径也完美对应了行业重心的迁移最后那讲了这么多对我们日常使用AI有什么用呢我认为理解这四层逻辑最大的价值是提升你的诊断能力。当你用 AI 干活效果不好的时候你能判断问题出在哪一层模型输出风格不对、格式不对大概率是提示词的问题改一改措辞和结构。模型缺少关键信息、答非所问大概率是上下文工程的问题该补检索源、调整上下文的组装策略。模型单次回答没问题但多步任务经常跑偏、出错没法自救这就是 Harness 层面的问题了需要调整循环控制、错误恢复、工具权限等这些东西。就像你家小时工做菜不好吃你一直在纠结我是不是没把话说清楚但实际问题可能是你根本没把菜谱和忌口表准备好上下文层或者他根本不知道菜刀在哪、煤气灶怎么开、切到手了该咋办Harness 层。从提示词到 Harness本质上是同一条线如何让 AI 在真实环境中持续、安全、可靠地完成复杂任务。每一层的出现都不是为了淘汰上一层而是在上一层的基础上向外扩展了一圈。提示词工程没有过时它依然是基本功。但如果你只停留在这一层你能做的事情就会有上限。这条演进路线还在继续。今天的 Harness 可能还只是个开始未来可能还有更外层的工程实践出现。但不管怎么变理解这个层层嵌套、逐层扩展的结构本身就是 AI 时代最重要的认知框架之一。说真的这两年看着身边一个个搞Java、C、前端、数据、架构的开始卷大模型挺唏嘘的。大家最开始都是写接口、搞Spring Boot、连数据库、配Redis稳稳当当过日子。结果GPT、DeepSeek火了之后整条线上的人都开始有点慌了大家都在想“我是不是要学大模型不然这饭碗还能保多久”我先给出最直接的答案一定要把现有的技术和大模型结合起来而不是抛弃你们现有技术掌握AI能力的Java工程师比纯Java岗要吃香的多。即使现在裁员、降薪、团队解散的比比皆是……但后续的趋势一定是AI应用落地大模型方向才是实现职业升级、提升薪资待遇的绝佳机遇这绝非空谈。数据说话2025年的最后一个月脉脉高聘发布了《2025年度人才迁徙报告》披露了2025年前10个月的招聘市场现状。AI领域的人才需求呈现出极为迫切的“井喷”态势2025年前10个月新发AI岗位量同比增长543%9月单月同比增幅超11倍。同时在薪资方面AI领域也显著领先。其中月薪排名前20的高薪岗位平均月薪均超过6万元而这些席位大部分被AI研发岗占据。与此相对应市场为AI人才支付了显著的溢价算法工程师中专攻AIGC方向的岗位平均薪资较普通算法工程师高出近18%产品经理岗位中AI方向的产品经理薪资也领先约20%。当你意识到“技术AI”是个人突围的最佳路径时整个就业市场的数据也印证了同一个事实AI大模型正成为高薪机会的最大源头。最后我在一线科技企业深耕十二载见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事早已在效率与薪资上形成代际优势我意识到有很多经验和知识值得分享给大家也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。我整理出这套 AI 大模型突围资料包【允许白嫖】✅从入门到精通的全套视频教程✅AI大模型学习路线图0基础到项目实战仅需90天✅大模型书籍与技术文档PDF✅各大厂大模型面试题目详解✅640套AI大模型报告合集✅大模型入门实战训练这份完整版的大模型 AI 学习和面试资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】①从入门到精通的全套视频教程包含提示词工程、RAG、Agent等技术点② AI大模型学习路线图0基础到项目实战仅需90天全过程AI大模型学习路线③学习电子书籍和技术文档市面上的大模型书籍确实太多了这些是我精选出来的④各大厂大模型面试题目详解⑤640套AI大模型报告合集⑥大模型入门实战训练获取方式有需要的小伙伴可以保存图片到wx扫描二v码免费领取【保证100%免费】

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2599302.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…

wordpress后台更新后 前端没变化的解决方法

使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…

网络编程(Modbus进阶)

思维导图 Modbus RTU(先学一点理论) 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议,由 Modicon 公司(现施耐德电气)于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…

UE5 学习系列(二)用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…

利用最小二乘法找圆心和半径

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明&#xff1a;假设每台服务器已…

XML Group端口详解

在XML数据映射过程中&#xff0c;经常需要对数据进行分组聚合操作。例如&#xff0c;当处理包含多个物料明细的XML文件时&#xff0c;可能需要将相同物料号的明细归为一组&#xff0c;或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码&#xff0c;增加了开…

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造&#xff0c;完美适配AGV和无人叉车。同时&#xff0c;集成以太网与语音合成技术&#xff0c;为各类高级系统&#xff08;如MES、调度系统、库位管理、立库等&#xff09;提供高效便捷的语音交互体验。 L…

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)

题目&#xff1a;3442. 奇偶频次间的最大差值 I 思路 &#xff1a;哈希&#xff0c;时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况&#xff0c;哈希表这里用数组即可实现。 C版本&#xff1a; class Solution { public:int maxDifference(string s) {int a[26]…

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…

【Axure高保真原型】引导弹窗

今天和大家中分享引导弹窗的原型模板&#xff0c;载入页面后&#xff0c;会显示引导弹窗&#xff0c;适用于引导用户使用页面&#xff0c;点击完成后&#xff0c;会显示下一个引导弹窗&#xff0c;直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…

接口测试中缓存处理策略

在接口测试中&#xff0c;缓存处理策略是一个关键环节&#xff0c;直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性&#xff0c;避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明&#xff1a; 一、缓存处理的核…

龙虎榜——20250610

上证指数放量收阴线&#xff0c;个股多数下跌&#xff0c;盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型&#xff0c;指数短线有调整的需求&#xff0c;大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的&#xff1a;御银股份、雄帝科技 驱动…

观成科技:隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具&#xff0c;该工具基于TUN接口实现其功能&#xff0c;利用反向TCP/TLS连接建立一条隐蔽的通信信道&#xff0c;支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式&#xff0c;适应复杂网…

铭豹扩展坞 USB转网口 突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…

未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?

编辑&#xff1a;陈萍萍的公主一点人工一点智能 未来机器人的大脑&#xff1a;如何用神经网络模拟器实现更智能的决策&#xff1f;RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战&#xff0c;在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…

Linux应用开发之网络套接字编程(实例篇)

服务端与客户端单连接 服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …

华为云AI开发平台ModelArts

华为云ModelArts&#xff1a;重塑AI开发流程的“智能引擎”与“创新加速器”&#xff01; 在人工智能浪潮席卷全球的2025年&#xff0c;企业拥抱AI的意愿空前高涨&#xff0c;但技术门槛高、流程复杂、资源投入巨大的现实&#xff0c;却让许多创新构想止步于实验室。数据科学家…

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向&#xff1a; 逆向设计 通过神经网络快速预测微纳结构的光学响应&#xff0c;替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…