Agent Harness:AI Agent 时代那个「缺失的操作系统层」

news2026/4/9 2:26:30
文章目录前言当最强大脑得了失忆症Agent Harness给AI装上操作系统Harness都管哪些事儿1. 工具编排Tool Orchestration2. 记忆与状态持久化Memory State3. 循环控制The Agent Loop4. 上下文工程Context Engineering5. 多Agent协调Multi-Agent Orchestration三种主流架构模式单Agent监督者模式Single-Agent Supervisor初始化器-执行器分离模式Initializer-Executor Split多Agent协调模式Multi-Agent Coordination从提示工程到Harness工程未来的操作系统大战写在最后前言朋友们今天咱们聊点硬核的但我会用最接地气的方式给你讲明白。想象一下你买了一台顶配电脑CPU是i9-14900K显卡是RTX 5090内存64G但——没有操作系统。你每次开机都要自己用汇编语言写程序来驱动硬盘、管理内存、绘制界面。更惨的是这台电脑还有个怪病每过5分钟就失忆一次刚才写到一半的文档、算了一半的公式全忘了。听起来很荒谬对吧但这就是2026年我们面对大模型LLM时的真实处境。当最强大脑得了失忆症现在我们手里的大模型比如GPT-4.5、Claude 3.7 Sonnet智商确实高得吓人。你让它写个Python脚本它能写得比很多程序员还溜你让它分析财务报表它能从几百页PDF里找出隐藏的风险点。但问题是这货是个金鱼脑。每次你打开一个新对话框它就像第一次见面一样“您好我是AI助手有什么可以帮您的”——完全忘了你们刚才还在讨论那个写到一半的电商网站架构。这不是它在装傻而是LLM的本质决定的它是无状态的stateless。Anthropic的工程团队在他们2025年11月的博客里吐槽得很直白就算是Opus 4.5这种顶级模型如果没有外部基础设施帮忙也根本做不出能上线的产品。因为复杂项目往往需要几天甚至几周才能完成而LLM的记忆只有一个上下文窗口那么长哪怕现在已经到几十万token了一旦超出限度早期的对话内容就会被压缩或者直接丢弃。这就像你请了个天才工程师但他每天上班第一件事就是喝下一杯忘情水昨天写的代码、定的方案、踩过的坑全都不记得了。你说这活儿还怎么干Agent Harness给AI装上操作系统于是Agent Harness智能体脚手架/框架这个概念在2026年突然火了起来。这个术语最早是由HashiCorp的创始人Mitchell Hashimoto在2026年2月正式提出的一下子把大家之前野路子摸索多年的实践经验给正名了。说白了Agent Harness就是那个操作系统层。LangChain的工程师们给了一个特别精辟的公式Agent Model Harness。模型Model就是那个大脑负责思考、推理、做决定而Harness脚手架就是套在大脑外面的整套生命维持系统——它负责给大脑提供工具、管理记忆、控制执行流程、处理错误恢复甚至决定什么时候该让大脑休息免得累坏了。打个比方如果LLM是F1赛车引擎Harness就是整辆赛车——包括方向盘、轮胎、悬挂系统、燃油管理系统、 Telemetry遥测设备。没有Harness你手里就只有个裸引擎劲儿再大也跑不起来。Harness都管哪些事儿根据Anthropic、OpenAI、LangChain这些一线大厂的实践一个生产级的Agent Harness至少要管这十二件事1. 工具编排Tool OrchestrationLLM本身只能输出文字就像一个人只会动嘴皮子。Harness负责给它配手脚——搜索网页、读写文件、执行代码、查询数据库、调用API。当模型说我需要查一下今天的天气Harness就接收到这个信号真的去调用天气API然后把结果喂回给模型。2. 记忆与状态持久化Memory State这是Harness最核心的价值。它要解决的问题是如何让一个金鱼脑记住昨天的事现在的主流方案是多层记忆系统工作记忆Turn Memory当前对话里模型能直接看到的内容短期记忆Session Memory本次工作流中保持的上下文压缩记忆Compact Memory当上下文太长了Harness会把之前的对话总结成摘要长期记忆Long-term Memory通过向量数据库存储的重要信息需要的时候检索出来Anthropic的Claude Code采用的是一种叫初始化器-执行器分离Initializer-Executor Split的架构。初始化器只跑一次负责搭建项目环境、创建目录结构、写下功能清单和初始代码。然后每个执行器会话只处理一个具体功能点做完就提交代码、更新进度日志、干净退出。下次再开新会话它先读进度日志就知道该接着干什么了。3. 循环控制The Agent Loop这就是AI Agent的心跳。标准的ReActReasoning Acting循环大概长这样while 任务未完成: 观察当前状态 调用LLM思考下一步 如果有工具调用请求: 执行工具 把结果反馈给LLM 否则: 输出最终结果看起来就是个简单的while循环对吧但 complexity 全在Harness的管理逻辑里——什么时候该停止工具调用失败了怎么办预算超了没这些都需要Harness来把控。4. 上下文工程Context Engineering上下文窗口有限不能把整本书都塞进去。Harness要决定在当前这一步哪些信息是最相关的哪些可以省略什么时候该做总结压缩这就像给领导汇报工作你不能从公司创立那年讲起得挑最相关、最新的进展说。Harness就是那个聪明的秘书帮模型筛选信息。5. 多Agent协调Multi-Agent Orchestration复杂项目往往不是单个Agent能搞定的。Harness需要支持包工头模式——一个主Agent协调者接到任务后能派发给不同的专业Agent研究员去查资料、码农去写代码、测试员去跑单元测试最后把结果汇总。CrewAI这种框架就是专门干这个的它让每个Agent都有明确的角色Role、目标Goal和背景故事Backstory然后像导演拍戏一样调度它们协作。三种主流架构模式目前业界形成了三种比较成熟的Harness架构模式单Agent监督者模式Single-Agent Supervisor一个模型在一个循环里搞定所有事。适合边界清晰的任务比如客服机器人——有知识库、能查订单状态、能创建工单但都在一个大脑的统筹下。初始化器-执行器分离模式Initializer-Executor Split这是Anthropic力推的方案特别适合编程任务。初始化器像项目总监只做一次战略规划执行器像码农每次只专注一个功能点干完就撤。项目环境文件夹、git仓库、进度文件成了跨会话的共享记忆。多Agent协调模式Multi-Agent Coordination复杂项目用这个。Harness像交响乐团指挥调度不同专业Agent接力工作确保每个Agent拿到前一步的关键结果但又不会被无关的历史记录干扰。从提示工程到Harness工程这里有个特别有意思的行业趋势Prompt Engineering提示工程正在死去Harness Engineering脚手架工程正在崛起。以前模型表现不好我们第一反应是提示词写得不够好在再调调。但Hashimoto提出的Harness Engineering理念是每次Agent失败都应该视为系统工程问题来永久修复而不是当成提示词问题来重试。具体怎么做把踩过的坑写成规则塞进AGENTS.md文件下次遇到类似情况模型就知道避坑如果Agent老是忘记测试UI交互那就给它做个截图工具让验证过程机械化如果它老是不能正确解析API返回那就写个响应验证器OpenAI分享过一个案例他们的一个三人工程师团队用Harness Engineering的方法在开发Codex时实现了每个工程师每天3.5个Pull Request的产出而且代码全是AI生成的人工只负责审查。秘诀就在于他们给Harness写的linter错误消息都是教学式的——不仅告诉你错在哪还告诉你怎么改这样每次失败都变成了训练数据。未来的操作系统大战现在的局面很像1980年代的操作系统混战——DOS、Mac OS、Unix、Windows都在抢地盘。Agent Harness这个操作系统层也正在经历同样的阶段Anthropic的Claude Agent SDK走极简主义路线强调dumb loop, smart model——循环逻辑越简单越好 intelligence 全在模型里OpenAI的Agents SDK和Codex走代码优先路线用原生Python表达工作流而不是用什么图形化的DSLLangChain的LangGraph走显式状态图路线把Harness建模成明确的状态机两个节点调模型、调工具用条件边连接CrewAI走角色扮演路线强调多Agent协作和流程编排谁能成为最后的Windows或者Linux现在还不好说。但有一点是确定的模型和Harness正在协同进化。Claude Code的模型就是专门针对它所用的Harness做过后训练的——换了工具实现方式性能反而会下降。这种紧密耦合说明未来的AI系统不是万能模型通用Harness的简单组合而是深度适配的软硬一体方案。写在最后朋友们咱们回顾下计算机发展史从打孔纸带到汇编语言从DOS到Windows每一次编程门槛的降低都是因为出现了更强大的抽象层——操作系统隐藏了硬件细节高级语言隐藏了机器码细节框架隐藏了底层API细节。Agent Harness就是AI时代的下一个抽象层。它让我们不用再操心怎么给LLM凑上下文、怎么管理它的记忆、怎么防止它乱调用工具。我们只需要定义好目标IntentHarness就会帮我们把目标分解成计划调度合适的Agent执行验证结果最后交付成果。所以下次当你听到有人说我开发了一个AI Agent的时候你得知道——他其实开发的是一个Harness。真正的Agent是那个在Harness支撑下才显现出来的涌现行为Emergent Behavior。就像那句话说的“If you’re not the model, you’re the harness.”如果你不是那个模型你就是那个脚手架。在这个AI Agent爆发的2026年理解Harness就是理解未来十年AI应用开发的基石。下篇文章咱们聊聊怎么从零开始给自家业务搭一个轻量级的Agent Harness不用Docker不写几千行代码就像搭积木一样简单。感兴趣的朋友记得关注哦PS目前国内还是很缺AI人才的希望更多人能真正加入到AI行业共同促进行业进步增强我国的AI竞争力。想要系统学习AI知识的朋友可以看看我精心打磨的教程 http://blog.csdn.net/jiangjunshow教程通俗易懂高中生都能看懂还有各种段子风趣幽默从深度学习基础原理到各领域实战应用都有讲解我22年的AI积累全在里面了。注意教程仅限真正想入门AI的朋友否则看看零散的博文就够了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2497975.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…

wordpress后台更新后 前端没变化的解决方法

使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…

网络编程(Modbus进阶)

思维导图 Modbus RTU(先学一点理论) 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议,由 Modicon 公司(现施耐德电气)于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…

UE5 学习系列(二)用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…

利用最小二乘法找圆心和半径

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明&#xff1a;假设每台服务器已…

XML Group端口详解

在XML数据映射过程中&#xff0c;经常需要对数据进行分组聚合操作。例如&#xff0c;当处理包含多个物料明细的XML文件时&#xff0c;可能需要将相同物料号的明细归为一组&#xff0c;或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码&#xff0c;增加了开…

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造&#xff0c;完美适配AGV和无人叉车。同时&#xff0c;集成以太网与语音合成技术&#xff0c;为各类高级系统&#xff08;如MES、调度系统、库位管理、立库等&#xff09;提供高效便捷的语音交互体验。 L…

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)

题目&#xff1a;3442. 奇偶频次间的最大差值 I 思路 &#xff1a;哈希&#xff0c;时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况&#xff0c;哈希表这里用数组即可实现。 C版本&#xff1a; class Solution { public:int maxDifference(string s) {int a[26]…

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…

【Axure高保真原型】引导弹窗

今天和大家中分享引导弹窗的原型模板&#xff0c;载入页面后&#xff0c;会显示引导弹窗&#xff0c;适用于引导用户使用页面&#xff0c;点击完成后&#xff0c;会显示下一个引导弹窗&#xff0c;直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…

接口测试中缓存处理策略

在接口测试中&#xff0c;缓存处理策略是一个关键环节&#xff0c;直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性&#xff0c;避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明&#xff1a; 一、缓存处理的核…

龙虎榜——20250610

上证指数放量收阴线&#xff0c;个股多数下跌&#xff0c;盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型&#xff0c;指数短线有调整的需求&#xff0c;大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的&#xff1a;御银股份、雄帝科技 驱动…

观成科技:隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具&#xff0c;该工具基于TUN接口实现其功能&#xff0c;利用反向TCP/TLS连接建立一条隐蔽的通信信道&#xff0c;支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式&#xff0c;适应复杂网…

铭豹扩展坞 USB转网口 突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…

未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?

编辑&#xff1a;陈萍萍的公主一点人工一点智能 未来机器人的大脑&#xff1a;如何用神经网络模拟器实现更智能的决策&#xff1f;RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战&#xff0c;在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…

Linux应用开发之网络套接字编程(实例篇)

服务端与客户端单连接 服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …

华为云AI开发平台ModelArts

华为云ModelArts&#xff1a;重塑AI开发流程的“智能引擎”与“创新加速器”&#xff01; 在人工智能浪潮席卷全球的2025年&#xff0c;企业拥抱AI的意愿空前高涨&#xff0c;但技术门槛高、流程复杂、资源投入巨大的现实&#xff0c;却让许多创新构想止步于实验室。数据科学家…

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向&#xff1a; 逆向设计 通过神经网络快速预测微纳结构的光学响应&#xff0c;替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…