用操作系统类比彻底搞懂 AI Agent:进程、系统调用与上下文窗口

news2026/5/17 19:01:43
用操作系统类比彻底搞懂 AI Agent进程、系统调用与上下文窗口引言很多人第一次接触 AI Agent会立刻被一堆新词包围Tool Use、Function Calling、RAG、Memory、Orchestrator、Multi-Agent、Context Compression。这些词看起来很新但它们背后要解决的问题并不新。如果你学过操作系统会发现 Agent 系统并不是凭空长出来的另一个世界。它更像是把操作系统里已经出现过的问题换了一批资源、换了一套接口、换了一种计算单元然后重新演了一遍。在操作系统里核心资源是 CPU、内存、文件、设备和网络在 Agent 系统里核心资源变成了 token、上下文窗口、推理时间、外部工具和知识库。在操作系统里程序不能随便访问硬件必须通过系统调用进入内核在 Agent 系统里模型不能自己搜索网页、运行代码、查询数据库必须通过工具调用交给外部运行环境执行。这不是说 Agent 和操作系统完全一样。更准确的说法是它们面对的是一组高度相似的系统问题。如何划分执行边界如何隔离权限如何调度任务如何管理稀缺资源如何把慢而大的外部存储接入快速计算过程如何处理并发、竞争、失败和一致性理解了这一点Agent 就不再只是一个会聊天的大模型。它开始变成一个可以被工程化、被调度、被治理的系统。一、Agent 不是只有 Model很多入门文章会把 Agent 讲成大模型 提示词。这个说法太薄了。在真实工程里更有解释力的结构是Agent Model HarnessModel负责推理Harness负责把推理接到真实世界。Harness 可以理解为 Agent 的运行时环境。它接收用户输入维护上下文暴露工具解析模型输出执行函数调用处理工具返回再把结果塞回模型。模型本身只是在 token 空间里计算真正让它拥有外部行动能力的是 Harness。图 1Agent Model Harness 的基本结构。这个视角很重要。因为只看 Model你会觉得 Agent 的能力全在模型聪不聪明但看见 Harness 之后你会意识到 Agent 的工程能力来自一整套运行机制上下文如何组织工具如何注册权限如何限制结果如何校验多个 Agent 如何调度失败时如何重试或回滚这已经不是单纯的提示词工程而是系统工程。二、进程和线程Sub-Agent 带来的并发问题在操作系统里进程是资源边界线程是执行单元。同一个进程里的多个线程共享内存所以线程之间通信很快但也容易出现竞争条件。不同进程之间默认隔离彼此不能随便读写对方内存跨进程通信必须通过管道、Socket、共享内存、消息队列等机制。Agent 世界正在重演这件事。当一个任务足够复杂时我们会把它拆给多个 sub-Agent一个 Agent 负责搜索资料一个 Agent 负责阅读代码一个 Agent 负责写草稿一个 Agent 负责审查事实一个 Agent 负责生成最终答案这样做的好处很明显并行、分工、上下文更专注。但问题也随之出现这些 Agent 之间到底共享什么如果所有 Agent 共享同一份上下文通信成本很低但状态会变得混乱。一个 Agent 写入的结论另一个 Agent 可能还没看见一个 Agent 基于旧信息做了判断另一个 Agent 已经把前提改掉了。共享上下文越方便竞争条件越容易出现。如果每个 Agent 都有独立上下文隔离性会更好但通信成本会上升。它们必须显式传递结果必须约定输出格式必须有人负责合并和裁决。图 2操作系统与 Agent 系统的核心类比。所以 Multi-Agent 的难点不只是多叫几个模型一起干活。真正的难点是并发系统的老问题谁能访问谁的状态谁对最终结果负责多个 Agent 输出冲突时听谁的中间结果是否需要锁定任务失败后如何重试是否存在循环等待、重复工作和无效协商操作系统里的死锁、竞争、一致性问题到了 Agent 系统里并没有消失只是换了一身自然语言的衣服。三、系统调用Tool Use 是权限边界上的洞用户程序想读文件、访问网络、操作硬件不能直接碰底层资源。它必须通过系统调用进入内核由内核检查权限、执行操作再把结果返回给用户程序。这个机制的关键不只是让程序能访问硬件更是让程序不能随便访问硬件。Agent 的 Tool Use 也是类似逻辑。模型本身不能真的打开浏览器不能真的运行代码不能真的查数据库。它只能生成一个结构化请求例如{tool:search_web,arguments:{query:Agent tool use function calling}}Harness 接到这个请求后会判断这个工具是否存在当前 Agent 是否有权限使用参数是否合法是否需要用户确认执行结果是否可信返回内容是否应该进入上下文这就是 Agent 世界里的系统调用。图 3Tool Use 与系统调用的相似路径。这个类比能帮助我们理解 Tool Use 的本质它不是给模型加插件这么简单而是在权限边界上打一个受控的洞。能力从这个洞里流进来风险也被这个洞隔住。如果没有 Harness 做边界模型就会变成一个没有权限模型的自动化脚本。如果没有工具模型就只能困在上下文窗口里说话。一个可用的 Agent 系统必须同时拥有能力入口和边界控制。四、Cache 和虚拟内存Context Window 是最贵的内存在 Agent 系统里最稀缺的资源是什么很多人会说是模型能力。这个答案不算错但从工程角度看真正每天都在被消耗、被压缩、被调度的资源是上下文窗口。Context Window 就像 Agent 的工作内存。模型每一次推理只能看到当前上下文窗口里的内容。窗口外的内容除非被重新检索、重新摘要、重新放进来否则对模型来说就相当于不存在。这和 CPU Cache / 内存 / 磁盘的分层非常像当前推理里的关键指令和目标像寄存器最近几轮对话和工具返回像高速缓存长期记忆、项目文档和历史记录像主存或磁盘压缩摘要像被换页出去后留下的索引上下文窗口满了怎么办Agent 框架通常会做几件事删除不重要的历史消息把长对话压缩成摘要把文件内容放到外部存储需要时再检索只保留任务目标、约束、当前计划和关键事实这就是语义版本的内存管理。图 4Context Window 与存储分层。这里有一个很容易被忽略的问题压缩不是无损的。一段对话被压缩成摘要后细节会丢失语气会丢失反例会丢失某些边界条件也可能被丢失。操作系统把内存页换到磁盘理论上字节还能原样换回来但 Agent 把上下文压缩成语义摘要再恢复时就不一定是原来的信息了。所以 Context Compression 不是简单的省 token 技巧它会直接影响系统的一致性和可靠性。五、文件系统挂载RAG 是把知识库接进运行时如果所有知识都必须塞进上下文窗口Agent 很快就会崩溃。现实任务需要大量外部知识产品文档、代码仓库、数据库记录、用户手册、论文、工单、会议纪要、历史聊天记录。它们体积很大但每次推理真正需要的只是其中一小部分。RAG 的作用就是把这些外部知识库挂载到 Agent 的运行时里。它不要求所有内容常驻上下文而是在需要时根据当前问题生成查询去外部知识库检索相关片段对结果排序、过滤和重组把少量高相关内容放入上下文让模型基于这些内容生成答案或行动这很像操作系统挂载外部存储。磁盘容量大、便宜、慢内存容量小、贵、快。文件系统和虚拟内存的价值就是用廉价的大容量存储补偿昂贵的快速内存。RAG 也是一样外部知识库容量大、便宜、慢上下文窗口容量小、贵、快。检索系统负责把可能有用的知识按需搬进上下文窗口。图 5RAG 作为 Agent 的外部知识挂载。但 RAG 也有自己的工程陷阱。检索不到模型会缺事实检索太多窗口会被噪声淹没切片太碎语义断裂切片太长召回不准排序不好关键证据进不来权限没做好用户可能看到不该看的知识。所以 RAG 不只是向量数据库 embedding。它本质上是 Agent 的知识 I/O 子系统。六、Harness 和 OrchestratorAgent 系统的内核与调度器如果把 Model 看成计算核心那么 Harness 就像 Agent 的内核。它至少要负责这些事情接收输入并构造上下文维护可用工具列表管理工具权限执行工具调用处理工具返回记录中间状态控制循环次数在失败时重试、降级或终止当系统里只有一个 Agent 时Harness 已经很重要。当系统里有多个 Agent 时还需要一个 Orchestrator。Orchestrator 做的事很像调度器把复杂任务拆成多个子任务决定哪个 Agent 先运行决定哪些 Agent 可以并行控制每个 Agent 的上下文和工具权限汇总多个 Agent 的输出处理冲突、失败和重复工作图 6Multi-Agent 的调度结构。到这里Agent 架构的轮廓就比较清楚了。Model 不是全部。Tool 不是外挂。Memory 不是聊天记录。RAG 不是简单搜索。Multi-Agent 也不是让一堆模型互相聊天。它们共同组成了一个运行系统Agent 组件类似 OS 概念主要作用ModelCPU / 执行核心根据上下文进行推理、规划和生成Harness内核 / 运行时管理上下文、工具、权限、执行循环Tool Use系统调用让模型通过受控接口访问外部能力Context WindowCache / 内存保存当前推理可见的信息Memory主存 / 持久化状态保存跨轮次、跨任务的状态和经验RAG文件系统挂载按需接入外部知识库Orchestrator调度器拆分任务、调度多个 Agent、合并结果Sub-Agent进程 / 线程承担局部任务带来并发和协作问题七、开发者应该如何理解 Agent如果你是开发者我建议先不要把 Agent 理解成更聪明的聊天机器人。更好的理解方式是Agent 是一个以大模型为执行核心的受控运行系统。它有输入有状态有工具有权限有调度有失败有资源限制也有副作用。它会访问外部世界会读写文件会调用 API会执行代码会把中间结果传给下一个环节。一旦系统有了这些特征我们就不能只用提示词写得好不好来评价它。我们还要问工具权限是否最小化上下文是否可追踪RAG 结果是否有证据来源多 Agent 输出是否可合并失败是否可恢复成本是否可控制关键步骤是否可审计这些问题听起来很工程甚至有点老派。但这正是 Agent 从 Demo 走向真实应用必须补上的部分。八、结尾老问题新资源操作系统花了几十年才把进程、线程、系统调用、虚拟内存、文件系统、调度器这些问题逐渐想清楚。Agent 时代正在把同样的问题重新答一遍。只不过这一次资源从 CPU 和内存变成了 token 和推理时间程序从机器指令变成了自然语言系统调用从read()、write()、open()变成了工具调用文件系统挂载从磁盘和网络存储变成了向量库、文档库和企业知识库。所以学习 Agent 不应该只学 API也不应该只学提示词。真正值得建立的是系统感你要知道模型在哪里计算工具在哪里执行状态在哪里保存知识在哪里检索权限在哪里收口多个 Agent 之间如何协作以及当它们出错时谁来兜底。当你开始这样看 Agent它就不再是一个神秘的新名词而是一套可以被分析、设计和实现的工程系统。这也是开发者进入大模型应用时代时最值得补上的第一课。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2618922.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…

wordpress后台更新后 前端没变化的解决方法

使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…

网络编程(Modbus进阶)

思维导图 Modbus RTU(先学一点理论) 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议,由 Modicon 公司(现施耐德电气)于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…

UE5 学习系列(二)用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…

利用最小二乘法找圆心和半径

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明&#xff1a;假设每台服务器已…

XML Group端口详解

在XML数据映射过程中&#xff0c;经常需要对数据进行分组聚合操作。例如&#xff0c;当处理包含多个物料明细的XML文件时&#xff0c;可能需要将相同物料号的明细归为一组&#xff0c;或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码&#xff0c;增加了开…

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造&#xff0c;完美适配AGV和无人叉车。同时&#xff0c;集成以太网与语音合成技术&#xff0c;为各类高级系统&#xff08;如MES、调度系统、库位管理、立库等&#xff09;提供高效便捷的语音交互体验。 L…

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)

题目&#xff1a;3442. 奇偶频次间的最大差值 I 思路 &#xff1a;哈希&#xff0c;时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况&#xff0c;哈希表这里用数组即可实现。 C版本&#xff1a; class Solution { public:int maxDifference(string s) {int a[26]…

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…

【Axure高保真原型】引导弹窗

今天和大家中分享引导弹窗的原型模板&#xff0c;载入页面后&#xff0c;会显示引导弹窗&#xff0c;适用于引导用户使用页面&#xff0c;点击完成后&#xff0c;会显示下一个引导弹窗&#xff0c;直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…

接口测试中缓存处理策略

在接口测试中&#xff0c;缓存处理策略是一个关键环节&#xff0c;直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性&#xff0c;避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明&#xff1a; 一、缓存处理的核…

龙虎榜——20250610

上证指数放量收阴线&#xff0c;个股多数下跌&#xff0c;盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型&#xff0c;指数短线有调整的需求&#xff0c;大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的&#xff1a;御银股份、雄帝科技 驱动…

观成科技:隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具&#xff0c;该工具基于TUN接口实现其功能&#xff0c;利用反向TCP/TLS连接建立一条隐蔽的通信信道&#xff0c;支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式&#xff0c;适应复杂网…

铭豹扩展坞 USB转网口 突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…

未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?

编辑&#xff1a;陈萍萍的公主一点人工一点智能 未来机器人的大脑&#xff1a;如何用神经网络模拟器实现更智能的决策&#xff1f;RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战&#xff0c;在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…

Linux应用开发之网络套接字编程(实例篇)

服务端与客户端单连接 服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …

华为云AI开发平台ModelArts

华为云ModelArts&#xff1a;重塑AI开发流程的“智能引擎”与“创新加速器”&#xff01; 在人工智能浪潮席卷全球的2025年&#xff0c;企业拥抱AI的意愿空前高涨&#xff0c;但技术门槛高、流程复杂、资源投入巨大的现实&#xff0c;却让许多创新构想止步于实验室。数据科学家…

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向&#xff1a; 逆向设计 通过神经网络快速预测微纳结构的光学响应&#xff0c;替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…