AI Agent不是你以为的那样
系列《AI Agent 从原理到实战 —— 解密 Claude Code 背后的工程智慧》 第1篇引言你大概有过这样的体验打开 ChatGPT说一句帮我写封邮件拒绝周五的会议邀请语气委婉一点几秒钟后一封措辞得体的邮件就出来了。复制粘贴发送完事。但如果你说的是帮我把这个项目的测试覆盖率从 40% 提到 80%呢这不是写一段文字就能解决的事。它需要读代码、理解业务逻辑、找出没覆盖的分支、写测试用例、跑测试、看失败原因、改测试、再跑——可能要循环几十次。前者是一个工具在帮你后者才接近一个Agent在帮你。这两件事的区别远比大多数人以为的要大。而市面上很多自称AI Agent的产品本质上还停留在第一种——只是把它包装得像第二种。回到起点最早的 AI Agent 长什么样要理解什么是真正的 Agent值得回头看几个里程碑。2013年DeepMind 的 DQN 打 Atari 游戏。一个神经网络输入是游戏画面的像素输出是手柄操作。没有人写规则告诉它看到敌人要开枪它自己从零开始通过反复试错学会了玩几十款游戏——有些甚至超过了人类玩家的水平。2019年OpenAI Five 打 Dota 2。五个 AI 组队击败了 Dota 2 世界冠军 OG。Dota 2 是一个信息极其复杂的游戏地图有战争迷雾英雄有上百个技能需要团队配合、资源分配、时机判断。OpenAI Five 没有任何硬编码的策略全靠自我对弈训练出来。同年DeepMind 的 AlphaStar 打星际争霸。星际争霸被认为是 AI 最难攻克的游戏之一——实时操作、不完全信息、长期规划缺一不可。AlphaStar 达到了欧服大师段位超过 99.8% 的人类玩家。还是2019年腾讯的绝悟打王者荣耀。在与 KPL王者荣耀职业联赛职业选手的对抗中取得了胜利。又一个纯粹靠训练、没有人工策略的 AI。这些 Agent 的共同点把这四个案例放在一起看有一个关键共性Agent 就是模型本身。DQN 是一个神经网络。OpenAI Five 是五个神经网络。AlphaStar 是一个神经网络。绝悟也是。它们的智能不是外面套的代码给的是训练出来的。没有人写了一个if enemy_nearby then attack()的规则——如果靠这种规则它们不可能超越人类因为写规则的人本身就是人类天花板就在那里。这就引出了一个核心观点。Agent 训练出来的模型不是规则拼出来的工作流现在市面上有大量AI Agent 平台它们的工作方式通常是这样的用户定义一个流程比如先搜索再总结再发邮件每一步调用一次 LLM步骤之间用硬编码的逻辑串起来这不是 Agent。这是一条流水线LLM 只是流水线上的一个零件。决策权不在模型手里在写流程的人手里。这种做法有一个学术名字叫GOFAIGood Old-Fashioned AI也就是经典符号人工智能。上世纪六七十年代的主流思路把世界建模成规则和符号用逻辑推理解决问题。专家系统就是这条路的产物。它能解决一些结构化的、边界清晰的问题但碰到真实世界的复杂性就崩了——因为你不可能穷举所有规则。给 LLM 套一个 if-else 外壳本质上就是穿了新衣服的 GOFAI。它看起来时髦但走的是同一条死胡同。真正的 Agent 应该是模型自己决定下一步做什么。它看到当前状态判断需要什么信息或操作选择合适的工具执行观察结果再决定下一步。整个决策链条是模型的推理能力驱动的不是预设的流程图驱动的。那程序员的角色是什么如果 Agent 的智能来自模型模型又不是我们训练的那是 Anthropic、OpenAI 这些公司的事那我们干什么这里有一个类比值得记住模型是司机代码是车。你造的不是司机你造的是车。一个优秀的司机模型坐进一辆没有方向盘的车里哪儿也去不了。而你的工作就是造一辆好车——有方向盘、有仪表盘、有油门刹车、有导航系统——让司机能充分发挥能力。这辆车在 AI Agent 领域有一个专门的名字Harness。Harness 这个词在中文里不太好直译。它的本意是线具或挽具——套在马身上的那套装备让马的力量能被有效利用。在 AI Agent 语境下你可以把它理解成驾驶舱它不提供动力智能但它决定了动力能不能被正确释放。Claude Code 就是这样一个 Harness。它本身不是 Agent——Claude 模型才是 Agent。Claude Code 是给 Claude 造的那辆车让它能在你的电脑上读文件、写代码、跑命令、搜索信息。小结回顾一下这篇文章的核心观点AI Agent 的智能来自训练出来的模型不是外面包的规则和流程给 LLM 套 if-else 外壳的做法本质是老式符号 AI 的翻版有明确的天花板我们程序员、产品经理、各行各业的从业者的角色不是造司机而是造车这辆车叫 Harness那这辆车到底长什么样它最核心的结构是什么下一篇我们来看 AI Agent 最简单也最重要的一个机制——Agent Loop。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2474756.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!