访谈 | 吴恩达全景解读 AI Agents 发展现状:多智能体、工具生态、评估体系、语音栈、Vibe Coding 及创业建议一文尽览

news2025/6/5 23:31:56

在最新的 LangChain Interrupt 大会上(2025),LangChain 联合创始人 & CEO Harrison Chase 与吴恩达(Andrew Ng)就 AI Agnets 的发展现状,进行了一场炉边谈话。

吴恩达回顾了与 LangChain 的渊源,提出用 “Agenticness” 来终结“是否为智能体”的争论,阐述了当前构建智能体的机会与挑战,强调构建端到端系统、评估框架及工具使用等技能重要性。

还提及被低估的工具如语音栈,探讨 AI 辅助编码、MCP 标准、多智能体系统、Vibe Coding 等话题。

最后吴恩达对创业公司给出速度与技术知识方面的建议。

“Agenticness” 的提出与演变

在 AI 领域,什么才算是“Agent”?这个问题曾经引发了无数争论。吴恩达提出,与其纠结于定义 Agent 的边界,不如关注“Agenticness” —— 也就是系统自主性的程度。这一观点为社区带来了全新的视角。

他认为,Agentic 系统并不是非黑即白的存在,而是有不同的自主性层级。无论是高度自主的复杂系统,还是只具备部分自动化能力的简单流程,都可以被视为 Agentic 系统。关键在于,我们如何衡量和利用这种自主性。

这种思路的转变,极大减少了社区内部的无谓争论。大家不再纠结于“这是不是 Agent”,而是更关注如何提升系统的 Agentic 能力。这样一来,讨论的重心回归到实际应用和技术创新上,推动了整个行业的进步。

Agentic 系统在实际业务中的应用现状

在企业实际应用中,Agentic 系统的落地场景非常广泛。吴恩达观察到,目前大多数企业采用的 Agentic 工作流,往往是线性流程,或者只包含少量分支和循环。这种结构简单、易于实现,适合大部分业务需求。

当然,复杂的 Agentic 工作流同样具有巨大价值。比如在需要多轮推理、动态决策的场景下,复杂 Agentic 系统能够展现出更强的能力。不过,从数量上看,当前市场上仍以简单流程为主,复杂系统还未大规模普及。

将传统业务流程转化为 Agentic 工作流,依然面临不少挑战。比如,如何合理拆解任务、确定每一步的粒度、以及如何评估系统性能等。这些问题的解决,需要团队具备更系统的流程设计和技术能力。

构建 Agentic 系统所需的关键技能

要想高效构建 Agentic 系统,团队需要掌握一系列关键技能。首先是流程拆解能力,能够把复杂业务分解为可管理的微任务。其次是数据集成和“管道”搭建,确保各环节顺畅衔接。

评估体系(evals)的建立同样不可或缺。只有通过系统化的评估,才能及时发现和定位问题,持续优化每一个环节。吴恩达指出,很多团队在这方面投入不足,往往依赖人工评估,导致效率低下。

经验丰富的团队,往往能更快做出正确决策。他们善于判断哪些环节值得优化,哪些问题需要绕开。而新手团队则容易陷入“死胡同”,在某个细节上反复投入却收效甚微。这种“直觉”与“经验”,是 Agentic 系统开发中极为宝贵的财富。

AI 工具生态的丰富与“乐高积木”类比

随着 AI 技术的不断发展,相关工具也日益丰富。吴恩达形象地将这些工具比作“乐高积木”。每一种工具就像不同颜色、形状的积木,只有积木足够多样,才能拼出更复杂、更有创意的作品。

在实际开发中,团队往往需要灵活组合多种工具。比如,LangGraph、RAG、聊天机器人、记忆管理、评估体系、护栏机制等,每一种都是独特的“积木”。熟练掌握这些工具,能够极大提升开发效率和创新能力。

值得注意的是,随着技术进步,最佳实践也在不断变化。比如,随着大模型上下文窗口的扩大,RAG 的调优难度大大降低,更多数据可以直接放入上下文。这要求开发者持续学习,及时调整自己的工具组合和开发策略。

被低估的“乐高积木”:评估体系与语音栈

在众多 AI 工具中,评估体系(evals)和语音栈(voice stack)常常被低估。虽然社区讨论很多,但真正落地的团队并不多。吴恩达建议,评估体系不必一开始就追求完美,可以先做一个简单的自动化评估,逐步完善。

语音栈则在企业级应用中展现出巨大潜力。与文本输入相比,语音交互能显著降低用户门槛,让更多人愿意参与和表达。尤其是在大型企业和新兴应用场景中,语音栈有望带来全新的用户体验。

此外,语音交互还涉及到延迟控制、背景噪音处理等细节优化。通过这些“小技巧”,可以大幅提升用户体验,让语音 Agentic 系统更贴近实际需求。

AI 辅助编程与“Vibe Coding”现象

AI 辅助编程已经成为开发者日常工作的重要组成部分。吴恩达认为,AI 工具极大提升了开发效率,让团队能够更快实现想法。不过,“Vibe Coding”这个词容易让人误解,仿佛只需凭感觉编程,实际上这是一项高强度的智力劳动。

他强调,AI 辅助编程并不会取代人类的思考和判断。相反,开发者需要具备更强的抽象能力和问题拆解能力,才能充分发挥 AI 工具的价值。对于非工程师来说,学会基础编程同样能显著提升工作效率。

在 AI 时代,懂得如何与计算机沟通、如何精确表达需求,已经成为每个人都应具备的核心能力。无论是开发者还是其他岗位,只要掌握了这些技能,都能在工作中获得更高的生产力。

MCP 协议与多智能体系统的未来

MCP 协议的出现,为数据和工具的集成带来了新的标准。吴恩达认为,MCP 能够显著降低开发门槛,让不同模型和数据源之间的集成变得更加高效。不过,目前 MCP 还处于早期阶段,实际应用中还存在不少挑战。

多智能体系统(multi-agent)则是另一个值得关注的方向。虽然目前还没有大规模落地的案例,但随着协议和工具的完善,未来多智能体协作有望带来更多创新应用。

对于开发者来说,关注这些新兴标准和技术趋势,能够帮助团队在未来竞争中占据先机。持续学习和尝试,是应对技术快速演进的最佳策略。

创业建议:速度与技术深度为王

在 AI 创业领域,吴恩达总结了两条最重要的成功经验。首先是执行速度,优秀团队往往能以惊人的速度推进项目,远超传统企业。其次是技术深度,真正懂技术的人,才能在关键时刻做出正确决策。

当然,市场、销售、定价等商业知识同样重要,但这些知识相对容易获得。相比之下,技术的快速演进和复杂性,使得技术型人才成为最稀缺的资源。

他鼓励有志于 AI 创业的人,不断提升自己的技术能力,勇于试错、快速迭代。只有这样,才能在激烈的市场竞争中脱颖而出。

视频链接:Andrew Ng: State of AI Agents | LangChain Interrupt


AI 技术日新月异,我们都应该持续学习和拥抱变化。

只有不断尝试新工具、学习新理念,才能在这个时代保持竞争力。

如果觉得文章对你有帮助,👏 欢迎点赞、分享、推荐,让更多朋友知道。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2398246.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

连接关键点:使用 ES|QL 联接实现更丰富的可观测性洞察

作者:来自 Elastic Luca Wintergerst ES|QL 的 LOOKUP JOIN 现已进入技术预览阶段,它允许你在查询时对日志、指标和追踪进行丰富处理,无需在摄取时进行非规范化。动态添加部署、基础设施或业务上下文,减少存储占用,加速…

Flask + Celery 应用

目录 Flask Celery 应用项目结构1. 创建app.py2. 创建tasks.py3. 创建celery_worker.py4. 创建templates目录和index.html运行应用测试文件 Flask Celery 应用 对于Flask与Celery结合的例子,需要创建几个文件。首先安装必要的依赖: pip install flas…

奥威BI+AI数据分析:企业数智化转型的加速器

在当今数据驱动的时代,企业对于数据分析的需求日益增长。奥威BIAI数据分析的组合,正成为众多企业数智化转型的加速器。 奥威BI以其强大的数据处理和可视化能力著称。它能够轻松接入多种数据源,实现数据的快速整合与清洗。通过内置的ETL工具&…

python打卡day43

复习日 作业: kaggle找到一个图像数据集,用cnn网络进行训练并且用grad-cam做可视化 进阶:并拆分成多个文件 找了个街头食物图像分类的数据集Popular Street Foods(其实写代码的时候就开始后悔了),原因在于&…

Linux --进程优先级

概念 什么是进程优先级,为什么需要进程优先级,怎么做到进程优先级这是本文需要解释清楚的。 优先级的本质其实就是排队,为了去争夺有限的资源,比如cpu的调度。cpu资源分配的先后性就是指进程的优先级。优先级高的进程有优先执行的…

安装和配置 Nginx 和 Mysql —— 一步一步配置 Ubuntu Server 的 NodeJS 服务器详细实录6

前言 昨天更新了四篇博客,我们顺利的 安装了 ubuntu server 服务器,并且配置好了 ssh 免密登录服务器,安装好了 服务器常用软件安装, 配置好了 zsh 和 vim 以及 通过 NVM 安装好Nodejs,还有PNPM包管理工具 。 作为服务器的运行…

图解gpt之注意力机制原理与应用

大家有没有注意到,当序列变长时,比如翻译一篇长文章,或者处理一个长句子,RNN这种编码器就有点力不从心了。它把整个序列信息压缩到一个固定大小的向量里,信息丢失严重,而且很难记住前面的细节,特…

【Oracle】视图

个人主页:Guiat 归属专栏:Oracle 文章目录 1. 视图基础概述1.1 视图的概念与特点1.2 视图的工作原理1.3 视图的分类 2. 简单视图2.1 创建简单视图2.1.1 基本简单视图2.1.2 带计算列的简单视图 2.2 简单视图的DML操作2.2.1 通过视图进行INSERT操作2.2.2 通…

更强劲,更高效:智源研究院开源轻量级超长视频理解模型Video-XL-2

长视频理解是多模态大模型关键能力之一。尽管OpenAI GPT-4o、Google Gemini等私有模型已在该领域取得显著进展,当前的开源模型在效果、计算开销和运行效率等方面仍存在明显短板。近日,智源研究院联合上海交通大学等机构,正式发布新一代超长视…

2025.6.3学习日记 Nginx 基本概念 配置 指令 文件

1.初始nginx Nginx(发音为 “engine x”)是一款高性能的开源 Web 服务器软件,同时也具备反向代理、负载均衡、邮件代理等功能。它由俄罗斯工程师 Igor Sysoev 开发,最初用于解决高并发场景下的性能问题,因其轻量级、高…

【连接器专题】案例:产品测试顺序表解读与应用

在查看SD卡座连接器的规格书,一些测试报告时,你可能会看到如下一张产品测试顺序表。为什么会出现一张测试顺序表呢? 测试顺序表的使用其实定义测试环节的验证的“路线图”和“游戏规则”,本文就以我人个经验带领大家一起看懂这张表并理解其设计逻辑。 测试顺序表结构 测试…

星动纪元的机器人大模型 VPP,泛化能力效果如何?与 VLA 技术的区别是什么?

点击上方关注 “终端研发部” 设为“星标”,和你一起掌握更多数据库知识 VPP 利用了大量互联网视频数据进行训练,直接学习人类动作,减轻了对于高质量机器人真机数据的依赖,且可在不同人形机器人本体之间自如切换,这有望…

4000万日订单背后,饿了么再掀即时零售的“效率革命”

当即时零售转向价值深耕,赢面就是综合实力的强弱。 文|郭梦仪 编|王一粟 在硝烟弥漫的外卖行业“三国杀”中,饿了么与淘宝闪购的日订单量竟然突破了4000万单。 而距淘宝闪购正式上线,还不到一个月。 在大额福利优惠…

入门AJAX——XMLHttpRequest(Get)

一、什么是 AJAX AJAX Asynchronous JavaScript And XML(异步的 JavaScript 和 XML)。 1、XML与异步JS XML: 是一种比较老的前后端数据传输格式(已经几乎被 JSON 代替)。它的格式与HTML类似,通过严格的闭合自定义标…

5分钟申请edu邮箱【方案本周有效】

这篇文章主要展示的是成果。如果你是第1次看见我的内容,具体的步骤请翻看往期的两篇作品。先看更正补全,再看下一个。 建议你边看边操作。 【更正补全】edu教育申请通过方案 本周 edu教育邮箱注册可行方案 #edu邮箱 伟大无需多言 我已经验证了四个了…

闲谈PMIC和SBC

今天不卷,简单写点。 在ECU设计里,供电芯片选型是逃不开的话题,所以聊聊PMIC或者SBC的各自特点,小小总结下。 PMIC,全称Power Management Intergrated Circuits,听名字就很专业:电源管理&…

Java垃圾回收机制深度解析:从理论到实践的全方位指南

Java垃圾回收(GC)是Java虚拟机(JVM)的核心功能,它自动管理内存分配与回收,避免了C/C中常见的内存泄漏问题。本文将深入剖析Java垃圾回收的工作原理、算法实现、收集器类型及调优策略,助你全面掌握JVM内存管理的精髓。 一、垃圾回收基础概念 …

论文阅读:CLIP:Learning Transferable Visual Models From Natural Language Supervision

从自然语言监督中学习可迁移的视觉模型 虽然有点data/gpu is all you need的味道,但是整体实验和谈论丰富度上还是很多的,也是一篇让我多次想放弃的文章,因为真的是非常长的原文和超级多的实验讨论,隔着屏幕感受到了实验的工作量之…

在图像分析算法部署中应对流行趋势的变化|文献速递-深度学习医疗AI最新文献

Title 题目 Navigating prevalence shifts in image analysis algorithm deployment 在图像分析算法部署中应对流行趋势的变化 01 文献速递介绍 机器学习(ML)已开始革新成像研究与实践的诸多领域。然而,医学图像分析领域存在显著的转化鸿…

CAMEL-AI开源自动化任务执行助手OWL一键整合包下载

OWL 是由 CAMEL-AI 团队开发的开源多智能体协作框架,旨在通过动态智能体交互实现复杂任务的自动化处理,在 GAIA 基准测试中以 69.09 分位列开源框架榜首,被誉为“Manus 的开源平替”。我基于当前最新版本制作了免安装一键启动整合包。 CAMEL-…