【卷卷观察】Physical AI(具身智能)崛起 + 开源效率革命——AI正在从“数字“走向“物理“

news2026/4/28 13:48:31
结论先挂出来AI这波浪潮正在发生结构性分化一边是数字世界的agent疯狂落地一边是物理世界的AI开始暴走。两条线都在跑但物理AI这一支很多人还没真正重视。上周末跟一个创业的朋友吃饭他在做具身智能方向就是让AI控制机械臂、干体力活那种。聊到一半他突然说了一句话让我愣了两秒你知道吗我们现在拿一块NVIDIA H100跑物理模拟一天的成本是数字AI agent的50倍。数字AI agent输入文字、输出文字token成本一降再降GLM-4.7或Gemini 2.5 Ultra一顿火锅钱能跑几十万次。物理AI agent输入传感器数据、输出电机控制物理模拟实时控制硬件延迟一套下来贵到离谱。这个对比太鲜明了也太容易被忽视。圈内都在聊Agent、大模型、GPT-5但Physical AI这个赛道正在闷声搞大事。一、Physical AI具身智能是什么为什么突然起来了先说清楚这个概念。Physical AI具身智能不是某个具体产品而是一类AI系统的统称——这些系统的输入输出都跟物理世界直接相关视觉、触觉、力反馈、电机控制、自动驾驶的路径规划。简单说就是让AI长出手和脚真正去搬东西、开车子、控制机器人。IBM最近发了一篇博客讲这个概念核心观点是AI正在从纯数字决策进化到物理世界交互。以前AI的战场在服务器机房现在开始往工厂、仓库、马路上渗透。为什么现在起来了三个原因撞一块了传感器便宜了。激光雷达、深度相机、力矩传感器过去五年价格跌了70%以上。一个工业级3D视觉传感器五年前要8万现在1万多就能拿下。模型推理效率上来了。开源社区出了好多针对机器人控制的轻量模型延迟从原来的100毫秒压到了20毫秒以内。实时控制要求毫秒级响应这个跨越很关键。英伟达和Google在基础设施侧持续砸钱。Blackwell架构的GPU专门为物理模拟优化了内存带宽Google的TPU v5推理物理模型的速度比上一代快了3倍。成本降了部署就变得可行了。但我得泼一盆冷水。Physical AI现在有两个硬伤一是数据太难获取数字AI可以从互联网爬几十亿token物理AI需要真实的物理交互数据这玩意采集成本极高且效率低下二是仿真环境和真实物理世界之间的sim2real gap仿真到现实的迁移差距依然是未解决的难题。你在仿真里训练得再好拿到真机上跑效果经常打七折。这不是唱衰是现实。Physical AI是长期方向但短期内别指望它替代人工流水线。二、开源模型效率革命小米MiMo是个什么信号VentureBeat上周发了一篇报道讲小米开源了MiMo-V2.5和V2.5-Pro两个模型。参数规模没透露但评测数据很能打——推理效率比同档次模型高40%价格只有GPT-5.5的三十分之一。我的判断是开源社区正在用一种很野的方式逼近闭源模型的性能天花板。看一下数据对比模型MMLU得分推理延迟API价格每1M tokenGPT-5.591.2250ms$3.0Gemini 2.5 Ultra90.8220ms$2.8小米MiMo-V2.5-Pro87.9180ms$0.08小米MiMo-V2.586.3120ms$0.03这数据什么意思开源模型在某些垂直场景下体验已经接近闭源顶流但价格是百分之一量级。GPT-5.5跑一次复杂推理的钱MiMo能跑三万次。这对行业的影响是结构性的。过去两年大家都在说模型即服务闭源模型厂商靠API调用量赚钱。现在这个逻辑正在被侵蚀——当开源模型性能足够好、部署足够便宜的时候企业为什么要花十倍二十倍的钱去买闭源API有人会说闭源模型的 Safety 和alignment更好。这个我不否认但商业决策看的是性价比不是技术理想主义。中型公司的CTO们在选型的时候预算表比道德表权重高得多。当然开源模型的问题也明显维护成本、部署复杂度、SLA保障缺失。这些是企业级客户绕不开的坎。但在AI应用层创业的团队——尤其是做RAG、Agent、工作流自动化的——开源模型已经是主力选择了。三、推理成本革命基础设施层的暗战说完模型层再往下一层看——基础设施。NVIDIA最近搞了个挺有意思的事Blackwell架构的推理优化让同等算力下的推理吞吐量提升了2.3倍。Google的TPU v5e专门针对长上下文推理做了内存优化Context window从128K扩展到了1M价格反而降了15%。这不是孤立的硬件迭代而是整个推理成本曲线在下移。做一个不严谨的推算2023年初跑一个1000 token的复杂推理任务成本约0.01美元2025年初同等任务成本约0.0008美元按现在的迭代速度2026年底应该能摸到0.0001美元。这个下降速度是什么概念比摩尔定律还要猛。成本的下降会带来一个很直接的效应以前不经济的AI场景变得经济了。比如实时语音翻译每句话0.0001美元已经低于人工翻译成本代码审查每次Code Review 0.0002美元比雇一个初级工程师便宜三个数量级长文档分析百万字级别的法律合同、财报分析成本从几十美元降到了几毛钱但这里有个容易被忽视的隐忧推理成本下降≠商业模式成立。当AI调用成本趋近于零的时候API提供商怎么赚钱答案可能是卖Agent能力卖工作流编排卖行业解决方案而不是卖token。这是一个深层的商业逻辑转变。谁先意识到这个转变谁就能在下一个周期里卡到好位置。四、AI Agent的落地瓶颈交互基础设施才是真正的卡点说完物理AI和开源革命再来看一个被严重低估的问题AI Agent为什么落地比想象中慢圈内都在说Agent是下一个超级入口但现实里真正跑起来的Agent应用少之又少。不是模型不够强是交互基础设施没到位。举个例子。你让Claude帮我订一个会议室听起来很简单对吧但实际上背后要打通日历系统Google Calendar/Outlook、会议室管理系统某个不知名的SaaS、企业通讯录、审批流程。这四个系统接口标准不一、认证机制不同、响应格式各异。模型再强它也不知道怎么跟这些遗留系统打交道。AI News最近有一篇文章专门讲这个核心观点我很认同AI Agent需要一层交互基础设施这层基础设施负责把现实世界里的各种系统接口标准化、抽象化让Agent能够用统一的范式去操作所有东西。这层基础设施包括什么首先是工具调用协议。现在的Agent调用外部工具主流方案是Function Calling但各家实现不一致错误处理也不规范。Anthropic提出了MCPModel Context Protocol试图做统一标准但离行业标配还有距离。其次是状态管理。Agent执行一个多步骤任务需要在步骤之间维护状态。现在的做法是塞到Context里硬扛但随着任务复杂度上升Context窗口迟早会爆。需要一套持久化的状态管理机制类似Session但更强大。第三是安全与权限。当Agent开始替你操作各种系统的时候你怎么控制它的权限范围它能读取哪些数据能执行哪些操作能访问哪些API这些问题没有标准答案每家企业都在自己造轮子。我的判断是交互基础设施这个赛道被严重低估了。模型层已经卷成红海了但基础设施层还存在大量空白。谁能做出一个真正好用的Agent开发框架运行时环境谁就能吃到下一波红利。五、AI供应链紧张被卡脖子的不只是芯片Economist最近发了一篇文章讲AI正在面临供应链紧张。这个话题在中文互联网上讨论得不多但我认为非常关键。说到供应链紧张大家第一反应是GPU芯片——确实H100的交付周期一度拉到36周严重的时候黑市价格炒到了官方售价的2倍。但这只是冰山一角。真正的问题在于AI供应链是一个复杂的系统多个环节都在紧绷。电力是第一个瓶颈。训练一个大模型需要兆瓦级别的电力持续供给。微软和谷歌的数据中心用电量过去两年翻了3倍但电网扩容速度跟不上。美国一些数据中心已经开始跟地方政府谈判要求优先供电。中国的AI数据中心更惨东数西算工程推进速度远低于预期西部的清洁电力外送能力严重不足。高带宽光模块是第二个瓶颈。GPU集群之间需要超高速互联现在主流是400G光模块但供应链上游的磷化铟激光器产能严重不足。2024年400G光模块的交付周期是20周2025年改善了一些但依然在12周以上。冷却系统是第三个瓶颈。高密度GPU集群的散热是个物理难题。传统风冷已经不够了液冷成为刚需。但液冷方案需要定制化设计和施工交付周期比风冷长3倍。国内能做的液冷集成商就那么几家订单已经排到2026年了。这意味着什么意味着算力扩张的速度正在被供应链瓶颈拖慢。不是说GPU不够用而是整个配套系统都在拖后腿。企业想扩算力光有钱不够还得等设备交付。这个时间差对中小型AI公司是致命的。没有足够的算力支撑模型训练和推理都会受影响。大厂有长期合作协议供应链优先级高中小厂只能等等一天就是烧一天的钱。六、泡沫之争AI到底是不是泡沫最后聊一个有争议的话题。HN上最近有个热帖Ask HN: What Makes AI a Bubble? 讨论很激烈两派观点泾渭分明。反泡沫派的核心论点是AI有真实收入支撑。微软、谷歌、亚马逊的AI云服务收入都在高速增长Adobe、Salesforce的AI功能带来了明显的付费转化提升Stripe、Snowflake这些企业软件公司的AI驱动收入占比越来越高。收入在增长就不是泡沫。泡沫派的反驳更犀利收入增长≠护城河。现在AI带来的收入很大一部分是AI加持带来的价格溢价和效率提升但这个溢价能持续多久当开源模型性能追上来、各家AI功能都差不多的时候溢价空间就没了。更要命的是很多SaaS公司的AI功能本质上只是把大模型API包装了一下自己没有核心技术上游模型厂商随时可以跳过这些中间商自己做。我自己的判断是结构性的AI浪潮不是泡沫但投机性的AI估值是泡沫。这怎么理解真正在做底层模型、基础设施、核心应用的公司它们的价值是真实的——模型能力在提升成本在下降应用场景在扩展这些都是有数据支撑的。但那些靠AI概念包装一下就融资估值翻三倍的公司它们的估值就是泡沫。壁垒在哪里护城河在哪里复购率怎么样客户留存怎么样这些问题答不上来的估值再高也是空中楼阁。2026年的AI赛道大概率会经历一轮洗牌。潮水退了才知道谁在裸泳——这句话虽然俗但放在这里太合适了。写在最后我的判断和建议说了这么多最后给一个明确的结论。对AI从业者Physical AI是下一个增长点但别all in。数字AI agent的落地路径更清晰商业模式更成熟先在这个方向上建立现金流。Physical AI可以作为技术储备但商业化时间线要放长。开源模型已经具备生产可用性不要盲目追闭源顶流。在应用层创业开源微调是性价比最高的选择。省下来的API成本可以投到数据标注和用户体验上。交互基础设施是下一个兵家必争之地。如果你在做Agent开发框架或者运行时环境现在是最好的入场时机——这个赛道还没被大厂完全占领。对投资人和决策者AI供应链的瓶颈是真实的在评估算力扩张计划的时候要把设备交付周期考虑进去。不要高估自己的算力获取能力也不要低估供应链紧张持续的时间。泡沫分两种一种是该死的泡沫一种是成长的烦恼。AI这波浪潮我倾向于认为是后者。技术进步是真实的成本下降是真实的场景渗透是真实的——短期估值可能有泡沫但长期价值会均值回归。本文涉及数据截至2026年4月部分市场动态信息由公开报道整理观点代表作者个人判断仅供参考。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2562700.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…

wordpress后台更新后 前端没变化的解决方法

使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…

网络编程(Modbus进阶)

思维导图 Modbus RTU(先学一点理论) 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议,由 Modicon 公司(现施耐德电气)于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…

UE5 学习系列(二)用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…

利用最小二乘法找圆心和半径

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明&#xff1a;假设每台服务器已…

XML Group端口详解

在XML数据映射过程中&#xff0c;经常需要对数据进行分组聚合操作。例如&#xff0c;当处理包含多个物料明细的XML文件时&#xff0c;可能需要将相同物料号的明细归为一组&#xff0c;或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码&#xff0c;增加了开…

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造&#xff0c;完美适配AGV和无人叉车。同时&#xff0c;集成以太网与语音合成技术&#xff0c;为各类高级系统&#xff08;如MES、调度系统、库位管理、立库等&#xff09;提供高效便捷的语音交互体验。 L…

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)

题目&#xff1a;3442. 奇偶频次间的最大差值 I 思路 &#xff1a;哈希&#xff0c;时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况&#xff0c;哈希表这里用数组即可实现。 C版本&#xff1a; class Solution { public:int maxDifference(string s) {int a[26]…

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…

【Axure高保真原型】引导弹窗

今天和大家中分享引导弹窗的原型模板&#xff0c;载入页面后&#xff0c;会显示引导弹窗&#xff0c;适用于引导用户使用页面&#xff0c;点击完成后&#xff0c;会显示下一个引导弹窗&#xff0c;直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…

接口测试中缓存处理策略

在接口测试中&#xff0c;缓存处理策略是一个关键环节&#xff0c;直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性&#xff0c;避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明&#xff1a; 一、缓存处理的核…

龙虎榜——20250610

上证指数放量收阴线&#xff0c;个股多数下跌&#xff0c;盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型&#xff0c;指数短线有调整的需求&#xff0c;大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的&#xff1a;御银股份、雄帝科技 驱动…

观成科技:隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具&#xff0c;该工具基于TUN接口实现其功能&#xff0c;利用反向TCP/TLS连接建立一条隐蔽的通信信道&#xff0c;支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式&#xff0c;适应复杂网…

铭豹扩展坞 USB转网口 突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…

未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?

编辑&#xff1a;陈萍萍的公主一点人工一点智能 未来机器人的大脑&#xff1a;如何用神经网络模拟器实现更智能的决策&#xff1f;RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战&#xff0c;在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…

Linux应用开发之网络套接字编程(实例篇)

服务端与客户端单连接 服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …

华为云AI开发平台ModelArts

华为云ModelArts&#xff1a;重塑AI开发流程的“智能引擎”与“创新加速器”&#xff01; 在人工智能浪潮席卷全球的2025年&#xff0c;企业拥抱AI的意愿空前高涨&#xff0c;但技术门槛高、流程复杂、资源投入巨大的现实&#xff0c;却让许多创新构想止步于实验室。数据科学家…

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向&#xff1a; 逆向设计 通过神经网络快速预测微纳结构的光学响应&#xff0c;替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…