【卷卷观察】Physical AI（具身智能）崛起 + 开源效率革命—

【卷卷观察】Physical AI（具身智能）崛起 + 开源效率革命——AI正在从“数字“走向“物理“

news2026/4/28 13:48:31

结论先挂出来AI这波浪潮正在发生结构性分化一边是数字世界的agent疯狂落地一边是物理世界的AI开始暴走。两条线都在跑但物理AI这一支很多人还没真正重视。上周末跟一个创业的朋友吃饭他在做具身智能方向就是让AI控制机械臂、干体力活那种。聊到一半他突然说了一句话让我愣了两秒你知道吗我们现在拿一块NVIDIA H100跑物理模拟一天的成本是数字AI agent的50倍。数字AI agent输入文字、输出文字token成本一降再降GLM-4.7或Gemini 2.5 Ultra一顿火锅钱能跑几十万次。物理AI agent输入传感器数据、输出电机控制物理模拟实时控制硬件延迟一套下来贵到离谱。这个对比太鲜明了也太容易被忽视。圈内都在聊Agent、大模型、GPT-5但Physical AI这个赛道正在闷声搞大事。一、Physical AI具身智能是什么为什么突然起来了先说清楚这个概念。Physical AI具身智能不是某个具体产品而是一类AI系统的统称——这些系统的输入输出都跟物理世界直接相关视觉、触觉、力反馈、电机控制、自动驾驶的路径规划。简单说就是让AI长出手和脚真正去搬东西、开车子、控制机器人。IBM最近发了一篇博客讲这个概念核心观点是AI正在从纯数字决策进化到物理世界交互。以前AI的战场在服务器机房现在开始往工厂、仓库、马路上渗透。为什么现在起来了三个原因撞一块了传感器便宜了。激光雷达、深度相机、力矩传感器过去五年价格跌了70%以上。一个工业级3D视觉传感器五年前要8万现在1万多就能拿下。模型推理效率上来了。开源社区出了好多针对机器人控制的轻量模型延迟从原来的100毫秒压到了20毫秒以内。实时控制要求毫秒级响应这个跨越很关键。英伟达和Google在基础设施侧持续砸钱。Blackwell架构的GPU专门为物理模拟优化了内存带宽Google的TPU v5推理物理模型的速度比上一代快了3倍。成本降了部署就变得可行了。但我得泼一盆冷水。Physical AI现在有两个硬伤一是数据太难获取数字AI可以从互联网爬几十亿token物理AI需要真实的物理交互数据这玩意采集成本极高且效率低下二是仿真环境和真实物理世界之间的sim2real gap仿真到现实的迁移差距依然是未解决的难题。你在仿真里训练得再好拿到真机上跑效果经常打七折。这不是唱衰是现实。Physical AI是长期方向但短期内别指望它替代人工流水线。二、开源模型效率革命小米MiMo是个什么信号VentureBeat上周发了一篇报道讲小米开源了MiMo-V2.5和V2.5-Pro两个模型。参数规模没透露但评测数据很能打——推理效率比同档次模型高40%价格只有GPT-5.5的三十分之一。我的判断是开源社区正在用一种很野的方式逼近闭源模型的性能天花板。看一下数据对比模型MMLU得分推理延迟API价格每1M tokenGPT-5.591.2250ms$3.0Gemini 2.5 Ultra90.8220ms$2.8小米MiMo-V2.5-Pro87.9180ms$0.08小米MiMo-V2.586.3120ms$0.03这数据什么意思开源模型在某些垂直场景下体验已经接近闭源顶流但价格是百分之一量级。GPT-5.5跑一次复杂推理的钱MiMo能跑三万次。这对行业的影响是结构性的。过去两年大家都在说模型即服务闭源模型厂商靠API调用量赚钱。现在这个逻辑正在被侵蚀——当开源模型性能足够好、部署足够便宜的时候企业为什么要花十倍二十倍的钱去买闭源API有人会说闭源模型的 Safety 和alignment更好。这个我不否认但商业决策看的是性价比不是技术理想主义。中型公司的CTO们在选型的时候预算表比道德表权重高得多。当然开源模型的问题也明显维护成本、部署复杂度、SLA保障缺失。这些是企业级客户绕不开的坎。但在AI应用层创业的团队——尤其是做RAG、Agent、工作流自动化的——开源模型已经是主力选择了。三、推理成本革命基础设施层的暗战说完模型层再往下一层看——基础设施。NVIDIA最近搞了个挺有意思的事Blackwell架构的推理优化让同等算力下的推理吞吐量提升了2.3倍。Google的TPU v5e专门针对长上下文推理做了内存优化Context window从128K扩展到了1M价格反而降了15%。这不是孤立的硬件迭代而是整个推理成本曲线在下移。做一个不严谨的推算2023年初跑一个1000 token的复杂推理任务成本约0.01美元2025年初同等任务成本约0.0008美元按现在的迭代速度2026年底应该能摸到0.0001美元。这个下降速度是什么概念比摩尔定律还要猛。成本的下降会带来一个很直接的效应以前不经济的AI场景变得经济了。比如实时语音翻译每句话0.0001美元已经低于人工翻译成本代码审查每次Code Review 0.0002美元比雇一个初级工程师便宜三个数量级长文档分析百万字级别的法律合同、财报分析成本从几十美元降到了几毛钱但这里有个容易被忽视的隐忧推理成本下降≠商业模式成立。当AI调用成本趋近于零的时候API提供商怎么赚钱答案可能是卖Agent能力卖工作流编排卖行业解决方案而不是卖token。这是一个深层的商业逻辑转变。谁先意识到这个转变谁就能在下一个周期里卡到好位置。四、AI Agent的落地瓶颈交互基础设施才是真正的卡点说完物理AI和开源革命再来看一个被严重低估的问题AI Agent为什么落地比想象中慢圈内都在说Agent是下一个超级入口但现实里真正跑起来的Agent应用少之又少。不是模型不够强是交互基础设施没到位。举个例子。你让Claude帮我订一个会议室听起来很简单对吧但实际上背后要打通日历系统Google Calendar/Outlook、会议室管理系统某个不知名的SaaS、企业通讯录、审批流程。这四个系统接口标准不一、认证机制不同、响应格式各异。模型再强它也不知道怎么跟这些遗留系统打交道。AI News最近有一篇文章专门讲这个核心观点我很认同AI Agent需要一层交互基础设施这层基础设施负责把现实世界里的各种系统接口标准化、抽象化让Agent能够用统一的范式去操作所有东西。这层基础设施包括什么首先是工具调用协议。现在的Agent调用外部工具主流方案是Function Calling但各家实现不一致错误处理也不规范。Anthropic提出了MCPModel Context Protocol试图做统一标准但离行业标配还有距离。其次是状态管理。Agent执行一个多步骤任务需要在步骤之间维护状态。现在的做法是塞到Context里硬扛但随着任务复杂度上升Context窗口迟早会爆。需要一套持久化的状态管理机制类似Session但更强大。第三是安全与权限。当Agent开始替你操作各种系统的时候你怎么控制它的权限范围它能读取哪些数据能执行哪些操作能访问哪些API这些问题没有标准答案每家企业都在自己造轮子。我的判断是交互基础设施这个赛道被严重低估了。模型层已经卷成红海了但基础设施层还存在大量空白。谁能做出一个真正好用的Agent开发框架运行时环境谁就能吃到下一波红利。五、AI供应链紧张被卡脖子的不只是芯片Economist最近发了一篇文章讲AI正在面临供应链紧张。这个话题在中文互联网上讨论得不多但我认为非常关键。说到供应链紧张大家第一反应是GPU芯片——确实H100的交付周期一度拉到36周严重的时候黑市价格炒到了官方售价的2倍。但这只是冰山一角。真正的问题在于AI供应链是一个复杂的系统多个环节都在紧绷。电力是第一个瓶颈。训练一个大模型需要兆瓦级别的电力持续供给。微软和谷歌的数据中心用电量过去两年翻了3倍但电网扩容速度跟不上。美国一些数据中心已经开始跟地方政府谈判要求优先供电。中国的AI数据中心更惨东数西算工程推进速度远低于预期西部的清洁电力外送能力严重不足。高带宽光模块是第二个瓶颈。GPU集群之间需要超高速互联现在主流是400G光模块但供应链上游的磷化铟激光器产能严重不足。2024年400G光模块的交付周期是20周2025年改善了一些但依然在12周以上。冷却系统是第三个瓶颈。高密度GPU集群的散热是个物理难题。传统风冷已经不够了液冷成为刚需。但液冷方案需要定制化设计和施工交付周期比风冷长3倍。国内能做的液冷集成商就那么几家订单已经排到2026年了。这意味着什么意味着算力扩张的速度正在被供应链瓶颈拖慢。不是说GPU不够用而是整个配套系统都在拖后腿。企业想扩算力光有钱不够还得等设备交付。这个时间差对中小型AI公司是致命的。没有足够的算力支撑模型训练和推理都会受影响。大厂有长期合作协议供应链优先级高中小厂只能等等一天就是烧一天的钱。六、泡沫之争AI到底是不是泡沫最后聊一个有争议的话题。HN上最近有个热帖Ask HN: What Makes AI a Bubble? 讨论很激烈两派观点泾渭分明。反泡沫派的核心论点是AI有真实收入支撑。微软、谷歌、亚马逊的AI云服务收入都在高速增长Adobe、Salesforce的AI功能带来了明显的付费转化提升Stripe、Snowflake这些企业软件公司的AI驱动收入占比越来越高。收入在增长就不是泡沫。泡沫派的反驳更犀利收入增长≠护城河。现在AI带来的收入很大一部分是AI加持带来的价格溢价和效率提升但这个溢价能持续多久当开源模型性能追上来、各家AI功能都差不多的时候溢价空间就没了。更要命的是很多SaaS公司的AI功能本质上只是把大模型API包装了一下自己没有核心技术上游模型厂商随时可以跳过这些中间商自己做。我自己的判断是结构性的AI浪潮不是泡沫但投机性的AI估值是泡沫。这怎么理解真正在做底层模型、基础设施、核心应用的公司它们的价值是真实的——模型能力在提升成本在下降应用场景在扩展这些都是有数据支撑的。但那些靠AI概念包装一下就融资估值翻三倍的公司它们的估值就是泡沫。壁垒在哪里护城河在哪里复购率怎么样客户留存怎么样这些问题答不上来的估值再高也是空中楼阁。2026年的AI赛道大概率会经历一轮洗牌。潮水退了才知道谁在裸泳——这句话虽然俗但放在这里太合适了。写在最后我的判断和建议说了这么多最后给一个明确的结论。对AI从业者Physical AI是下一个增长点但别all in。数字AI agent的落地路径更清晰商业模式更成熟先在这个方向上建立现金流。Physical AI可以作为技术储备但商业化时间线要放长。开源模型已经具备生产可用性不要盲目追闭源顶流。在应用层创业开源微调是性价比最高的选择。省下来的API成本可以投到数据标注和用户体验上。交互基础设施是下一个兵家必争之地。如果你在做Agent开发框架或者运行时环境现在是最好的入场时机——这个赛道还没被大厂完全占领。对投资人和决策者AI供应链的瓶颈是真实的在评估算力扩张计划的时候要把设备交付周期考虑进去。不要高估自己的算力获取能力也不要低估供应链紧张持续的时间。泡沫分两种一种是该死的泡沫一种是成长的烦恼。AI这波浪潮我倾向于认为是后者。技术进步是真实的成本下降是真实的场景渗透是真实的——短期估值可能有泡沫但长期价值会均值回归。本文涉及数据截至2026年4月部分市场动态信息由公开报道整理观点代表作者个人判断仅供参考。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2562700.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！