物理 AI 为什么离不开边缘计算?

news2026/5/11 3:02:42
过去两年AI 给人的印象基本是一回事——一个对话框一个输入框。你打字它打字你上传它分析AI 安静地待在屏幕里处理着一切关于文字、图像、代码的事情。行业的注意力也都跟着堆在那一头。云厂商抢算力芯片厂卷训练卡应用层抢入口关于 AI 的大新闻几乎都和云端有关模型又大了多少倍集群又烧了多少钱推理价格又降了几个点。但风向其实在悄悄变。今年 1 月 CES 2026 上黄仁勋花了 90 分钟做主题演讲——核心一句话是 物理 AI 的ChatGPT 时刻即将到来。他把 AI 的演化排了一条线感知 AI、生成式 AI、代理 AI再往后是物理 AI——也就是能理解重力、摩擦和因果、能真正去操作现实世界的那种 AI。会上英伟达发布的也不光是数据中心的怪兽训练卡还有专门塞进机器人本体的 Jetson Thor 新模块——40 到 70 瓦的功耗1200 TOPS 的算力。当全行业最大的 AI 算力供应商开始把主题演讲的核心位置让给装在机器人身上的芯片至少说明一件事——AI 主战场的重心已经开始往现实世界这一侧偏了。01AI 走出屏幕意味着什么把镜头从对话框移开会看到一些不太一样的东西。机器人公司在抢着把视觉—语言—动作模型塞进本体让一台两条腿的机器照着自然语言指令把杯子从桌上拿到厨房车厂把多模态模型搬进座舱过去一年开始有不少车型把端到端模型直接放上车端产线上的工业相机后面挂的不再只是规则引擎而是一个能识别细微缺陷的小模型连一些园区项目里闸机和摄像头都开始具备一点看懂场景的能力而不是只会触发录像。这些场景看起来分散但底下的逻辑是一样的——AI 正在从回答你变成替你处理一件事。它要看见环境、读懂上下文、规划下一步然后真的把动作做出来。这件事行业里通常叫 Physical AI。名字不重要重要的是它和过去两年的云端 AI 不是同一种生意。云端 AI 是给屏幕用的Physical AI 是给现实世界用的。一旦真要去碰传感器和执行器很多原本能糊弄过去的东西就糊弄不过去了。02为什么这件事很难放在云上做云端再大再强到了物理世界面前会撞上几堵实打实的墙。最直接的是时延。机械臂抓一个杯子决策窗口大概是几十毫秒自动驾驶在 60 公里时速下留给从感知到决策的时间也就 100 毫秒上下AR 眼镜把一个虚拟标签贴到你眼前的真实物体上超过 20 毫秒人眼就能感觉到漂移。把推理往云端走一趟就算用上 5G光网络往返也容易吃掉这个预算的一半。物理世界不会等服务器返回。数据量是另一个绕不过去的事。一台四足机器人身上常见的传感器组合——双目相机加 IMU 加激光雷达——每秒能产生几百 MB 的原始数据工厂一条产线挂十几个工业相机回传到云相当于自己给自己拉一根专线自动驾驶汽车一天能跑出 TB 级数据。这些数据大部分是原始素材真正有信息量的可能不到百分之一。如果不在边缘先处理一遍光是带宽和存储就压死人。还有可用性。工厂会断网车开进隧道会丢信号仓储机器人在金属货架之间 Wi-Fi 时好时坏海上钻井平台流量按 MB 算钱。这些场景里设备不能因为云不在就罢工。隐私这一块有时候被讲得比较虚但在某些行业是硬约束。家庭摄像头的画面、车内乘客的对话、医院里的病灶影像、工厂里属于商业机密的工艺参数——这些数据上不上云往往不是技术选择而是合规问题。其实结论只有一个算力需要下沉。业内早就有共识物理世界里的 AI 算力得离传感器和执行器更近一些。这个近一些就是边缘的位置。值得一提的是黄仁勋在 CES 演讲里也讲过一个三台计算机的版本可以参考——一台在数据中心做训练一台在 Omniverse 里做仿真第三台是装在机器人或汽车里的推理计算机。前两台都还在传统云计算的范畴里唯独第三台必须落在设备本体上。当连英伟达自己都开始把机器人本体里那台计算机单拎出来讲足以说明这件事的边缘属性是绕不过去的。03几个场景里到底在发生什么边缘 AI 不是一个统一的市场。机器人和车、车和眼镜、眼镜和园区对算力、功耗、时延、稳定性的要求差异巨大每一个场景里在解的问题其实都不太一样。机器人这边最热闹。人形机器人公司今年都在卷同一件事怎么把 VLA视觉—语言—动作模型放进本体做到接近实时。难点其实不是模型不够强而是机器人本体的算力预算非常吝啬——一颗 SoC 几十瓦要同时跑感知、定位、规划、控制、语言理解模型得压到能落进去反应还要稳定在几十毫秒以内。差几十毫秒一台机器人抓不稳杯子的差别就出来了。工业产线比想象中更难做。它对 AI 的要求是有点反直觉的——不是算得快而是算得稳。一条产线连续运行几个月缺陷漏检率要压到百万分之几模型不能漂、不能崩、不能卡顿。这两年视觉大模型替代传统机器视觉算法的趋势确实在加速但部署位置基本都在产线旁边的边缘服务器或工控机上没什么人愿意把这种任务往云上甩。车载是个特殊场景因为汽车本身就是一个移动的边缘节点。理想、蔚来、小鹏这一波都在把多模态模型搬进座舱特斯拉那边把端到端的驾驶模型直接放在车端推理。算力平台从几十 TOPS 一路卷到上千 TOPS英伟达 Thor、高通 Snapdragon Ride、地平线征程 6 都是在抢这个位置。车规级、低功耗、强实时这几件事卡在一起对芯片设计的难度跟消费级不在一个量级。AR 眼镜是最受算力折磨的一类设备。眼镜要轻电池小散热差但用户预期一点不低——实时翻译、目标识别、空间理解、语音交互一样都不能少。这就逼出一种比较拧巴的工程局面一部分推理放在眼镜本体一部分挪到口袋里的手机或胸前的小盒子再有一部分丢回云端三层之间的任务怎么切分、怎么同步本身就是个挺难的系统问题。Meta 的 Ray-Ban、苹果 Vision Pro、国内的雷鸟和 XREAL做法各不相同但都绕不开这件事。智慧园区和城市基础设施这一类规模大但单点价值低。一个园区可能挂着几千路视频全部回传云端既贵又卡。比较现实的做法是在园区内部部署边缘节点先做一轮筛选——大部分画面其实啥都没发生——只把有信息量的事件结构化之后送到云端。这是个朴素的边缘场景但量很大是这两年项目最多的方向之一。把这几个场景放一起看能看到的共同点其实就一句话算力在往设备和现场移。04边缘 AI 真正难在哪外行容易把边缘 AI 想成把模型塞进设备里。如果真这么简单这个行业早就解决了。芯片是大头。要在严苛的功耗、面积、成本约束下提供匹配大模型的算力NPU、GPU、DSP 怎么搭存算怎么平衡HBM 上不上车每一代都是重新洗牌。地平线、黑芝麻、爱芯元智这两年的迭代节奏其实是被这件事推着走的。模型压缩听起来是老话题但放在大模型上是另一回事。把一个百亿参数的模型量化到 INT4、再蒸馏出一个端侧版本精度还要扛得住——这件事跟过去 CV 时代压一个 ResNet 的难度不在一个层级。推理框架很多人不重视但它决定了同一颗芯片能跑出几倍的实际性能差距。算子优化、KV cache 怎么管、动态 batch 怎么调度、多模态流水线怎么拼这些工程细节里藏着真正的差别。也是为什么有时候同样的硬件配置不同公司做出来的产品体验差得离谱。传感器和前端处理这一段经常被忽略。AI 之前的预处理质量——图像信号怎么调、点云怎么去噪、雷达回波怎么对齐——往往直接决定 AI 之后的效果上限。模型再强进来的数据是垃圾也没用。剩下的安全和端云协同这两块工作量更大也更隐形。模型要防盗、防对抗攻击数据要端侧加密决策得有可审计的痕迹端云之间哪些任务在哪里跑、模型怎么 OTA、参数怎么下发、回流的数据怎么用每一项都是架构题做不好整套系统的体验就是断的。任何一个环节出问题最终用户感受到的就是这个 AI 设备好像不太行。所以真正能把边缘 AI 做出来的玩家往往不是单点最强的那一个而是能把芯片、模型、框架、传感器、产品打通的那一个——这种公司目前在国内外都不多可能比想象中更稀缺。05边缘的角色正在变回头看边缘计算这个词的含义其实一直在变。最早讲边缘讲的是把云处理不过来的数据分担到离用户更近的节点主打带宽和时延。后来 CDN、边缘缓存、边缘渲染冒出来边缘开始承担一部分内容分发的活。这两轮里边缘其实都还是云的一个延伸——它在帮云分担。Physical AI 把这件事推到了一个不一样的位置上。机器人在哪里走、机床调多少参数、车要不要变道、眼镜上显示什么——这些动作没有时间等云。它们必须在边缘当场做出来而且做出来之后就直接作用在现实世界上。这个时候的边缘已经不是云的延伸更像一个独立的决策点。云端继续做它擅长的事——训练、知识、跨设备协同、长期数据沉淀具体到此刻、此地的判断和动作是边缘的事。这件事如果按现在的方向继续走下去边缘的位置会比过去十年加起来都更重要。它不再只是后台基础设施的一段而是 Physical AI 真正能不能用的那一段。至于这条路上谁能先走通现在下结论还有点早。可以确定的只是——这件事已经开始了。重磅来袭“2026中国边缘计算企业20强”榜单发布2026-04-08AI 算力的狂欢掩盖了一个更难看的真相2026-05-08谁拿下边缘 AI谁就更可能赢下整个 AI 时代2026-04-21

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2602268.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…

wordpress后台更新后 前端没变化的解决方法

使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…

网络编程(Modbus进阶)

思维导图 Modbus RTU(先学一点理论) 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议,由 Modicon 公司(现施耐德电气)于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…

UE5 学习系列(二)用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…

利用最小二乘法找圆心和半径

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明&#xff1a;假设每台服务器已…

XML Group端口详解

在XML数据映射过程中&#xff0c;经常需要对数据进行分组聚合操作。例如&#xff0c;当处理包含多个物料明细的XML文件时&#xff0c;可能需要将相同物料号的明细归为一组&#xff0c;或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码&#xff0c;增加了开…

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造&#xff0c;完美适配AGV和无人叉车。同时&#xff0c;集成以太网与语音合成技术&#xff0c;为各类高级系统&#xff08;如MES、调度系统、库位管理、立库等&#xff09;提供高效便捷的语音交互体验。 L…

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)

题目&#xff1a;3442. 奇偶频次间的最大差值 I 思路 &#xff1a;哈希&#xff0c;时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况&#xff0c;哈希表这里用数组即可实现。 C版本&#xff1a; class Solution { public:int maxDifference(string s) {int a[26]…

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…

【Axure高保真原型】引导弹窗

今天和大家中分享引导弹窗的原型模板&#xff0c;载入页面后&#xff0c;会显示引导弹窗&#xff0c;适用于引导用户使用页面&#xff0c;点击完成后&#xff0c;会显示下一个引导弹窗&#xff0c;直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…

接口测试中缓存处理策略

在接口测试中&#xff0c;缓存处理策略是一个关键环节&#xff0c;直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性&#xff0c;避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明&#xff1a; 一、缓存处理的核…

龙虎榜——20250610

上证指数放量收阴线&#xff0c;个股多数下跌&#xff0c;盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型&#xff0c;指数短线有调整的需求&#xff0c;大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的&#xff1a;御银股份、雄帝科技 驱动…

观成科技:隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具&#xff0c;该工具基于TUN接口实现其功能&#xff0c;利用反向TCP/TLS连接建立一条隐蔽的通信信道&#xff0c;支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式&#xff0c;适应复杂网…

铭豹扩展坞 USB转网口 突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…

未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?

编辑&#xff1a;陈萍萍的公主一点人工一点智能 未来机器人的大脑&#xff1a;如何用神经网络模拟器实现更智能的决策&#xff1f;RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战&#xff0c;在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…

Linux应用开发之网络套接字编程(实例篇)

服务端与客户端单连接 服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …

华为云AI开发平台ModelArts

华为云ModelArts&#xff1a;重塑AI开发流程的“智能引擎”与“创新加速器”&#xff01; 在人工智能浪潮席卷全球的2025年&#xff0c;企业拥抱AI的意愿空前高涨&#xff0c;但技术门槛高、流程复杂、资源投入巨大的现实&#xff0c;却让许多创新构想止步于实验室。数据科学家…

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向&#xff1a; 逆向设计 通过神经网络快速预测微纳结构的光学响应&#xff0c;替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…