ICRA 2025自动叉车顶会论文拆解：ADAPT如何在真实复杂场景完成托盘搬运？

news2026/4/4 21:17:44

ICRA 2025 最新AGV顶会论文拆解ADAPT自动叉车系统如何在真实复杂户外场景完成托盘搬运如果说仓库 AGV 研究已经逐渐成熟那么真正更难的其实是户外、非结构化、天气变化大、障碍物复杂的施工场地搬运。这篇来自 AGV / 自动叉车方向的近期顶会论文ADAPT: An Autonomous Forklift for Construction Site Operation做的就不是单一模块优化而是一套完整的自动叉车系统从感知、定位、托盘识别到路径规划、行为决策、视觉伺服和真实场地装卸闭环全都做了系统化集成。和很多“只在实验室里跑通”的论文不同这篇工作的价值在于它不是只证明某个算法能用而是在回答“自动叉车到底能不能在真实复杂场景里稳定干活”这个更难的问题。一、为什么这篇论文值得单独分析很多 AGV 论文更像“模块论文”比如只做路径规划只做托盘检测只做 SLAM只做视觉伺服但这篇 ADAPT 不一样它是一个典型的系统级顶会论文。它解决的问题不是某个小模块精度够不够高而是在真实施工场地里一台自动叉车能不能自主找到托盘、规划路径、避开障碍、完成装卸并且尽量少依赖人工。这个问题之所以重要是因为施工场地比室内仓储难得多地面不平整环境是开放的不是规则仓库障碍物动态变化更明显托盘和卸货区域不一定完全标准还要面对晴天、阴天、雨天等天气变化所以这篇论文的核心意义并不是“某个视觉网络提了几个点”而是它把 AGV / 自动叉车从结构化室内环境真正往复杂户外应用场景推进了一步。二、这篇论文到底想解决什么问题论文的目标非常明确让一台自动叉车在没有预设导引线、没有固定高精地图、没有严格标准化作业位的施工场地里完成自主托盘搬运。这里面实际上包含了 5 个连续问题1车怎么知道自己在哪户外施工场地不像仓库那样规则单靠传统室内定位思路不够。2车怎么知道托盘在哪托盘位置并不总是标准可能存在偏移、遮挡、视角变化。3车怎么安全开过去施工场地有动态障碍物、非平整地面、临时障碍和不规则通道。4车怎么完成最后的精确装卸仅仅“看到托盘”还不够还需要完成接近、对准、叉入和搬运。5整个过程能不能长期稳定运行真实系统必须回答这个问题而不是只给一段演示视频。所以这篇论文本质上研究的是自动叉车在复杂环境下的整链路自治能力。三、整篇论文的核心构思不是单点算法而是一整套闭环系统这篇论文最值得学习的地方就是它的系统设计思路很完整。论文整体可以拆成这样一条链路环境感知 → 联合定位与托盘建图 → 路径规划 → 行为树任务执行 → 视觉伺服装卸 → 人机对比评估也就是说它不是一个单一视觉模块而是一套完整的 AGV 任务执行体系。从模块角度看ADAPT 主要包括多传感器感知系统托盘检测与位姿估计联合车辆定位与托盘建图可通行区域建图障碍物检测Hybrid A* 路径规划行为树任务管理视觉伺服式 docking / 装卸控制长时真实场景评测这也是为什么这篇论文特别适合拿来写 CSDN 技术分析它能让人看到“AGV 顶会论文到底是怎么把一个完整系统串起来的”。四、先看感知层ADAPT是怎么“看懂环境”的论文在感知层没有只靠单一传感器而是采用了一套针对自动叉车任务设计的组合方案。它使用的关键外部传感器包括前向广视场 LiDAR用于环境建图和障碍检测后向 Livox LiDAR ZED2i 双目相机用于托盘识别和位姿估计近距离 2D LiDAR用于最后阶段的精细对准双天线 RTK GNSS用于厘米级定位和航向估计从系统设计看这套配置非常有针对性前向看“路”和“障碍”因为前向行驶速度更快碰撞风险更高所以前向传感器更强调低延迟障碍检测和地形理解。后向看“托盘”因为叉车装卸托盘主要发生在叉齿方向所以后向传感器更关注托盘识别、位姿恢复和精细操作。近距离再补一层高频校正在真正靠近托盘时论文没有继续只靠远距离视觉而是增加了近距离高频传感器来做最终对准。这说明作者并没有迷信“一个视觉模型通吃全部”而是按照任务阶段来安排传感器职责。这一点很值得做工程的人借鉴。五、这篇论文最有意思的地方之一联合定位和托盘建图很多 AGV 系统把“车的定位”和“托盘的定位”分成两个独立问题。但 ADAPT 的一个核心创新就是把车辆定位和托盘地图构建放进同一个因子图优化框架中联合求解。这一步很关键因为自动叉车不是只需要知道“自己在哪里”它更需要知道自己和托盘的相对关系托盘在多次观测下的稳定位置在 GNSS 波动时托盘地图能否辅助定位稳定性5.1 这个问题可以怎么抽象论文本质上是在做一个最大后验估计问题可以写成X∗arg⁡max⁡XP(X∣Z) \mathbf{X}^{*}\arg\max_{\mathbf{X}} P(\mathbf{X}\mid \mathbf{Z})X∗argXmaxP(X∣Z)其中X\mathbf{X}X表示待优化变量包括车辆位姿和托盘位姿Z\mathbf{Z}Z表示传感器测量包括 GNSS、里程计、托盘检测等信息如果写成因子图优化的常见形式就是X∗arg⁡min⁡X∑i∥ri(X)∥Σi2 \mathbf{X}^{*}\arg\min_{\mathbf{X}} \sum_{i} \left\| \mathbf{r}_i(\mathbf{X}) \right\|_{\Sigma_i}^{2}X∗argXmini∑∥ri(X)∥Σi2其中ri(X)\mathbf{r}_i(\mathbf{X})ri(X)表示第iii个约束残差Σi\Sigma_iΣi表示对应测量噪声协方差这个公式的物理意义其实很直观把来自 GNSS、里程计、托盘检测等多个来源的信息放在一起找一个“整体最合理”的车辆与托盘状态估计。5.2 为什么这一步很有价值因为在自动叉车任务里托盘本身不是普通障碍物而是操作对象。把托盘作为高层语义对象纳入地图而不是只当一团点云处理会直接提升装卸任务的稳定性。这也说明这篇论文比普通 SLAM 论文更进一步它不是为了“建图而建图”而是为了“操作任务可执行”而建图。六、托盘识别不是“看到就行”而是要服务装卸动作论文里提到系统使用了基于几何结构、纯合成数据训练的托盘检测方案。这一点很有意思因为它没有完全依赖大规模真实标注数据而是结合场景先验和合成训练数据来提升可部署性。从工程角度看这个思路很现实。因为叉车托盘任务虽然看起来常见但真实数据采集和高质量标注并不便宜尤其在户外施工场地里光照、背景、材质变化都很大。6.1 为什么“检测到托盘”还不够因为自动叉车最终要做的是选定目标托盘判断接近方向控制叉齿进入正确区域保证搬运过程中姿态稳定所以托盘检测最终必须转化为托盘位姿装卸参考系与叉齿的相对对准关系这也是这篇论文比单纯目标检测论文更进一步的地方。七、路径规划怎么做为什么选 Hybrid A*在路径规划部分论文选择的是Hybrid A*并结合了Reeds-Shepp配置来处理前进 / 后退双向可行路径。作者之所以选择这套方法是因为自动叉车不是普通小车它有更强的非完整约束而且经常需要倒车接近多次换向在狭小区域内重新摆正姿态兼顾路径长度与动作可行性7.1 规划目标可以怎么写Hybrid A* 的基本代价函数可以抽象为f(n)g(n)h(n) f(n)g(n)h(n)f(n)g(n)h(n)其中g(n)g(n)g(n)表示从起点到当前节点的真实代价h(n)h(n)h(n)表示从当前节点到目标的启发式估计代价如果考虑换向惩罚、倒车惩罚、转向惩罚实际代价还可以扩展成J∑k(wddkwrrkwssk) J \sum_{k} \left( w_d d_k w_r r_k w_s s_k \right)Jk∑(wddkwrrkwssk)其中dkd_kdk表示路径段长度rkr_krk表示换向代价sks_ksk表示转向变化代价wd,wr,wsw_d,w_r,w_swd,wr,ws为对应权重对自动叉车来说这种代价设计比单纯最短路更合理因为真正重要的是路径能不能走、姿态能不能摆出来、最后能不能顺利装卸。八、任务执行为什么要用行为树而不是写一堆 if-else论文在任务管理层采用的是Behavior Tree行为树。这一点非常值得做机器人系统的人注意。因为一旦任务链路复杂起来纯粹写流程判断会迅速失控而行为树更适合处理这种有阶段有回退有失败恢复有循环执行有条件分支的任务流程。论文给出的简化流程大致是查找托盘选择托盘接近托盘装载托盘接近卸载位置卸载托盘重复执行直到任务结束更重要的是论文还明确提到真实系统中的完整行为树远比这个更复杂包含26 个自定义子树30 个动作与组合节点失败后的恢复逻辑反应式与预判式行为混合这说明在顶会级 AGV 系统里感知和控制并不是“线性流水线”而是一个带有恢复能力和条件分支的任务控制结构。九、最后装卸为什么还要用视觉伺服很多搬运系统的问题都出在“最后一米”。前面定位和规划都没问题但到了真正靠近托盘时经常会因为位姿估计存在偏差地面不平托盘略有倾斜叉齿和托盘中心没有完全对齐导致叉取失败。ADAPT 在这里采用的是基于视觉伺服的 docking / 装卸策略并结合深度相机和 LiDAR 做精确对准。9.1 这个过程可以抽象成什么控制模型视觉伺服常见形式可以写成v−λJe \mathbf{v}-\lambda J^{}\mathbf{e}v−λJe其中e\mathbf{e}e表示图像特征误差JJ^{}J表示图像雅可比矩阵伪逆λ\lambdaλ表示控制增益v\mathbf{v}v表示系统输出速度它的意义非常直观根据当前图像里“还差多少”的误差不断修正车辆和叉齿运动直到逼近目标状态。在 AGV / 自动叉车场景里这一步比“纯检测精度”更关键因为真正决定任务成败的往往就是最后靠近和叉入那几秒钟。十、论文里还有一个很工程化的细节液压系统建模这篇论文不是只停留在高层路径规划和感知上它连液压系统的控制响应都建模了。比如论文把液压缸的动态近似建模为一阶滞后系统τy˙(t)y(t)Ku(t) \tau \dot{y}(t)y(t)K u(t)τy˙(t)y(t)Ku(t)其中u(t)u(t)u(t)表示控制输入y(t)y(t)y(t)表示执行机构输出KKK为增益τ\tauτ为时间常数这说明作者非常清楚如果底层执行器的动态不建模上层路径和姿态控制再漂亮也未必能在真实液压叉车上跑稳。这也是很多“仿真里很好看真机上很难用”的系统最容易忽略的一点。十一、这篇论文最强的部分它真的做了长时真实评测很多论文到这里就结束了但 ADAPT 最有说服力的地方是它做了真实场地、长时间、多人可理解指标的系统评估。论文的评测方式不是简单看几个算法指标而是直接和一位20 多年经验的叉车操作员做对比指标包括整个装卸循环所需时间行驶路径长度人工干预的次数与严重程度自动运行占比与人工接管比例11.1 论文给出的核心结果论文中比较有代表性的结果包括1整体效率人工操作员完成同类任务所需时间约为 ADAPT 的82.5%。也就是说当前 ADAPT 还比人工慢一些但差距已经没有想象中那么大。2简单场景下接近专家水平在最简单的ground-to-ground场景中ADAPT 达到了约88% 的专家水平。3复杂场景下仍具竞争力在ground-to-truck场景中ADAPT 与人工的时间差约为14%。而在truck-to-ground场景中差距最大约为26%。4人工干预很少在超过 3 小时的自主运行中系统完成了60 个托盘的装卸共发生17 次人工干预。5人工接管时间占比很低总共233 分钟的自主运行中人工控制仅占12 分钟也就是不到 5%。其中大部分人工时间还用于处理 GNSS 原型系统的问题其他所有干预加起来只有2 分钟左右。这些结果最说明问题的一点是这不是“偶尔成功一次”的演示而是“已经可以长时间工作只是还需要继续优化”的系统。十二、这篇论文真正的创新点不只是“做了个自动叉车”如果只看标题很容易把它理解为“又一篇自动叉车系统论文”。但仔细分析会发现它的创新其实有好几层。创新点1把自动叉车研究从室内仓库推向了复杂户外环境大多数 AGV / 自动叉车研究还是偏向规则仓库、平整地面和可控环境。而这篇论文直接面对的是施工场地这种更复杂的环境。这意味着它解决的不只是导航而是非结构化地形天气变化动态障碍物不标准化托盘作业位这一步本身就很有意义。创新点2联合车辆定位和托盘建图而不是把两者分开很多系统只做“机器人定位”而 ADAPT 明确把托盘作为高层语义对象纳入联合优化。这种做法更符合自动叉车任务本质因为托盘不是背景它是核心操作目标。创新点3把系统评估做到“人类专家对比”这个层面很多论文只给成功案例不讲失败不讲长时表现也不讲人工干预成本。这篇论文不仅和专家对比还统计了干预类型干预严重程度干预时间占比原因分析与改进建议这一点非常像真正做产品落地的人写出来的论文。创新点4强调“问题与经验教训”同样重要论文专门总结了长期测试中的问题和 lessons learned比如雨天传感器方案的权衡GNSS 干扰问题USB 3.0 对 GNSS 的潜在影响高温与低温下硬件可靠性问题这比单纯展示成功案例更有价值因为它告诉你真实自动叉车系统最难的部分往往不是算法本身而是系统级鲁棒性。十三、这篇论文也有哪些不足虽然这篇论文很强但它并不是“已经完全成熟”的最终答案。我觉得它目前至少还有几个明显限制。1整体效率还没超过人工从论文结果看ADAPT 虽然已经接近专家水平但整体效率仍然低于人工操作员。这说明它目前更像“可用雏形”而不是“完全替代人工的成熟产品”。2部分性能瓶颈来自系统级延迟论文明确提到一些时间损失来自计算延迟检测等待时间顺序执行流程带来的停顿再次接近托盘带来的额外耗时也就是说问题不全在单个算法而在整个系统链路的实时性。3GNSS 依赖在复杂场景下仍然是风险点虽然论文做了联合优化来缓解定位波动但 GNSS 在户外系统里依然是一个不可忽视的不稳定因素。尤其在遮挡严重、金属环境复杂的区域系统鲁棒性还需要继续增强。4更复杂的人机混行与极端天气还值得继续验证论文已经测试了多种天气条件也考虑了动态障碍物但如果放到更高密度的人机混行工地或者更极端环境下系统还需要进一步验证。十四、如果我们做AGV项目这篇论文最值得借鉴什么我觉得这篇论文至少有 4 个特别值得借鉴的点。借鉴点1不要只盯一个算法要按任务链路设计系统AGV 项目里最常见的问题就是各模块各做各的最后拼不起来。这篇论文的价值在于它从一开始就是按任务流程来设计感知什么什么时候规划什么时候重试什么时候人工介入失败后怎么恢复这种系统思维比单点算法思维更重要。借鉴点2托盘要当“操作对象”看而不是普通检测目标对自动叉车来说托盘不是普通 box 类别。它是直接影响动作执行的高层语义对象所以要建图要持续跟踪要进入联合优化要为装卸动作提供参考系这点很值得做托盘搬运视觉的人重视。借鉴点3最后一米一定要做精细闭环前面规划再漂亮如果最后无法稳定 docking / fork insertion系统一样不可用。所以自动叉车项目里最后的接近校正对准接触检测叉入确认往往才是最关键的模块。借鉴点4顶会系统论文真正卷的是“长期稳定性”真正优秀的 AGV 论文不只是给你几个成功截图而是要回答能连续跑多久一共出错几次需要多少人工介入失败原因是什么下次怎么改这才是系统级研究最有含金量的部分。十五、我的理解这篇论文标志着AGV研究开始从“算法展示”走向“系统可信”如果只看近几年 AGV / 自动叉车方向的论文会发现一个很明显的变化早期很多工作更强调识别精度局部路径规划单次 docking 成功而像 ADAPT 这样的论文开始越来越强调长期稳定运行户外复杂场景适应性自动化系统真实效率人工干预成本安全与鲁棒性这说明 AGV 研究正在从“我这个算法能跑”走向“我这个系统值不值得部署”。如果把这篇论文放到 AGV 技术演进里看我觉得它很像一个阶段性信号自动叉车研究开始不满足于在规则环境中做 demo而是在真正逼近复杂真实场景下的可落地系统。十六、总结这篇ADAPT论文之所以值得单独分析不是因为它用了某个特别新的网络而是因为它把自动叉车最关键的几个问题都串了起来感知环境识别托盘联合定位与建图路径规划行为树执行视觉伺服装卸长时真实评估它真正回答的是一个工业现场最关心的问题自动叉车到底能不能在复杂真实场景下稳定完成搬运任务从论文结果来看答案已经不是“还早得很”而是已经能跑而且接近实用但距离大规模稳定替代人工还差系统级优化这最后一段。这恰恰也是顶会系统论文最有价值的地方它不只展示“能做什么”还认真告诉你“还差什么”。论文信息论文标题ADAPT: An Autonomous Forklift for Construction Site Operation会议属性ICRA 2025 方向论文 / 近期自动叉车与AGV系统级代表工作关键词AGV、自动叉车、托盘搬运、施工场地、联合定位建图、Hybrid A*、视觉伺服、行为树、户外机器人

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2483485.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！