麻省理工新突破:家庭场景下机器人实现精准控制,real-to-sim-to-real学习助力

news2025/6/2 14:39:41

麻省理工学院电气工程与计算机科学系Pulkit Agrawal教授,介绍了一种新方法,可以让机器人在扫描的家庭环境模拟中接受训练,为任何人都可以实现定制的家庭自动化铺平了道路。

本文将探讨通过Franka机器人在虚拟环境中训练的特点,研究人员根据手机扫描结果对家庭场景用的机器人进行模拟训练

图片

在许多自动化愿望清单中,排在首位的是一项特别耗时的任务:家务。 

有很多原因导致您在家中看不到很多真实的机器人。其中最主要的是非结构化和半结构化环境的问题。没有两个家是相同的,从布局到照明到表面到人和宠物。即使机器人可以有效地绘制每个家庭的地图,空间也总是在变化。

近几十年来,模拟已成为机器人训练的基础要素。它允许机器人在现实世界中尝试完成任务并失败数千次甚至数百万次,而这些尝试和失败所需的时间与机器人在现实世界中尝试一次所需的时间相同。

模拟失败的后果也比现实生活中的后果要低得多。想象一下,教机器人把杯子放进洗碗机需要它在这个过程中打碎 100 个现实生活中的杯子。

图片

研究员 Pulkit Agrawal 在与研究相关的视频中表示:“在虚拟世界中进行模拟训练非常有效,因为机器人可以练习数百万次。它可能打碎了一千个盘子,但这并不重要,因为一切都在虚拟世界中。”然而,就像机器人本身一样,当涉及到家庭等动态环境时,模拟只能达到一定程度。使模拟变得像手机扫描一样容易,可以大大提高机器人对不同环境的适应性。

事实上,创建一个足够强大的环境数据库最终会使系统在出现某些不可避免地移位的情况时更具适应性,无论是移动一件家具还是将盘子留在厨房柜台上。

“我们的目标是让机器人在单一环境中,在干扰、干扰、不同的光照条件和物体姿势变化的情况下,都能表现出色,”麻省理工学院 CSAIL 的 Improbable AI 实验室研究助理、最近一篇关于这项工作的论文的主要作者 Marcel Torne Villasevil 说道。“我们提出了一种利用计算机视觉领域的最新进展来动态创建数字孪生的方法。只需使用手机,任何人都可以捕捉现实世界的数字复制品,而且得益于 GPU 并行化,机器人可以在模拟环境中比现实世界更快地进行训练。我们的方法通过利用一些现实世界的演示来启动训练过程,从而消除了对大量奖励工程的需求。”

当然,RialTo 比简单地挥动手机(砰!)即可让家用机器人为您服务要复杂一些。首先,它使用您的设备通过 NeRFStudio、ARCode 或 Polycam 等工具扫描目标环境。重建场景后,用户可以将其上传到 RialTo 的界面进行详细调整,为机器人添加必要的关节等。

图片

经过改进的场景被导出并带入模拟器。在这里,目标是根据现实世界的动作和观察制定策略,例如从柜台上抓取杯子的策略。这些现实世界的演示在模拟中被复制,为强化学习提供了一些有价值的数据。“这有助于创建一个在模拟和现实世界中都行之有效的强大策略。使用强化学习的增强算法有助于指导这一过程,以确保该策略在模拟器之外应用时有效,”Torne 说。

图片

测试表明,无论是在受控的实验室环境中还是在更难以预测的现实环境中,RialTo 都能为各种任务制定强大的策略,在相同数量的演示下,其表现比模仿学习提高了 67%。这些任务包括打开烤面包机、将书放在书架上、将盘子放在架子上、将杯子放在架子上、打开抽屉和打开橱柜。对于每项任务,研究人员在三个难度不断增加的级别下测试了系统的性能:随机化物体姿势、添加视觉干扰物以及在任务执行过程中施加物理干扰。当与现实世界数据结合时,该系统的表现优于传统的模仿学习方法,尤其是在存在大量视觉干扰或物理干扰的情况下。

“这些实验表明,如果我们关心在某一特定环境中的稳健性,最好的想法是利用数字孪生,而不是试图通过在不同环境中进行大规模数据收集来获得稳健性,”不可思议的人工智能实验室主任、麻省理工学院电气工程与计算机科学 (EECS) 副教授、麻省理工学院 CSAIL 首席研究员、该研究的高级作者 Pulkit Agrawal 说。

参考完整视频 PNP机器人www.pnprobotics.com

麻省理工策略学习减轻操作员的负担缩小了 sim2real 差距

至于局限性,RialTo 目前需要三天时间才能完成全面训练。为了加快速度,该团队提到改进底层算法并使用基础模型。模拟训练也有其局限性,目前很难轻松实现模拟到现实的转移并模拟可变形物体或液体。

下一个层次

那么 RialTo 的下一步计划是什么呢?在之前努力的基础上,科学家们正在努力保持对各种干扰的稳健性,同时提高模型对新环境的适应性。“我们的下一步努力是使用预先训练的模型,加速学习过程,最大限度地减少人工输入,并实现更广泛的泛化能力,”Torne 说。

图片

Torne 表示:“我们对我们的‘即时’机器人编程概念非常热衷,机器人可以自主扫描周围环境并学习如何在模拟中解决特定任务。虽然我们目前的方法有局限性——例如需要人类进行一些初始演示,并且需要大量计算时间来训练这些策略(最多三天)——但我们认为这是实现‘即时’机器人学习和部署的重要一步。”“这种方法让我们更接近未来,机器人不需要预先存在的涵盖所有场景的策略。相反,它们可以在没有大量现实世界互动的情况下快速学习新任务。在我看来,与仅仅依赖通用的、包罗万象的策略相比,这一进步可以加速机器人技术的实际应用。”

“为了在现实世界中部署机器人,研究人员传统上依赖于从专家数据中进行模仿学习等方法,但这种方法成本高昂,或者强化学习可能不安全,”华盛顿大学计算机科学博士生 Zoey Chen 表示,他没有参与这篇论文。“RialTo 凭借其新颖的从真实到模拟到真实的管道,直接解决了现实世界 RL [机器人学习] 的安全约束和数据驱动学习方法的有效数据约束。这种新颖的管道不仅可以确保在现实世界部署之前在模拟中进行安全而稳健的训练,还可以显著提高数据收集的效率。RialTo 有潜力显著扩大机器人学习的规模,让机器人能够更有效地适应复杂的现实世界场景。”

“通过为策略学习提供廉价、可能无限的数据,模拟在真实机器人上展现了令人印象深刻的能力,”华盛顿大学计算机科学博士生 Marius Memmel 补充道,他没有参与这项研究。“然而,这些方法仅限于一些特定场景,构建相应的模拟既昂贵又费力。RialTo 提供了一种易于使用的工具,可以在几分钟内重建真实环境,而不是几个小时。此外,它在策略学习过程中大量使用收集到的演示,最大限度地减轻了操作员的负担,并缩小了 sim2real 差距。RialTo 展示了对物体姿势和干扰的稳健性,无需大量模拟器构建和数据收集即可展示出令人难以置信的真实世界性能。”

图片

Torne 与资深作者、华盛顿大学助理教授 Abhishek Gupta 和 Agrawal 共同撰写了这篇论文。其他四名 CSAIL 成员也获得了认可:EECS 博士生 Anthony Simeonov SM '22、研究助理 Zechu Li、本科生 April Chan 和 Tao Chen PhD '24。Improbable AI Lab 和 WEIRD Lab 成员也在开发该项目的过程中提供了宝贵的反馈和支持。

这项研究得到了索尼研究奖、美国政府和现代汽车公司的部分支持,并得到了华盛顿具身智能和机器人开发实验室 (WEIRD) 的协助。研究人员在2024年机器人科学与系统 (RSS 2024) 会议上展示了他们的研究成果。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2394382.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

从零实现本地语音识别(FunASR)

FunASR 是达摩院开源的综合性语音处理工具包,提供语音识别(ASR)、语音活动检测(VAD)、标点恢复(PUNC)等全流程功能,支持多种主流模型(如 Paraformer、Whisper、SenseVoic…

已解决:.NetCore控制台程序(WebAPI)假死,程序挂起接口不通

本问题已得到解决,请看以下小结: 关于《.NetCore控制台程序(WebAPI)假死,程序暂停接口不通》的解决方案 记录备注报错时间2025年报错版本VS2022 WINDOWS10报错复现鼠标点一下控制台,会卡死报错描述——报错截图——报错原因 控制台启用了“快…

Excel如何分开查看工作表方便数据撰写

首先我这里有2class和3class两个工作表 接下来我们点击视图 按照顺序分别点击新建窗口和全部重排 ### 然后就是这样 接下来就OK了

微软技术赋能:解锁开发、交互与数据潜力,共探未来创新路

在微软 Build 2025 大会以及创想未来峰会上,微软展示的一系列前沿技术与创新应用,不仅展现了其在科技领域的深厚底蕴与前瞻视野,更为开发者和企业带来了前所未有的机遇与变革动力。 领驭科技作为微软中国南区核心合作伙伴及 HKCSP 1T 首批授…

VR看房系统,新生代看房新体验

VR看房系统的概念 虚拟现实(VirtualReality,VR)看房系统,是近年来随着科技进步在房地产行业中兴起的一种创新看房方式。看房系统利用先进的计算机技术模拟出一个三维环境,使用户能够身临其境地浏览和体验房源,无需亲自…

【Linux笔记】Shell-脚本(下)|(常用命令详细版)

在(上)篇,我们详细的讲解了Shell脚本的基础知识和些许命令与实验,这次的的(下)篇,我们会详细讲解Shell脚本的常用命令 关于脚本的基础知识请各位移步到(上)篇啦~ Shell…

钉钉热点实时推送助理-思路篇

以下是针对热点实时推送助理的功能描述,结合机器学习技术栈与用户场景的通俗化解释: 快速体验的话直接用钉钉扫描下方二维码体验 1. 核心功能 (1)热点抓取引擎 类比:像蜘蛛爬取全网信息(网络爬虫信息抽取…

实验设计与分析(第6版,Montgomery)第5章析因设计引导5.7节思考题5.11 R语言解题

本文是实验设计与分析&#xff08;第6版&#xff0c;Montgomery著&#xff0c;傅珏生译) 第5章析因设计引导5.7节思考题5.11 R语言解题。主要涉及方差分析&#xff0c;正态假设检验&#xff0c;残差分析&#xff0c;交互作用图。 dataframe<-data.frame( densityc(570,565,…

《软件工程》实战— 在线教育平台开发

一、项目概述 1.1 项目背景与目标 随着教育数字化转型加速&#xff0c;传统教育模式逐渐向线上迁移&#xff0c;教育机构急需一个支持多终端访问、实时互动及高并发场景稳定运行的在线教育平台。本项目旨在构建学生、教师、管理员三位一体的协作教学环境&#xff0c;实现 50-2…

iOS 使用CocoaPods 添加Alamofire 提示错误的问题

Sandbox: rsync(59817) deny(1) file-write-create /Users/aaa/Library/Developer/Xcode/DerivedData/myApp-bpwnzikesjzmbadkbokxllvexrrl/Build/Products/Debug-iphoneos/myApp.app/Frameworks/Alamofire.framework/Alamofire.bundle把这个改成 no 2 设置配置文件

Python打卡训练营学习记录Day41

DAY 41 简单CNN 知识回顾 数据增强卷积神经网络定义的写法batch归一化&#xff1a;调整一个批次的分布&#xff0c;常用与图像数据特征图&#xff1a;只有卷积操作输出的才叫特征图调度器&#xff1a;直接修改基础学习率 卷积操作常见流程如下&#xff1a; 1. 输入 → 卷积层 →…

C++深入类与对象

在上一篇中提到了构造函数&#xff0c;那么这篇再来提一下构造函数&#xff0c;编译器自动生成的默认构造函数对于内置类型不做处理&#xff0c;自定义类型会调用它自己的构造函数。对于自己写的构造函数&#xff0c;之前是在函数体中初始化&#xff0c;当然不止这一种初始化&a…

阿里云服务器邮件发送失败(dail tcp xxxx:25: i/o timeout)因为阿里云默认禁用 25 端口

最近在测试发送邮件的功能&#xff0c;发现了一个奇怪的问题&#xff0c;同样的 docker 镜像&#xff0c;在本地跑起来是可以正常发送邮件的&#xff0c;但是在阿里云的服务器上跑&#xff0c;就会报错 i/o timeout。 排查了一圈发现&#xff0c;原来是阿里云的操作&#xff0…

力扣HOT100之动态规划:322. 零钱兑换

这道题和上一道题279.完全平方数的套路是完全一样的&#xff0c;但是这道题不需要我们自己生成物品列表&#xff0c;函数的输入中已经给出了&#xff0c;但是这道题有一个坑&#xff0c;就是我们在初始化dp数组的时候&#xff0c;所有的位置不应该赋值为INT_MAX&#xff0c;因为…

电商售后服务系统与其他系统集成:实现售后流程自动化

在竞争激烈的电商市场中&#xff0c;优质的售后服务对于提升用户满意度和忠诚度至关重要。然而&#xff0c;售后服务流程通常涉及多个环节和系统&#xff0c;如何高效地管理这些流程&#xff0c;减少人工干预&#xff0c;提升服务效率&#xff0c;是电商企业亟待解决的问题。电…

kafka学习笔记(三、消费者Consumer使用教程——消费性能多线程提升思考)

1.简介 KafkaConsumer是非线程安全的&#xff0c;它定义了一个acquire()方法来检测当前是否只有一个线程在操作&#xff0c;如不是则会抛出ConcurrentModifcationException异常。 acquire()可以看做是一个轻量级锁&#xff0c;它仅通过线程操作计数标记的方式来检测线程是否发…

[JVM] JVM内存调优

&#x1f338;个人主页:https://blog.csdn.net/2301_80050796?spm1000.2115.3001.5343 &#x1f3f5;️热门专栏: &#x1f9ca; Java基本语法(97平均质量分)https://blog.csdn.net/2301_80050796/category_12615970.html?spm1001.2014.3001.5482 &#x1f355; Collection与…

秒出PPT正式改名秒出AI,开启AI赋能新体验!

在现代办公环境中&#xff0c;借助智能工具提升工作效率已经成为趋势。秒出AI作为一款集AI PPT制作、动画、巨幕、视频、设计以及智能简历功能于一体的综合办公平台&#xff0c;为用户提供一站式智能内容生成解决方案&#xff0c;极大地简化了内容创作流程。 1. AI驱动的一键P…

VM改MAC电脑密码(截图)

进入恢复模式重置密码 重启mac并同时按下CommandR&#xff0c;进入恢复模式。进入「菜单栏-实用程序-终端」&#xff0c;输入命令「resetpassword」回车运行&#xff0c;调出密码重置工具。选择包含密码的启动磁盘卷宗、需重设密码的用户账户&#xff1b;输入并确认新的用户密…

SpringBoot+Vue+微信小程序校园自助打印系统

概述​​ 校园自助打印系统是现代化校园建设中不可或缺的一部分&#xff0c;基于SpringBootVue微信小程序开发的​​免费Java源码​​项目&#xff0c;包含完整的用户预约、打印店管理等功能模块。 ​​主要内容​​ ​​ 系统功能模块​​ ​​登录验证模块​​&#xff1a;…