Hugging Face 中 LeRobot 使用的入门指南

news2025/7/15 19:43:28

请添加图片描述
相关源文件
.github/ISSUE_TEMPLATE/bug-report.yml
.github/PULL_REQUEST_TEMPLATE.md
README.md
examples/1_load_lerobot_dataset.py
examples/2_evaluate_pretrained_policy.py
examples/3_train_policy.py
lerobot/scripts/eval.py
lerobot/scripts/train.py

本页面提供 LeRobot 的快速入门指南,涵盖如何加载数据集、评估预训练策略以及训练您自己的模型。有关安装说明,请参阅“安装介绍”。

LeRobot 概述

LeRobot 是一个使用 PyTorch 构建的框架,为现实世界的机器人技术提供模型、数据集和工具。它专注于模仿学习(IL)和强化学习(RL)方法,这些方法可以迁移到现实世界的机器人身上。

添加图片注释,不超过 140 字(可选)

加载数据集

LeRobot 提供 LeRobot Dataset 类,可以从 Hugging Face Hub 无缝下载机器人数据集,并将其作为 PyTorch 张量提供。

添加图片注释,不超过 140 字(可选)

基本数据集加载

添加图片注释,不超过 140 字(可选)

探索数据集的元数据

无需下载完整数据集即可查看数据集的元数据:

添加图片注释,不超过 140 字(可选)

使用时间序列

LeRobotDataset 的一个关键特征,是能够根据时间戳加载帧序列:

添加图片注释,不超过 140 字(可选)

评估预训练策略

LeRobot 包含针对各种机器人任务的预训练策略,可以下载并运行:

添加图片注释,不超过 140 字(可选)

使用 Python API

以下是在 PushT 环境中评估预训练扩散策略(DP)的基本示例:

添加图片注释,不超过 140 字(可选)

使用命令行界面

LeRobot 提供一个命令行界面,用于在并行环境下进行高效的策略评估:
python lerobot/scripts/eval.py \ --policy.path=lerobot/diffusion_pusht \ --env.type=pusht \ --eval.batch_size=10 \ --eval.n_episodes=10 \ --policy.use_amp=false \ --policy.device=cuda
此命令使用 10 个并行环境在 10 episodes 上对策略进行评估,并将结果和视频保存在输出目录中。

训练策略

LeRobot 可以使用演示数据集来训练策略:

添加图片注释,不超过 140 字(可选)

使用 Python API

以下是一个简单示例,展示如何训练扩散策略:

添加图片注释,不超过 140 字(可选)
在这里插入图片描述

使用命令行界面

LeRobot 提供一个命令行界面,用于训练策略,并附带以下特征:
python lerobot/scripts/train.py \ --dataset.name=lerobot/pusht \ --policy.type=diffusion \ --steps=5000 \ --batch_size=64 \ --policy.device=cuda \ --save_freq=1000 \ --eval_freq=1000 \ --wandb.enable=true
此命令:
在 PushT 数据集上训练扩散策略 5000 步;
在环境中每 1000 步评估一次;
每 1000 步保存一次检查点;
将指标记录到 Weights & Biases(如果已配置过)。
还可以从 Hub 中复现特定训练好的模型:
python lerobot/scripts/train.py --config_path=lerobot/diffusion_pusht
这个使用与在 Hub 上训练模型时完全相同的配置。

后续步骤

现在已经了解 LeRobot 的基础知识,下一步可以:

  • 在 Hugging Face Hub 上探索更多与 LeRobot 兼容的数据集
  • 尝试不同的策略架构:
    ACT 策略(动作分块Transformer)
    Diffusion 策略(去噪扩散)
    TDMPC 策略(时间差分模型预测控制)
    VQBeT 策略(矢量量化行为Transformer)
    PI 0 策略(视觉-语言-动作 VLA)
    PI 0 FAST 策略(快速动作 token 化)
  • 在不同环境下进行实验:
    PushT:简单的推动任务
    ALOHA:双手操作
    XArm:机械臂操作
  • 在核心概念中了解 LeRobot 背后的核心概念:
  • 按照 README 中提到的 SO-100 教程构建自己的机器人

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2377021.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

零基础入门Hadoop:IntelliJ IDEA远程连接服务器中Hadoop运行WordCount

今天我们来聊一聊大数据,作为一个Hadoop的新手,我也并不敢深入探讨复杂的底层原理。因此,这篇文章的重点更多是从实际操作和入门实践的角度出发,带领大家一起了解大数据应用的基本过程。我们将通过一个经典的案例——WordCounter&…

HTML-3.3 表格布局(学校官网简易布局实例)

本系列可作为前端学习系列的笔记,代码的运行环境是在HBuilder中,小编会将代码复制下来,大家复制下来就可以练习了,方便大家学习。 系列文章目录 HTML-1.1 文本字体样式-字体设置、分割线、段落标签、段内回车以及特殊符号 HTML…

遗传算法求解旅行商问题分析

目录 一、问题分析 二、实现步骤 1)初始化种群 2)计算适应度 3)选择操作 4)交叉操作 5)变异操作 三、求解结果 四、总结 本文通过一个经典的旅行商问题,详细阐述在实际问题中如何运用遗传算法来进…

打造网络安全堡垒,企业如何应对DDoS、CC、XSS和ARP攻击

网站已经成为企业展示形象、开展业务和实现线上营销的重要平台。然而,随着网络攻击手段的不断升级,DDoS、CC、XSS、ARP等攻击频频出现,严重威胁到企业的信息安全和业务稳定。本文将详细阐述网站被攻击后应采取的应急措施及预防策略&#xff0…

深度解析物理机服务器故障修复时间:影响因素与优化策略

一、物理机故障修复的核心影响因素 物理机作为企业 IT 基础设施的核心载体,其故障修复效率直接关系到业务连续性。故障修复时间(MTTR)受多重因素交叉影响: 1. 故障类型的复杂性 硬件级故障: 简单故障:内存…

印度全印度游戏联合会(AIGF)介绍与用途

本文为印度AIGF的介绍科普文,自去年开始,印度Rummy类游戏申请印度支付都需要拥有AIGF的会员及产品证书。 如需要rummy可以通过AIGF审核的源。码,或咨询AIGF的相关内容,可以联。系老妙。 全印度游戏联合会(All India G…

可视化数据图表怎么做?如何实现三维数据可视化?

目录 一、三维数据可视化的要点 1. 明确数据可视化的目标 2. 筛选与整理数据 3. 选择合适的图表类型 4. 运用专业工具制作 5. 优化图表的展示效果 二、数据可视化图表怎么做? 1. 理解三维数据的特性 2. 数据处理与三维建模 3. 设置光照与材质效果 4. 添加…

视频分辨率增强与自动补帧

一、视频分辨率增强 1.传统分辨率增强方法 传统的视频分辨率增强方法主要基于插值技术。这些方法通过对低分辨率视频帧中已知像素点的分布规律和相邻像素之间的相关性进行分析,在两者之间插入新的像素点以达到增加视频分辨率的目的。例如,最近邻插值算…

【SPIN】用Promela验证顺序程序:从断言到SPIN实战(SPIN学习系列--2)

你写了一段自认为“天衣无缝”的程序,但如何确保它真的没有bug?靠手动测试?可能漏掉边界情况;靠直觉?更不靠谱!这时候,Promela SPIN组合就像程序的“显微镜”——用形式化验证技术,…

降本增效双突破:Profinet转Modbus TCP助力包布机产能与稳定性双提升

在现代工业自动化领域,ModbusTCP和Profinet是两种常见的通讯协议。它们在数据传输、设备控制等方面有着重要作用。然而,由于这两种协议的工作原理和应用环境存在差异,直接互联往往会出现兼容性问题。此时,就需要一种能够实现Profi…

JESD204 ip核使用与例程分析(一)

JESD204 ip核使用与例程分析(一) JESD204理解JESD204 与JESD204 PHY成对使用原因JESD204B IP核JESD204B IP核特点JESD204B IP核配置第一页第二页第三页第四页JESD204 PHY IP核配置第一页第二页JESD204理解 JESD204B是一种针对ADC、DAC设计的传输接口协议。此协议包含四层, …

Kubernetes控制平面组件:Kubelet详解(一):API接口层介绍

云原生学习路线导航页(持续更新中) kubernetes学习系列快捷链接 Kubernetes架构原则和对象设计(一)Kubernetes架构原则和对象设计(二)Kubernetes架构原则和对象设计(三)Kubernetes控…

牛客网NC22015:最大值和最小值

牛客网NC22015:最大值和最小值 题目描述 题目要求 输入:一行,包含三个整数 a, b, c (1≤a,b,c≤1000000) 输出:两行,第一行输出最大数,第二行输出最小数。 样例输入: …

浪潮云边协同:赋能云计算变革的强力引擎

在数字化浪潮以排山倒海之势席卷全球的当下,第五届数字中国建设峰会在福州盛大开幕。这场以“创新驱动新变革,数字引领新格局”为主题的行业盛会,宛如一座汇聚智慧与力量的灯塔,吸引了国内外众多行业精英齐聚一堂,共同…

【GESP】C++三级模拟题 luogu-B3848 [GESP样题 三级] 逛商场

GESP三级模拟样题,一维数组相关,难度★★✮☆☆。 题目题解详见:https://www.coderli.com/gesp-3-luogu-b3848/ 【GESP】C三级模拟题 luogu-B3848 [GESP样题 三级] 逛商场 | OneCoderGESP三级模拟样题,一维数组相关,…

腾讯怎样基于DeepSeek搭建企业应用?怎样私有化部署满血版DS?直播:腾讯云X DeepSeek!

2025新春,DeepSeek横空出世,震撼全球! 通过算法优化,DeepSeek将训练与推理成本降低至国际同类模型的1/10,极大的降低了AI应用开发的门槛。 可以预见,2025年,是AI应用落地爆发之年! ✔…

表记录的检索

1.select语句的语法格式 select 字段列表 from 表名 where 条件表达式 group by 分组字段 [having 条件表达式] order by 排序字段 [asc|desc];说明: from 子句用于指定检索的数据源 where子句用于指定记录的过滤条件 group by 子句用于对检索的数据进行分组 ha…

QT——概述

<1>, Qt概述 Qt 是⼀个 跨平台的 C 图形⽤⼾界⾯应⽤程序框架 Qt ⽀持多种开发⼯具&#xff0c;其中⽐较常⽤的开发⼯具有&#xff1a;Qt Creator、Visual Studio、Eclipse. 一&#xff0c;Qt Creator 集成开发环境&#xff08;IDE&#xff09; Qt Creator 是⼀个轻量…

DataHub:现代化元数据管理的核心平台与应用实践

一、DataHub平台概述 DataHub是由LinkedIn开源并持续维护的下一代元数据管理平台&#xff0c;它采用实时流式架构&#xff08;基于Kafka&#xff09;实现元数据的收集、处理和消费&#xff0c;为现代数据栈提供了端到端的元数据解决方案。作为数据治理的基础设施&#xff0c;D…

ubuntu服务器版启动卡在start job is running for wait for...to be Configured

目录 前言 一、原因分析 二、解决方法 总结 前言 当 Ubuntu 服务器启动时&#xff0c;系统会显示类似 “start job is running for wait for Network to be Configured” 或 “start job is running for wait for Plymouth Boot Screen Service” 等提示信息&#xff0c;并且…