具身Scaling Law押对了!独角兽新品1小时学会新任务,重复1800次成功率99%
克雷西 发自 凹非寺量子位 | 公众号 QbitAI机器人也开始内卷了一位表现极其离谱的“新员工”直接拉高了机器人的“就业门槛”。具身智能独角兽Generalist刚刚推出了最新的研究成果——新模型Gen-1。在包装手机和折叠纸箱这些精细活儿上它把机器人的成功率从64%硬生生拉到了99%几乎告别了手残职业病。以前折叠一个标准纸箱需要慢悠悠地磨掉34秒现在GEN-1仅用12.1秒就能完成效率直接开启了3倍速模式。而且GEN-1的表现也用实际表现验证了机器人领域的Scaling Law。机器人模型卷出新高度GEN-1上岗后的表现简直像是在倍速播放而且即便面对维护扫地机器人200次这种枯燥任务它也能稳如泰山。甚至连续装箱1800次也能从从容容游刃有余。更离谱的是它处理突发状况的脑回路。如果零件在流水线上被意外撞歪了它绝不会傻站在那儿报错会自己切换抓取角度甚至动用两只手配合着把活干完。这种靠直觉解决问题的即兴智能让它在处理乱七八糟的杂物时表现得像个干了十年的老师傅那种死读程序的铁疙瘩僵硬感彻底消失了。用人类活动记录训练机器人为了让GEN-1具备使机器人变身“全能打工人”的能力研发团队对数据处理架构进行了重写。他们没有死磕昂贵且难以扩展的机器人遥操作数据这条老路转而通过低成本穿戴设备捕捉了数百万项人类活动记录让AI像看电影一样预习物理世界的潜规则。这种“去机器人化”的预训练方案巧妙绕过了数据规模的瓶颈让基础模型在接触机械臂之前就已经从人类视角洞察了空间、时间与物理因果。这种基于50万小时高保真物理交互数据集练就的底座让它的学习效率直接起飞达到了前代模型的10倍。哪怕是面对从未见过的奇怪任务或陌生的机器身体给GEN-1一个小时的实机演示也能让它火速入职。另外为了让机器人的动作不再卡成PPT以及实现实时操控研发团队还在推理端祭出了两项关键技术。首先是专门为物理世界打造的分页注意力Paged Attention机制。在处理PB级别的物理交互数据流时传统的内存管理方式容易导致计算资源分配不均进而产生响应延迟。Paged Attention通过更高效地调度计算资源解决了动作指令发射时的调度难题确保每一个动作指令都能在毫秒级的时间维度内即时发射让AI的反应速度能跟上现实世界的物理节奏。配合演进的还有一套Harmonic Reasoning系统。它作为推理层面的核心组件改变了以往单一路径预测动作的死板模式。它允许模型在输出指令时通过多尺度的动态调节来引导权重使其在执行折叠纸箱或包装手机等复杂动态任务时能够展现出超越单一模型权重分布的性能上限。研发团队为此投入数月时间优化训练稳定性并编写了大量自定义内核来压榨硬件算力的极限。机器人领域的Scaling LawGEN-1的性能跨越证明了Scaling Law在物理世界依然有效——只要喂够了数据和算力机器人的脑子也会产生“开窍”时刻。通过大规模预训练机器人不再生硬地模仿动作序列自己悟出了空间、时间和因果关系的规律感知到了物体之间的相互影响。有了直觉之后机器人干活就开始带点“灵性”。当任务中途出现没见过的阻碍它会自发尝试一些教学大纲以外的操作比如发现东西塞不进去时会像人一样晃晃袋子。这种即兴解题的能力源于它真正理解了“动作会导致后果”的逻辑。即使现场零件被意外撞歪它也能凭直觉找回节奏不需要人类像保姆一样每一步都盯着纠错。这种在真实世界摔打出来的经验让原本悬浮在百科全书里的抽象文字变成了实打实的行动力。研发团队通过对齐技术给这种即兴天赋装上了“导航仪”确保机器人“临场发挥”的动作依然会严丝合缝地待在用户设定的规范里。这种进化让机器人从一个只能按部就班的机器变成了一个真正懂物理常识、能独立处理复杂局面的“职场老手”。DeepMind大牛创业成果GEN-1的底层逻辑源于资深团队在机器人领域的长期积累创始人Pete Florence的技术背景为这一方案提供了深厚的理论底色。他曾任Google DeepMind高级研究科学家通过Dense Object Nets等工作探索了视觉引导下机器人从感知到动作的端到端学习路径。在谷歌PaLM团队工作期间他作为核心力量参与并主导了PaLM-E、RT-2等多个具备代际跨越意义的机器人项目。2024年Pete Florence离开谷歌并创立了Generalist。即便在他离职后的2025年3月DeepMind在发布的Gemini Robotics论文中依然四次引用了他参与合著的研究。参考链接https://generalistai.com/blog/apr-02-2026-GEN-1—完— 风云变幻的Q1谁是AI超级应用量子位智库「AI 100」旗舰、创新双产品榜单开启招募扫码申报让你的产品成为季度风向标。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2492894.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!