谈AI/OT 的融合

news2025/5/13 11:05:15

         过去的十几年间,工业界讨论最多的话题之一就是IT/OT 融合,现在,我们不仅要实现IT/OT 的融合,更要面向AI/OT 的融合。看起来不太靠谱,却留给我们无限的想象空间。OT 领域的专家们不要再当“九斤老太”,指责这个不靠谱,那个不可靠。 创新的步伐永无止境, 要学习迪士尼公司的精神,做出了娱乐领域机器人的大模型,不断地用新技术在自己的一亩三分地上,构建护城河。别人靠某些雕虫小技都难以打进他们的领地。

        本文以AI 大模型为核心的机器人技术迅速突起,特别是通用型人形机器人的热门话题为契机,谈谈AI/OT 融合的重要性。

        大模型为主的机器人技术领域颠覆了我们的三观。这些技术与过去自动控制领域的许多观点是截然不同,也许这就是所谓的“All In AI ”吧。在过去很长一段时间,机械臂的运动轨迹都是预先规划和编程的。 建立一个机械臂应用需要使用机械臂公司提供的机器臂语言编写, 使用通信协议进行设置,或者使用示教器编程。这些运动轨迹往往是固定的,预定义的,开发工作的陈本很高。

    AI 大模型出现之后,机器人控制范式发生了变化,机器人控制器通过收集环境参数,机器人自身的状态以及完成的命令(也许是将红球放到盒子里),通过大模型(通常称为物理大模型)生成运动轨迹,进一步有ROS 控制执行部件完成物理动作。这里传统的机械臂编程都不需要了,之前多数是使用一台PLC ,或者工业电脑PC 来实现。其中可能涉及各种协议(),现在好像不需要了,而且机器人控制的编程范式也发生了巨大的不同。也许工业控制行业的专家们又要责怪IT 行业“不讲武德”了。而且还会振振有词地断定,AI 是不可靠的。其实,只要存在测量,模拟量就可能产生误差,有误差就有可能导致算法失效。除非格外设置保护装置。 

        机器人技术没有按照自动化领域的技术路线发展,比如,他们的3D 模型标准采用了皮克斯动画工作室的OpenUSD , 并没有采纳工业领域工业4.0, OPCUA ,AAS 等诸多标准。

     基于AI 大模型,可能实现通用机器人。无需编程,只要做足够的训练,就能应付各种应用。

     

                                                迪士尼公司基于NVIDIA Isaac的机器人 

     无论如何,工业控制领域的专家们要看看“AI 小子”是如何玩转AI 机器人的。带着这份好奇心,笔者开始学习nvidia 的相关技术。由于内容比较多,每一项技术都看上去十分高大上,初次接触,感觉傻傻地分不清楚。本文下面的内容也许存在错误。千万不要轻易推荐给大模型哈。

  下面我们以NVIDIA 的机器人平台√为例,讨论一下未来机器人技术的发展方向。

NVIDIA Isaac Lab

        NVIDIA ç™ AI 机器人开发平台由 NVIDIA® CUDA® 加速库、应用程序框架和 AI 模型组成,可加速自主移动机器人 (AMR)、手臂和机械手以及人形机器人等 AI 机器人的开发。

Isaac的架构

 Isaac的 平台

自定义世界模型

 NVIDIA Cosmos是一个平台,旨在帮助开发者为物理 AI 系统大规模构建自定义世界模型。它为从数据管理到训练再到定制的每个开发阶段提供开放世界基础模型和工具。

仿真 Isaac SIM

   Isaac最大的特点是仿真,可以在电脑上做各种的仿真和机器人的训练。 这可以大幅度提高机器人大模型的训练。

     Isaac Sim 是基于 Omniverse 的机器人仿真应用工具。它可以将机器人模型等资产导入使用 Omniverse 构建的逼真虚拟环境(数字孪生),并进行操作模拟和导航模拟。这些模拟器有助于降低机器人引入所需的成本和工时。

3D 运行环境(Omniverse)

   仿真需要在一个3D 的运行环境中完成,Nvidai 的Omniverse 就是这种3D 运行环境。NVIDIA Omniverse 是一个用于大规模构建和运行 3D 应用程序和服务的开发平台。

        Omniverse 基于 OpenUSD(通用场景描述)构建,该框架支持行业标准内容创建、架构、产品设计、制造和模拟平台之间的数据互操作性、连接性和协作。

        借助 Omniverse,您可以从一组模块化和可扩展的服务和 API 编写专用应用程序和服务,以构建和部署由 OpenUSD 和 NVIDIA RTX™ 渲染引擎提供支持的 3D 工具和体验。

通用场景描述 (OpenUSD)

通用场景描述 (OpenUSD) 不仅仅是一种文件格式。它是一个开放且可扩展的生态系统,用于在 3D 世界中描述、组合、模拟和协作。

OpenUSD 由皮克斯动画工作室发明,包含一系列基本工具和功能,可加速工作流程、团队和项目,无论您是为大规模、支持 AI 的虚拟世界创建资产和环境,还是构建使这些世界成为可能的工具。

Isaac ROS

       Isaac ROS 应该是机器人硬件控制器的运行时,部署在NVIDIA Jetson™

        Isaac ROS 为您提供了一套强大的工具包,用于构建机器人应用程序。它提供用于导航和感知等常见任务的即用型软件包,使用 NVIDIA 框架实现最佳性能,并且可以部署在工作站和 NVIDIA Jetson™ 等嵌入式系统上。 

在isaac ROS 之上,构建了三种应用的架构,分别是 自主移动机器人,机械臂和人形机器人。

Isaac Perceptor 

Isaac Perceptor 基于 Isaac ROS 构建,能够快速开发先进的自主移动机器人 (AMR),这些机器人可以在仓库或工厂等非结构化环境中感知、定位和操作。

Isaac Manipulator 

Isaac Manipulator 基于 Isaac ROS 构建,支持开发能够无缝感知、理解和与环境交互的人工智能机械臂。

Isaac ROS GEM 硬件平台

Isaac ROS 可以在jetson 上运行,也可以在配GPU 的PC (ubuntu OS)上运行。

NVIDIA Isaac GR00T

  NVIDIA Isaac GR00T 是一个研究计划和开发平台,用于通用机器人基础模型和数据管道,以加速人形机器人(Humanoid Robot)技术。

      2025年3月18日,英伟达宣布了 GR00T N1。由NVIDIA、Google DeepMind 和迪士尼研究院合作开发。

  GR00T N1 基础模型采用双系统架构,其灵感源自人类认知原理。“系统 1”是一种快速思考的行动模型,模拟人类的反应或直觉。“系统 2”是一种慢速思考的模型,用于进行深思熟虑、有条理的决策。

 GR00T N1  Github网址:

https://github.com/NVIDIA/Isaac-GR00T

 架构

系统 2  

     在视觉语言模型的支持下,系统 2 能够推理其所处环境和收到的指令,从而规划动作。 

系统 1

        系统 1 将这些规划转化为精确、连续的机器人动作。 基于人类演示数据以及NVIDIA Omniverse™平台生成的大量合成数据进行训练。

迪士尼的机器人就是采用了双jetson 硬件架构。

硬件性能考虑

  • 微调性能:我们使用 1 个 H100 节点或 L40 节点进行微调,以获得最佳效果。其他硬件配置(例如 A6000、RTX 4090)也可以使用,但可能需要更长时间才能收敛。具体的批次大小取决于硬件以及正在调整的模型组件。
  • LoRA 微调:我们使用了 2 块 A6000 GPU 或 2 块 RTX 4090 GPU 进行 LoRA 微调。用户可以尝试不同的配置,以实现有效的微调。
  • 推理性能:对于实时推理,大多数现代 GPU 在处理单个样本时的性能相似。我们的基准测试显示,L40 和 RTX 4090 在推理速度方面差异很小。

     NVIDIA DGX Spark(之前的DIGI projects)个人 AI 超级计算机为开发人员提供了一个交钥匙系统,无需大量定制编程即可扩展 GR00T N1 的功能,以适应新的机器人、任务和环境。

开源物理引擎 Newton        

             Newton 是一个开源、可扩展的物理引擎,由 NVIDIA、Google DeepMind 和 Disney Research 开发,旨在推动机器人的学习和发展。 

我理解 Newton 是在Isaac GR00T基础上开发的。

   物理AI模型使机器人能够自主感知、解释、推理并与现实世界互动。加速计算和模拟是开发下一代机器人技术的关键。

        物理AI 在机器人仿真扮演着至关重要的角色,它为在现实环境中精确地虚拟呈现机器人的行为和交互奠定了基础。借助这些模拟器,研究人员和工程师可以安全、快速且经济高效地训练、开发、测试和验证机器人控制算法和原型设计。 

        机器人模拟建立在物理学的基本定律之上,包括质量和动量守恒、刚体和软体动力学、接触和摩擦以及执行器建模。这些原理用于预测机器人在各种场景和环境中的行为。

牛顿物理引擎预计将于2025年晚些时候上市。

结束语

基于AI 大模型的通用机器人技术与传统机器人控制范式完全不同。机器人技术可能脱离原有的自动范式。值得自动控制行业的重视,是否要改变原有的技术·方向呢?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2374604.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

USB传输模式

USB有四种传输模式: 控制传输, 中断传输, 同步传输, 批量传输 1. 中断传输 中断传输一般用于小批量, 非连续的传输. 对实时性要求较高. 常见的使用此传输模式的设备有: 鼠标, 键盘等. 要注意的是, 这里的 “中断” 和我们常见的中断概念有差异. Linux中的中断是设备主动发起的…

.NET10 - 尝试一下Open Api的一些新特性

1.简单介绍 .NET9中Open Api有了很大的变化,在默认的Asp.NET Core Web Api项目中,已经移除了Swashbuckle.AspNetCore package,同时progrom中也变更为 builder.Servers.AddOpenApi() builder.Services.MapOpenApi() 2025年微软将发布…

RabbitMQ 工作模式

RabbitMQ 一共有 7 中工作模式,可以先去官网上了解一下(一下截图均来自官网):RabbitMQ 官网 Simple P:生产者,要发送消息的程序;C:消费者,消息的接受者;hell…

基于C++的多线程网络爬虫设计与实现(CURL + 线程池)

在当今大数据时代,网络爬虫作为数据采集的重要工具,其性能直接决定了数据获取的效率。传统的单线程爬虫在面对海量网页时往往力不从心,而多线程技术可以充分利用现代多核CPU的计算能力,显著提升爬取效率。本文将详细介绍如何使用C…

【日撸 Java 三百行】Day 11(顺序表(一))

目录 Day 11:顺序表(一) 一、关于顺序表 二、关于面向对象 三、代码模块分析 1. 顺序表的属性 2. 顺序表的方法 四、代码及测试 拓展: 小结 Day 11:顺序表(一) Task: 在《数…

软考 系统架构设计师系列知识点之杂项集萃(55)

接前一篇文章:软考 系统架构设计师系列知识点之杂项集萃(54) 第89题 某软件公司欲开发一个Windows平台上的公告板系统。在明确用户需求后,该公司的架构师决定采用Command模式实现该系统的界面显示部分,并设计UML类图如…

保持Word中插入图片的清晰度

大家有没有遇到这个问题,原本绘制的高清晰度图片,插入word后就变模糊了。先说原因,word默认启动了自动压缩图片功能,分享一下如何关闭这项功能,保持Word中插入图片的清晰度。 ①在Word文档中,点击左上角的…

Linux复习笔记(三) 网络服务配置(web)

遇到的问题,都有解决方案,希望我的博客能为你提供一点帮助。 二、网络服务配置 2.3 web服务配置 2.3.1通信基础:HTTP协议与C/S架构(了解) ​​HTTP协议的核心作用​​ Web服务基于HTTP/HTTPS协议实现客户端&#xff…

springboot旅游小程序-计算机毕业设计源码76696

目 录 摘要 1 绪论 1.1研究背景与意义 1.2研究现状 1.3论文结构与章节安排 2 基于微信小程序旅游网站系统分析 2.1 可行性分析 2.1.1 技术可行性分析 2.1.2 经济可行性分析 2.1.3 法律可行性分析 2.2 系统功能分析 2.2.1 功能性分析 2.2.2 非功能性分析 2.3 系统…

uniapp自定义导航栏搭配插槽

<uni-nav-bar dark :fixed"true" shadow background-color"#007AFF" left-icon"left" left-text"返回" clickLeft"back"><view class"nav-bar-title">{{ navBarTitle }}</view><block v-slo…

MFC listctrl修改背景颜色

在 MFC 中修改 ListCtrl 控件的行背景颜色&#xff0c;需要通过自绘&#xff08;Owner-Draw&#xff09;机制实现。以下是详细的实现方法&#xff1a; 方法一&#xff1a;通过自绘&#xff08;Owner-Draw&#xff09;实现 步骤 1&#xff1a;启用自绘属性 在对话框设计器中选…

SpringBoot+Dubbo+Zookeeper实现分布式系统步骤

SpringBootDubboZookeeper实现分布式系统 一、分布式系统通俗解释二、环境准备&#xff08;详细版&#xff09;1. 软件版本2. 安装Zookeeper&#xff08;单机模式&#xff09; 三、完整项目结构&#xff08;带详细注释&#xff09;四、手把手代码实现步骤1&#xff1a;创建父工…

Linux进程10-有名管道概述、创建、读写操作、两个管道进程间通信、读写规律(只读、只写、读写区别)、设置阻塞/非阻塞

目录 1.有名管道 1.1概述 1.2与无名管道的差异 2.有名管道的创建 2.1 直接用shell命令创建有名管道 2.2使用mkfifo函数创建有名管道 3.有名管道读写操作 3.1单次读写 3.2多次读写 4.有名管道进程间通信 4.1回合制通信 4.2父子进程通信 5.有名管道读写规律&#xff…

精品可编辑PPT | 全面风险管理信息系统项目建设风控一体化标准方案

这份文档是一份全面风险管理信息系统项目建设风控一体化标准方案&#xff0c;涵盖了业务架构、功能方案、系统技术架构设计、项目实施及服务等多个方面的详细内容。方案旨在通过信息化手段提升企业全面风险管理工作水平&#xff0c;促进风险管理落地和内部控制规范化&#xff0…

YOLOv8网络结构

YOLOv8的网络结构由输入端(Input)、骨干网络(Backbone)、颈部网络(Neck)和检测头(Head)四部分组成。 YOLOv8的网络结构如下图所示&#xff1a; 在整个系统架构中&#xff0c;图像首先进入输入处理模块&#xff0c;该模块承担着图像预处理与数据增强的双重任务。接着&#xff0c…

笔记本电脑升级实战手册【扩展篇1】:flash id查询硬盘颗粒

文章目录 前言&#xff1a;一、硬盘颗粒介绍1、MLC&#xff08;Multi-Level Cell&#xff09;2、TLC&#xff08;Triple-Level Cell&#xff09;3、QLC&#xff08;Quad-Level Cell&#xff09; 二、硬盘与主控1、主控介绍2、主流主控厂家 三 、硬盘颗粒查询使用flash id工具查…

AutoDL租用服务器教程

在跑ai模型的时候&#xff0c;容易遇到算力不够的情况。此时便需要租用服务器。autodl是个较为便宜的服务器租用平台&#xff0c;h20仅需七点几元每小时。下面是简单的介绍。 打开网站AutoDL算力云 | 弹性、好用、省钱。租GPU就上AutoDL&#xff0c;并登录账号 登录后&#xff…

goner/otel 在Gone框架接入OpenTelemetry

文章目录 背景与意义快速上手&#xff1a;五步集成 OpenTelemetry运行效果展示代码详解与实践目录结构说明组件加载&#xff08;module.load.go&#xff09;业务组件示例&#xff08;your_component.go&#xff09;程序入口&#xff08;main.go&#xff09; 进阶用法与最佳实践…

杨校老师项目之基于SSM与JSP的鲜花销售系统-【成品设计含文档】

基于SSMJSP鲜花商城系统 随着电子商务的快速发展&#xff0c;鲜花在线销售已成为一种重要的消费模式。本文设计并实现了一个基于JSP技术的鲜花销售管理系统&#xff0c;采用B/S架构&#xff0c;使用SSM框架进行开发&#xff0c;并结合Maven进行项目依赖管理。系统分为前台用户模…

springboot集成langchain4j实现票务助手实战

前言 看此篇的前置知识为langchain4j整合springboot&#xff0c;以及springboot集成langchain4j记忆对话。 Function-Calls介绍 langchain4j 中的 Function Calls&#xff08;函数调用&#xff09;是一种让大语言模型&#xff08;LLM&#xff09;与外部工具&#xff08;如 A…