使用新的 NVIDIA Isaac Foundation 模型和工作流程创建、设计和部署机器人应用程序

使用新的 NVIDIA Isaac Foundation 模型和工作流程创建、设计和部署机器人应用程序

机器人技术的应用正在智能制造设施、商业厨房、医院、仓库物流和农业领域等各种环境中迅速扩展。该行业正在转向智能自动化,这需要增强机器人功能,以执行感知、绘图、导航、负载处理、物体抓取和复杂的装配任务等功能。

人工智能在这一演变中发挥着关键作用,提高了机器人的性能。通过集成 NVIDIA AI 加速,机器人可以更精确、更高效地处理复杂任务,在各种应用中充分发挥其潜力。

在 COMPUTEX 上,我们宣布了多项新功能,以帮助机器人专家和工程师构建智能机器人。这些包括:

  • NVIDIA Isaac Perceptor,一种用于自主移动机器人 (AMR) 和自动导引车 (AGV) 的新参考工作流程。
  • NVIDIA Isaac Manipulator 为工业机械臂提供了新的基础模型和参考工作流程。
  • NVIDIA Jetson for Robotics,在 NVIDIA JetPack 6.0 中进行了新的更新。
  • NVIDIA Isaac Sim 4.0 带来了 NVIDIA Isaac Lab,这是一款用于机器人学习的轻量级应用程序。

NVIDIA Isaac Perceptor

AMR 和 AGV 对于装配线效率、物料搬运和医疗保健物流至关重要。当这些机器人在复杂且非结构化的环境中导航时,感知和响应周围环境的能力变得至关重要。

Isaac Perceptor 建立在 NVIDIA Isaac 机器人操作系统 (ROS) 之上,使原始设备制造商 (OEM)、货运服务提供商、软件供应商和 AMR 生态系统能够加速机器人技术的发展。团队可以为移动机器人配备感知功能,以便在非结构化环境中成功导航和避障。

Isaac Perceptor 的早期合作者包括汽车制造商、工业机器人制造公司和机器人解决方案提供商的仓储/内部物流行业领导者,例如 ArcBest、比亚迪电子、Gideon、KION、Kudan、idealworks、RGo 和 Teradyne Robotics。

Isaac Perceptor 的主要功能

Isaac Perceptor 提供多种功能,为基于 AI 的自主移动机器人提供多摄像头、3D 环视功能。

基于 AI 的多摄像头深度感知

Isaac Perceptor 以 30 Hz 的频率每秒处理每台摄像头 16.5M 个深度点。立体视差是根据来自立体摄像头的时间同步图像对计算得出的,用于为场景生成深度图像或点云。高效的半监督深度神经网络 (ESS DNN) 为基于 DNN 的立体视差提供了 GPU 加速包。

多摄像头视觉惯性里程计

Isaac ROS Visual SLAM 提供 ROS 2 软件包,用于视觉同步定位和地图绘制 (VSLAM) 和视觉里程计 (VO)。它基于 NVIDIA CUDA Visual SLAM (cuVSLAM) 库,可在无特征环境中导航时提供强大的导航功能,翻译误差小于 1%。

在具有稀疏视觉特征或重复模式的环境中导航是 VSLAM 解决方案面临的一个众所周知的挑战。这可以通过融合来自多个视点的输入来缓解。在最新更新中,cuVSLAM 结合了来自多个立体摄像头的并发视觉里程计估计。

我们的测试表明有显著的改进。机器人使用多个摄像头始终能够实现其导航目标,而使用单个摄像头时,实现目标的几率不到 25%。

VO methodRuntime
cuVSLAM5 ms
FRVO, S-PTAM30 ms
ORB-SLAM260 ms

实时多摄像头体素网格映射

Isaac Perceptor 的核心是 nvblox,这是一个 CUDA 加速的 3D 重建库,可以识别最远五米外的障碍物,以提供 2D 成本图并在 300 毫秒内更新它们。

Isaac ROS nvblox 提供 ROS 2 软件包,用于 3D 场景重建和导航的本地障碍物成本图生成。此软件包可用于静止环境以及有人和移动物体的场景。

此版本中的新功能是多摄像头支持,可使用最多三个 HAWK 摄像头扩大覆盖范围,提供约 270° 的视野。

有关更多信息,请访问 Isaac ROS nvblox 文档。

NVIDIA Nova Orin 开发套件

此开发套件采用 NVIDIA Jetson AGX Orin,支持多达六个摄像头,包括多达三个立体摄像头和三个鱼眼摄像头,摄像头内延迟低于 100 微秒。

立体摄像头的分辨率为每台 2MP,视野为 110X70,适用于 3D 占用网格映射、深度感知、视觉里程计和人员检测。从 Segway 或 Leopard Imaging 购买 Nova Orin 开发套件即可使用 Isaac Perceptor。

Isaac Perceptor 有一个参考图,支持此开发套件上多达三个立体摄像头。通过与 ROS 2 软件包的增强模块化,此版本还具有与 Nova Carter 参考机器人上的 Nav2 的参考集成。

增强了与摄像头和传感器的兼容性

Isaac Perceptor 为与摄像头和传感器合作伙伴的集成提供了增强的支持。Orbbec 成功将其 Gemini 335L 摄像头与 NVIDIA Isaac Perceptor 组件集成。这种集成在 NVIDIA Jetson AGX Orin 上使用 Isaac ROS Visual SLAM 和 Nvblox 进行了演示。

LIPS 还成功将其 AE450 摄像头与 Isaac Perceptor 组件 Nvblox 集成。

NVIDIA Isaac Manipulator

Isaac Manipulator 是 NVIDIA 加速库和 AI 模型的工作流程。它使开发人员能够将 AI 加速带入机械臂或操纵器,从而无缝感知、理解和与环境交互。

其基础模型和加速库可以作为独立模块或作为解决方案开发中的整个工作流程进行集成。除了独立的模块化组件外,还为开发人员提供了示例工作流程(ROS 2 启动脚本),这些工作流程结合了 Isaac Manipulator 组件,以实现完整的端到端参考集成。

Isaac Manipulator 的早期合作者包括机器人开发平台公司、OEM 和 ISV/SI,包括 Intrinsic(Alphabet 旗下公司)、西门子、Solomon、Techman Robot、Teradyne Robotics、Vention 和 Yaskawa。

Isaac Manipulator 的主要功能

Isaac Manipulator 提供 AI 功能,以加速机械臂的开发。

cuMotion 可实现更快的路径规划

这款 GPU 加速的运动规划器有助于缩短周期时间。cuMotion 可作为 MoveIt 2 运动规划框架的插件使用,该框架是由国际社区开发并由 PickNik Robotics 领导的开源项目。

cuMotion 可同时在多个种子上运行轨迹优化并返回最佳解决方案。

Solomon 是先进视觉和机器人解决方案领域的领导者,也是 Isaac Manipulator 的早期合作者。与传统算法相比,他们的箱体拾取系统通过 Isaac Manipulator cuMotion 增强,使路径规划速度提高了 8 倍,路径奇异性发生率降低了 50%。

指标改进率 (%)
成功率改进346.43
移动时间减少55.50
轨迹长度减少42.27
轨迹规划时间减少816.66

FoundationPose

FoundationPose 是一种新的统一基础模型,用于单次 6D 姿势估计和新物体跟踪。该模型旨在在遇到以前未见过的物体的应用中以高精度工作,而无需进行微调。

FoundationPose 目前在 2023 年 BOP 排行榜上名列前茅,用于对未见过的物体进行 6D 定位。它对遮挡、快速运动和纹理和比例等各种物体属性具有很强的鲁棒性,可确保在各种场景中提供可靠的性能。开发人员可以从任何角度生成物体的真实视图。从 GitHub 获取 Foundation Pose 模型。

SyntheticaDETR

SyntheticaDETR 是一组基于实时检测变换器 (DETR) 的模型,用于使用 NVIDIA Omniverse 生成的合成数据进行单次图像空间物体检测。它通过使用变换器编码器-解码器架构一次性预测所有物体,从而实现了一种比传统物体检测器更有效的方法。

SyntheticaDETR 经过合成数据和真实数据训练,在 YCB-Video 数据集上可见物体的 2D 检测 BOP 排行榜上名列前茅(平均精度为 0.885,平均召回率为 0.903)。

这些模型还可以将物体检测为姿势估计器(如 NVIDIA FoundationPose)的 2D 边界框感兴趣区域。下载 SyntheticaDETR 模型并下载 Isaac Manipulator。

NVIDIA JetPack 6.0

NVIDIA Isaac ROS 3.0 与 JetPack 6.0 兼容,并受所有 NVIDIA Jetson Orin 模块和开发套件支持。

NVIDIA Jetson Platform Services 即将推出模块化、API 驱动的服务,以更快、更轻松地构建生成式 AI 和机器人应用程序。这些预构建和可定制的服务旨在加速 NVIDIA Jetson Orin 系统模块上的 AI 应用程序开发。

NVIDIA Isaac Sim 4.0

使用 Isaac Sim,开发人员可以使用业界领先的传感器和机器人类型测试生成合成数据和多样化的虚拟复杂测试环境。这可以实现高度逼真的模拟,以实时同时测试数千个机器人。

NVIDIA Isaac Lab

Isaac Lab 是一款基于 Isaac Sim 平台构建的轻量级参考应用程序,在机器人基础模型训练中发挥着关键作用。它支持强化学习、模仿学习和迁移学习。它可以训练各种机器人实例,供开发人员探索设计和功能。

新版本还提供了易于使用的功能,包括与兼容性检查器的 VSCode 集成、对强化学习的多 GPU 支持、通过 RTX 传感器平铺渲染实现的性能改进、优化的缓存和着色器管理。

Isaac Sim 中的其他新功能包括:

  • 易于使用的 PIP 安装和用于导入机器人等的向导。

  • 性能提高,合成数据生成 (SDG) 速度提高 80%
    支持 COCO 格式和用于姿势估计的自定义编写器的新 SDG 格式。

  • ROS 2 推出支持端到端工作流程和更好的图像发布性能。

  • 更多内置机器人支持:包括 Universal Robots UR20 和 UR30 以及 Boston Dynamics Spot。还有许多人形机器人,包括 1X Neo、Unitree H1、Agility Digit、Fourier Intelligence GR1、Sanctuary A1 Phoenix 和 XiaoPeng PX5。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/678386.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【人工智能】第四部分:ChatGPT的技术实现

人不走空 🌈个人主页:人不走空 💖系列专栏:算法专题 ⏰诗词歌赋:斯是陋室,惟吾德馨 目录 🌈个人主页:人不走空 💖系列专栏:算法专题 ⏰诗词歌…

【WEB前端2024】3D智体编程:乔布斯3D纪念馆-第35课-3D互动教材

【WEB前端2024】3D智体编程:乔布斯3D纪念馆-第35课-3D互动教材 使用dtns.network德塔世界(开源的智体世界引擎),策划和设计《乔布斯超大型的开源3D纪念馆》的系列教程。dtns.network是一款主要由JavaScript编写的智体世界引擎&am…

关于科技的总结与思考

文章目录 互联网时代有趣的数字数据驱动大数据的两个特性数据保护互联网免费模式的再探讨平台互联网的意义人工智能伦理的思考语言理性人梅特卡夫定律冲浪的神奇之处AR的恐怖之处叙词表、受控词表和大众分类法六度/十九度的解读知识图谱是真正的仿生智能幂次法则和优先连接现代…

怎么把图片压缩小一点?让你的图片秒变小清新!

怎么把图片压缩小一点?在数字化时代,图片已经成为我们生活中不可或缺的一部分。无论是社交媒体的分享,还是工作文档的编辑,图片都扮演着重要的角色。然而,随着图片数量的增加,存储空间的问题也日益凸显。幸…

AI烟火识别算法在消防安全与火灾预警系统中的应用与价值

在信息化和智能化的今天,烟火识别算法作为一种重要的技术工具,在火灾预防和处理中发挥着关键作用。其工作原理主要基于深度学习和图像处理技术,能够实时分析监控画面,准确检测出图像中的烟火,并发出预警。 一、烟火识…

优思学院|为什么精益生产总是搞不成功?CLMP

先说一个故事 有一位老板希望模仿乔布斯,怎么模仿呢? 他穿起黑色高领毛衣,李维斯蓝色牛仔裤和New Balance运动鞋。 不过,企业之后也没有和苹果一样好,老板们觉得很奇怪啊,是不是哪里有问题,乔…

vscode专区

1.展示多行的文件导航标签,而非只有1行 1.1打开设置 1.2搜索该设置"workbench.editor.wrap.tabs",并勾选 1.3效果对比

MySQL(四) - SQL优化

一、SQL执行流程 MySQL是客户端-服务器的模式。一条SQL的执行流程如下: 在执行过程中,主要有三类角色:客户端、服务器、存储引擎。 大致可以分为三层: 第一层:客户端连接到服务器,构造SQL并发送给服务器…

vue3 实现自定义指令封装 --- 通俗易懂

1、局部自定义指令 1.1 在<script setup>定义组件内的指令&#xff0c;任何以v开头的驼峰式命名的变量都可以被用作一个自定义指令 <template><div><h3>使用自定义指令</h3><div>########################## start 局部自定义指令</d…

MFC实现子控件focus焦点上下移动父控件ListView和Gridview也跟着向上下移动

项目中要实现mfc功能&#xff0c;然后子控件焦点下移&#xff0c;LIstView和Gridview父控件不会下移&#xff0c;所以就有这个文章。废话不多说直接上代码。 MFCGridView.java import android.content.Context; import android.util.AttributeSet; import android.view.View;…

TiKV学习5:TiDB SQL执行流程

目录 1. DML语句读流程概要 2. DML语句写流程概要 3. DDL 流程概要 4. SQL的Parse和Compile 5. 读取的执行 6. 写入的执行 7. DDL的执行 8. 小结 1. DML语句读流程概要 TiDB Server接收sql并处理&#xff0c;TiKV负责持久化数据&#xff0c;PD提供TSO和Region的数据字典…

error /var/lib/jenkins/workspace/*/node_modules/node-sass: Command failed.

原因&#xff1a;node-sass版本不一致 版本图&#xff1a; 解决方案&#xff1a; 进入到jenkins项目目录下&#xff0c;修改package.json文件 将7.0.1改成6.0.1版本

《对马岛之魂:导演剪辑版》新鲜出炉,AOC电竞显示器与你并肩作战!

超越PS版本的画面表现&#xff0c;AOC U27G3XM助你轻松拉满游戏体验&#xff01; 近日&#xff0c;《对马岛之魂&#xff1a;导演剪辑版》正式登陆PC平台。这款备受期待的作品不仅在战斗机制和故事内容上进行了创新&#xff0c;还引入了更高级的图形选项和更丰富的自定义设置。…

性能测试(二)—— linux服务器监控性能测试

测试目的&#xff1a;发现服务器的性能瓶颈。配置的不同能够承载的最大任务数不同&#xff0c;能够承载的压力也不同 服务器性能测试范围 1.1 测试范围 CPU 内存 硬盘 网络 版本&#xff08;软件、应用版本&#xff09; 1.2 测试与生产配置不相同 多次性能压测预估 …

力扣----轮转数组

题目链接&#xff1a;189. 轮转数组 - 力扣&#xff08;LeetCode&#xff09; 思路一 我们可以在进行每次轮转的时候&#xff0c;先将数组的最后一个数据的值存储起来&#xff0c;接着将数组中前n-1个数据依次向后移&#xff0c;最后将存储起来的值赋给数组中的第一个数据。 …

运动模糊技术在AI绘画中的创新应用

引言&#xff1a; 随着人工智能技术的飞速发展&#xff0c;AI绘画已经成为艺术创作领域的一颗新星。它不仅改变了艺术家的创作方式&#xff0c;还为普通用户提供了前所未有的艺术体验。在众多AI绘画技术中&#xff0c;运动模糊技术以其独特的视觉效果和广泛的应用前景受到了广泛…

【排序】插入排序,希尔排序

前面我们讲述了冒泡排序和选择排序&#xff0c;我们本章讲的排序方法是插入排序&#xff0c;插入排序是希尔排序实现的基础函数&#xff0c;大家一定要好好理解插入排序的逻辑&#xff0c;这样才能在后面学习希尔排序的时候&#xff0c;更容易的去理解&#xff0c;我们直接开始…

3D分割新范式!浙大开源Reasoning3D:通过大视觉语言模型搞定3D部件分割

文章链接&#xff1a;https://arxiv.org/pdf/2405.19326 项目链接&#xff1a;http://tianrun-chen.github.io/Reason3D/ 今天和大家分享的是一项新任务&#xff1a;Zero-Shot 3D 推理分割&#xff0c;用于对象的部件搜索和定位。这是一种超越了以往类别特定的3D语义分割、3D…

韩语“对不起”怎么说?柯桥留学韩语培训

一、引言 在学习韩语的过程中&#xff0c;掌握如何表达歉意是非常重要的一部分。无论是日常交流还是正式场合&#xff0c;礼貌地说“对不起”能展现出你的修养和对他人的尊重。本文将详细介绍韩语中表示“对不起”的几种常用表达方式及其使用情境。 二、主体内容 1、详细解释 标…

冯喜运:6.4汇市观潮:今日黄金原油行情走势及操作策略

【黄金消息面分析】&#xff1a;在全球经济的波动中&#xff0c;美元和黄金市场的表现一直是投资者关注的焦点。最近&#xff0c;市场情绪和经济数据的波动对这两个市场产生了显著的影响。周二欧市早盘&#xff0c;现货黄金价格出现短线回调&#xff0c;金价跌破2340美元/盎司&…