NVIDIA 的 R²D²:通过高级任务和运动规划彻底改变机器人操作


菲利克斯·平克斯顿
2025 年 11 月 4 日 21:22

NVIDIA 的 R²D² 通过感知引导的任务和运动规划来推进机器人操控,集成视觉、语言和 GPU 加速,以增强动态环境中的适应性。




据 NVIDIA 博客介绍,NVIDIA 推出了 R²D² 框架,这是一种通过感知引导任务和运动规划 (TAMP) 来增强机器人操作的开创性方法。传统的 TAMP 系统由于依赖静态模型,在新环境中常常会出现问题。 R²D² 通过集成感知来解决这些限制,使机器人能够实时更新其计划并适应动态场景。

在 TAMP 中集成视觉和语言

R²D² 框架利用视觉和语言将复杂的任务分解为可管理的子目标,从而增强机器人执行长期任务的能力。通过使用模型将图像和指令转化为可操作的计划,机器人可以更好地了解其环境和任务要求。 OWL-TAMP、VLM-TAMP 和 NOD-TAMP 工作流程就是这种集成的例证,它们将视觉语言模型与 TAMP 相结合,以改进视觉复杂设置中的任务执行。

使用 cuTAMP 进行 GPU 加速

GPU加速对于提高TAMP的效率起着至关重要的作用。 NVIDIA 的 cuTAMP 框架利用 GPU 并行化加速规划过程。这种方法可以快速解决计划框架和约束满足问题,从而显着减少包装和堆叠等任务所需的时间,从几小时缩短到几秒钟。

通过 Fail2Progress 从失败中学习

为了进一步改进机器人操作,NVIDIA 引入了 Fail2Progress 框架,该框架允许机器人从自己的失败中学习。通过数据驱动的校正和基于模拟的细化,将故障集成到技能模型中,机器人可以更有效地适应新的条件。

TAMP 的这些进步凸显了 NVIDIA 致力于突破机器人技术界限的承诺。通过将感知与任务和运动规划相结合,并利用 GPU 加速,NVIDIA 正在为机器人在复杂环境中的适应性和效率制定新标准。

有关 NVIDIA R²D² 框架的更多详细信息,请访问 NVIDIA 博客。

图片来源:Shutterstock




关键词:人工智能,加密,区块链,新闻

NvidiaR²D²通过高级任务和运动规划彻底改变机器人操作人工智能加密区块链新闻
Comments (0)
Add Comment