NVIDIA 的 R²D²：通过高级任务和运动规划彻底改变机器人操作

菲利克斯·平克斯顿
2025 年 11 月 4 日 21:22

NVIDIA 的 R²D² 通过感知引导的任务和运动规划来推进机器人操控，集成视觉、语言和 GPU 加速，以增强动态环境中的适应性。

据 NVIDIA 博客介绍，NVIDIA 推出了 R²D² 框架，这是一种通过感知引导任务和运动规划 (TAMP) 来增强机器人操作的开创性方法。传统的 TAMP 系统由于依赖静态模型，在新环境中常常会出现问题。 R²D² 通过集成感知来解决这些限制，使机器人能够实时更新其计划并适应动态场景。

在 TAMP 中集成视觉和语言

R²D² 框架利用视觉和语言将复杂的任务分解为可管理的子目标，从而增强机器人执行长期任务的能力。通过使用模型将图像和指令转化为可操作的计划，机器人可以更好地了解其环境和任务要求。 OWL-TAMP、VLM-TAMP 和 NOD-TAMP 工作流程就是这种集成的例证，它们将视觉语言模型与 TAMP 相结合，以改进视觉复杂设置中的任务执行。

使用 cuTAMP 进行 GPU 加速

GPU加速对于提高TAMP的效率起着至关重要的作用。 NVIDIA 的 cuTAMP 框架利用 GPU 并行化加速规划过程。这种方法可以快速解决计划框架和约束满足问题，从而显着减少包装和堆叠等任务所需的时间，从几小时缩短到几秒钟。

通过 Fail2Progress 从失败中学习

为了进一步改进机器人操作，NVIDIA 引入了 Fail2Progress 框架，该框架允许机器人从自己的失败中学习。通过数据驱动的校正和基于模拟的细化，将故障集成到技能模型中，机器人可以更有效地适应新的条件。

TAMP 的这些进步凸显了 NVIDIA 致力于突破机器人技术界限的承诺。通过将感知与任务和运动规划相结合，并利用 GPU 加速，NVIDIA 正在为机器人在复杂环境中的适应性和效率制定新标准。

有关 NVIDIA R²D² 框架的更多详细信息，请访问 NVIDIA 博客。

图片来源：Shutterstock

关键词：人工智能,加密,区块链,新闻

NVIDIA 的 R²D²：通过高级任务和运动规划彻底改变机器人操作

在 TAMP 中集成视觉和语言

使用 cuTAMP 进行 GPU 加速

通过 Fail2Progress 从失败中学习

Related Posts

Stifel：嘉年华乐观的投资者日显示了对需求和定价的信心

财报电话会议记录：AdvanSix 2025 年第三季度业绩未达预期，股价下跌

为什么明年的流感疫苗可能没有应有的效果

特朗普政府寻求阻止食品券订单

全球股票基金流入量跃升至五周高位

Neurogasstrx 宣布 NG101 2 期临床研究显示 GLP-1 受体激动剂索马鲁肽引起的恶心和呕吐显着减少

为什么 Grand Theft Auto VI 再次被推迟以及它将如何影响其他游戏 |科学、气候和科技新闻