NVIDIA 扩展 NeMo 平台以增强多模式生成式 AI 开发


菲利克斯·平克斯顿
2024 年 11 月 6 日 18:29

NVIDIA NeMo 现在支持用于开发多模式生成 AI 模型的端到端管道,具有先进的数据管理和标记化工具,可实现高效的 AI 模型构建。




随着 NVIDIA 最近扩展其 NeMo 平台,多模式生成 AI 模型的开发取得了重大飞跃。 NVIDIA 表示,增强版平台现在提供了用于创建、定制和部署这些高级 AI 模型的端到端解决方案。

NVIDIA NeMo 及其多模式功能

NVIDIA NeMo 旨在简化利用文本、图像和视频等多种数据类型的 AI 模型的开发过程。这一进步超越了传统的基于文本的模型,纳入了图像字幕和视觉问答等任务。视频人工智能模型的集成尤其值得注意,因为它为机器人、汽车和零售等行业带来了变革的可能性。

例如,在机器人技术中,视频人工智能模型增强了自主导航,这对于制造和仓库管理等环境至关重要。在汽车领域,这些模型改善了车辆感知和安全性,为自动驾驶技术的进步做出了贡献。

使用 NeMo Curator 增强数据管理

NVIDIA NeMo 扩展的核心是 NeMo Curator,这是一种有助于快速高效管理视觉数据的工具。这种能力至关重要,因为高质量的训练数据对于生成准确的人工智能模型至关重要。 NeMo Curator 的编排管道可以管理 PB 级的数据处理,优化多个 GPU 的使用并显着减少视频处理时间。

通过提供提高数据集质量的视频管理参考模型,NeMo Curator 使开发人员能够创建更精确的 AI 模型。例如,与传统的推理方法相比,优化的字幕模型极大地提高了吞吐量。

NVIDIA Cosmos 的高级标记化

NVIDIA 还推出了 Cosmos 标记器,可提供高效的视觉数据标记化。这些标记器将复杂的视觉数据转换为紧凑的语义标记,促进大规模生成模型的训练,同时最大限度地减少计算需求。

Cosmos 分词器因其生成高质量图像和视频重建的能力而脱颖而出,其压缩率远远优于现有解决方案。这种效率意味着更快的处理时间和更少的资源需求,从而提高开发人员的工作效率和用户体验。

构建下一代人工智能模型

NeMo Curator 和 Cosmos 标记器在 NeMo 平台中的集成代表了多模式生成 AI 开发的重大进步。这些工具使开发人员能够利用高质量的数据处理和创新的标记化技术,高效地构建最先进的人工智能模型。

随着 NVIDIA 不断创新,NeMo 平台将在各个领域的 AI 技术发展中发挥关键作用,推动多模式生成 AI 的能力发展。

图片来源:Shutterstock




关键词:人工智能,加密,区块链,新闻

NemoNvidia人工智能加密区块链平台以增强多模式生成式开发扩展新闻
Comments (0)
Add Comment