NVIDIA揭示了高级视频分析的AI蓝图

By Amelia On 5 月 21, 2025

丽贝卡·莫恩（Rebeca Moen）
2025年5月19日05:23

NVIDIA引入了一个全面的AI蓝图，用于视频搜索和摘要，从而增强了视频分析，并具有新功能，例如音频转录和多live Stream Processing。

NVIDIA宣布了其AI蓝图用于视频搜索和摘要的总体可用性，这是一种旨在增强视频分析的综合工具。根据NVIDIA的说法，该蓝图集成了视觉语言模型（VLM），大语言模型（LLMS）和检索功能的生成（RAG），以提供一个可靠的视频分析框架。

视频分析的增强

NVIDIA AI蓝图引入了几种旨在提高视频分析效率和准确性的增强功能。其中包括能够同时处理多个实时流和预先记录的视频文件，一种新的视频摄入模式以及可自定义的计算机视觉管道。此外，蓝图现在支持音频转录，可以对视频内容有多模式的理解。

该版本采用单GPU部署选项，支持NVIDIA A100，H100和H200 GPU，这是较小工作量的理想选择。多层流功能允许同时处理数百个流，而音频转录功能将语音转换为文本，从而增强了教学视频和会议的分析。

将计算机视觉模型与VLM集成，蓝图在视频中的对象（包括位置和跟踪ID）上提供了详细的元数据。这使有效的视觉接地可以使AI代理基于单个对象产生响应，这对于复杂的查询特别有用。

AI蓝图针对NVIDIA GPU进行了优化，在视频摘要任务中实现了显着的加速。它提供了各种部署选项，包括NVIDIA API目录，NVIDIA发射机，Docker和Cloud部署，可根据用户需求确保灵活性和自定义。该工具包支持AWS，并计划扩展到Azure和GCP。

NVIDIA的蓝图旨在简化视频分析AI代理的开发，从而为长篇视频理解提供了全面的解决方案。随着这些进步，NVIDIA继续推动AI驱动的视频分析的界限，为从智能空间到仓库自动化的行业提供了强大的工具。

图像来源：Shutterstock

（tagstotranslate）AI（T）加密（T）区块链（T）新闻

关键词：