The news is by your side.

NVIDIA揭示了高级视频分析的AI蓝图

6


丽贝卡·莫恩(Rebeca Moen)
2025年5月19日05:23

NVIDIA引入了一个全面的AI蓝图,用于视频搜索和摘要,从而增强了视频分析,并具有新功能,例如音频转录和多live Stream Processing。




NVIDIA宣布了其AI蓝图用于视频搜索和摘要的总体可用性,这是一种旨在增强视频分析的综合工具。根据NVIDIA的说法,该蓝图集成了视觉语言模型(VLM),大语言模型(LLMS)和检索功能的生成(RAG),以提供一个可靠的视频分析框架。

视频分析的增强

NVIDIA AI蓝图引入了几种旨在提高视频分析效率和准确性的增强功能。其中包括能够同时处理多个实时流和预先记录的视频文件,一种新的视频摄入模式以及可自定义的计算机视觉管道。此外,蓝图现在支持音频转录,可以对视频内容有多模式的理解。

发行的主要功能

该版本采用单GPU部署选项,支持NVIDIA A100,H100和H200 GPU,这是较小工作量的理想选择。多层流功能允许同时处理数百个流,而音频转录功能将语音转换为文本,从而增强了教学视频和会议的分析。

高级计算机视觉功能

将计算机视觉模型与VLM集成,蓝图在视频中的对象(包括位置和跟踪ID)上提供了详细的元数据。这使有效的视觉接地可以使AI代理基于单个对象产生响应,这对于复杂的查询特别有用。

优化的性能和部署

AI蓝图针对NVIDIA GPU进行了优化,在视频摘要任务中实现了显着的加速。它提供了各种部署选项,包括NVIDIA API目录,NVIDIA发射机,Docker和Cloud部署,可根据用户需求确保灵活性和自定义。该工具包支持AWS,并计划扩展到Azure和GCP。

NVIDIA的蓝图旨在简化视频分析AI代理的开发,从而为长篇视频理解提供了全面的解决方案。随着这些进步,NVIDIA继续推动AI驱动的视频分析的界限,为从智能空间到仓库自动化的行业提供了强大的工具。

图像来源:Shutterstock


(tagstotranslate)AI(T)加密(T)区块链(T)新闻



关键词: