The news is by your side.

NVIDIA用任务控制软件彻底改变了AI工厂

10


詹姆斯·丁
3月18日,2025年21:23

NVIDIA推出了一个AI数据管理平台Mission Control,通过NVIDIA GTC会议宣布,增强了具有高级编排和自动化的AI工厂的运营。




NVIDIA推出了其最新的创新,任务控制,旨在简化AI数据中心管理的全面操作和编排软件平台。根据NVIDIA博客的数据,该软件在NVIDIA GTC Global AI会议上宣布,旨在自动化和增强运行AI工厂的复杂流程。

转换AI工厂运营

任务控制将通过促进基于NVIDIA Blackwell的系统从训练到后训练后的过渡来彻底改变AI工厂的运营。它使企业能够在培训和推理工作负载之间无缝切换,从而动态优化资源分配。这种能力对于希望迅速将数据转化为可行见解的企业至关重要。

该软件集成了NVIDIA运行:AI技术,增强了工作编排,并最多将基础架构利用提高了五次。它的自主恢复功能,由快速检查点和自动化分层重新启动支持,确保工作恢复速度高10倍,可显着提高AI培训和推理效率。

增强的基础设施管理

Mission Control的设计着重于最大程度地减少企业支出管理AI基础架构的时间。它可以自动化AI工厂操作的各个方面,从部署配置到开发人员工作负载管理。具有预测和确定停机时间和效率低下的能力,它旨在节省时间,精力和成本。

该平台提供了一些好处,包括简化的集群设置,无缝的工作负载编排,能量优化的功率配置文件和可自定义的仪表板。这些功能可帮助企业在优化性能的同时保持不间断的操作。

与领先的系统制造商合作

戴尔,HPE,联想和SuperMicro等主要系统制造商计划将NVIDIA任务控制整合到他们的产品中。这种集成将使企业能够毫不费力地扩展AI模型,从而将数据变成比以往更快的可行见解。例如,戴尔(Dell)将在其AI工厂解决方案中包括任务控制,而HPE将提供其NVIDIA Grace Blackwell系统。

可用性和未来的前景

NVIDIA任务控制目前可用于NVIDIA DGX GB200和DGX B200系统。它将很快提供来自戴尔,HPE,联想和Supermicro等全球提供商的GB200 NVL72系统。此外,NVIDIA的基本指挥管理器软件将用于有限的范围,为AI群集管理提供了具有成本效益的解决方案。

随着NVIDIA继续增强其AI解决方案,任务控制代表了使高级AI基础设施对全球行业更容易易于访问和高效的重要一步。

图像来源:Shutterstock


(tagstotranslate)AI(T)加密(T)区块链(T)新闻



关键词: