达里乌斯·巴鲁(Darius Baruo)
6月4日,2025年12:59
NVIDIA的Blackwell Architecture在最新的MLPERF培训基准中实现了各种AI工作负载的前所未有的表现,展示了其彻底改变AI应用程序开发的能力。
根据NVIDIA的博客,在最近的MLPERF培训基准中,NVIDIA的Blackwell Architecture在各种AI工作负载中表现出了出色的表现。这些基准是自2018年成立以来的第12次迭代,强调了体系结构在处理大型语言模型(LLMS),推荐系统等方面的功能。
跨基准的记录性能
NVIDIA AI平台在每个基准上都提供了领先的性能,其中包括具有挑战性的Llama 3.1 405B预读测试。这项成就强调了该平台在大规模AI操作中的多功能性和出色的功能。该平台是唯一在每个MLPERF培训v5.0基准测试中提交结果的唯一一个平台,展示了其广泛的适用性。
高级基础架构和协作
NVIDIA利用了由Blackwell平台提供支持的两个AI超级计算机Tyche和Nyx,以实现这些结果。 Tyche由NVIDIA GB200 NVL72机架规模系统构建,而NYX基于NVIDIA DGX B200系统。与CoreWeave和IBM的合作进一步提高了性能,利用了2,496个Blackwell GPU和1,248个Nvidia Grace CPU。
绩效的显着增长
与较早的体系结构相比,Llama 3.1 405B预先训练的基准表明,Blackwell的性能要高2.2倍。同样,配备了八个Blackwell GPU的NVIDIA DGX B200系统在Llama 2 70B Lora微调基准测试中提供了2.5倍的性能,这意味着AI培训效率的重大进步。
技术创新
Blackwell体系结构的增强功能包括高密度液冷架,13.4TB连贯的内存以及高级NVIDIA NVLINK和NVLINK开关互连技术。这些发展促进了扩大和扩展运营,对于下一代多模式LLM培训和代理AI应用至关重要。
扩展AI生态系统
NVIDIA的数据中心平台集成了GPU,CPU,高速网络和广泛的软件套件,包括CUDA-X库,NEMO框架和Nvidia Tensorrt-Llm。该生态系统加速了AI模型培训和部署,减少了上市时间并提高价值创造。
MLPERF回合吸引了NVIDIA的合作伙伴生态系统的广泛参与,包括华硕,Cisco,Dell Technologies,Google Cloud等公司的提交。这项合作的努力凸显了AI在各个行业中的重要性。
图像来源:Shutterstock
(tagstotranslate)AI(T)加密(T)区块链(T)新闻
关键词: