The news is by your side.

NVIDIA Blackwell 凭借破纪录的性能引领 MLPerf Training v5.1

7


约尔格·希勒
2025 年 11 月 13 日 02:50

NVIDIA 的 Blackwell 架构在所有 MLPerf Training v5.1 基准测试中均实现了顶级性能,突显了 AI 训练效率和精度方面的进步。




NVIDIA 的 Blackwell 架构为 AI 训练树立了新标准,在所有 MLPerf Training v5.1 基准测试中实现了最快的时间。 NVIDIA 官方博客称,这一成就标志着 AI 训练能力的重大进步,凸显了 NVIDIA 对 AI 技术创新的承诺。

基准性能

MLPerf Training v5.1 是一套著名的基准测试,用于评估 AI 模型在训练中的性能。 NVIDIA Blackwell 架构为 NVIDIA Blackwell 和 Blackwell Ultra GPU 提供支持,在所有基准测试中均表现出色,在最大规模和提交的规模下展现出无与伦比的性能。值得注意的是,该架构使用 5,120 个 Blackwell GPU 实现了 Llama 3.1 405B 模型的破纪录 10 分钟训练时间。

技术创新

Blackwell 架构的成功归功于多项技术进步。其中关键是引入了 NVFP4 数据格式,它提高了精度和训练效率。这种格式可以通过使用更少的令牌来缩短训练时间,同时保持准确性,这是大规模人工智能训练的关键因素。

进一步的创新包括 GPU 硬件的增强、NVIDIA Transformer Engine 等软件库以及优化训练过程的数值技术。这些改进有助于该架构有效处理复杂人工智能模型的能力。

Blackwell Ultra 的增强功能

Blackwell Ultra GPU 是 NVIDIA 最新产品的一部分,与之前的迭代相比有了重大改进。其中包括提高 NVFP4 峰值吞吐量和增强内存容量,从而更有效地处理大型语言模型 (LLM)。这些增强有助于性能的大幅飞跃,特别是在法学硕士培训基准方面。

网络和规模

NVIDIA 的进步不仅限于 GPU,还包括网络改进。 NVIDIA Quantum-X800 网络平台的推出,具有 800 Gb/s 连接能力,支持大型 AI 模型所需的规模。该基础设施可实现 GPU 之间的无缝通信,从而缩短训练时间并提高可扩展性。

未来的影响

NVIDIA Blackwell 架构所取得的成就凸显了加速 AI 开发和部署的潜力。通过在硬件和软件方面不断创新,NVIDIA 旨在降低智能成本,为未来 AI 技术的突破铺平道路。

图片来源:Shutterstock




关键词:人工智能,加密,区块链,新闻