约尔格·希勒
2025 年 11 月 13 日 02:50
NVIDIA 的 Blackwell 架构在所有 MLPerf Training v5.1 基准测试中均实现了顶级性能,突显了 AI 训练效率和精度方面的进步。
NVIDIA 的 Blackwell 架构为 AI 训练树立了新标准,在所有 MLPerf Training v5.1 基准测试中实现了最快的时间。 NVIDIA 官方博客称,这一成就标志着 AI 训练能力的重大进步,凸显了 NVIDIA 对 AI 技术创新的承诺。
基准性能
MLPerf Training v5.1 是一套著名的基准测试,用于评估 AI 模型在训练中的性能。 NVIDIA Blackwell 架构为 NVIDIA Blackwell 和 Blackwell Ultra GPU 提供支持,在所有基准测试中均表现出色,在最大规模和提交的规模下展现出无与伦比的性能。值得注意的是,该架构使用 5,120 个 Blackwell GPU 实现了 Llama 3.1 405B 模型的破纪录 10 分钟训练时间。
技术创新
Blackwell 架构的成功归功于多项技术进步。其中关键是引入了 NVFP4 数据格式,它提高了精度和训练效率。这种格式可以通过使用更少的令牌来缩短训练时间,同时保持准确性,这是大规模人工智能训练的关键因素。
进一步的创新包括 GPU 硬件的增强、NVIDIA Transformer Engine 等软件库以及优化训练过程的数值技术。这些改进有助于该架构有效处理复杂人工智能模型的能力。
Blackwell Ultra 的增强功能
Blackwell Ultra GPU 是 NVIDIA 最新产品的一部分,与之前的迭代相比有了重大改进。其中包括提高 NVFP4 峰值吞吐量和增强内存容量,从而更有效地处理大型语言模型 (LLM)。这些增强有助于性能的大幅飞跃,特别是在法学硕士培训基准方面。
网络和规模
NVIDIA 的进步不仅限于 GPU,还包括网络改进。 NVIDIA Quantum-X800 网络平台的推出,具有 800 Gb/s 连接能力,支持大型 AI 模型所需的规模。该基础设施可实现 GPU 之间的无缝通信,从而缩短训练时间并提高可扩展性。
未来的影响
NVIDIA Blackwell 架构所取得的成就凸显了加速 AI 开发和部署的潜力。通过在硬件和软件方面不断创新,NVIDIA 旨在降低智能成本,为未来 AI 技术的突破铺平道路。
图片来源:Shutterstock
关键词:人工智能,加密,区块链,新闻