CUDA工具包13.0揭示了增强GPU编程的高级功能


托尼·金
8月7日,2025年01:33

NVIDIA的CUDA工具包13.0引入了创新功能,例如基于瓷砖的编程和统一的ARM平台支持,增强了开发人员的生产力和GPU性能。




NVIDIA的CUDA工具包(版本13.0)的最新迭代已发布,带来了一套增强功能,旨在提高NVIDIA CPU和GPU上的计算性能。正如Nvidia报道的那样,该主要版本为CUDA 13.X软件系列中的未来发展奠定了基础。

关键功能和改进

CUDA Toolkit 13.0引入了一些关键改进,包括基于瓷砖的编程基础,跨ARM平台的开发人员体验的统一以及对Red Hat Enterprise Linux 10(例如Red Hat Enterprise Linux 10)的更新支持。该版本还包括对Nvidia Nsight Nsight Developter工具的更新和诸如线性Algebra和Fft等数学库的更新。

最重要的进步之一是引入基于图块的编程,该编程使开发人员可以定义数据的图块并在这些图块上指定操作。该模型自然映射到张量芯上,通过抽象低级线程管理,同时最大程度地提高GPU性能来提高开发人员的生产率。图块编程模型将通过高级API和中间表示(IR)提供,使程序员和工具开发人员都可以使用。

统一的手臂平台支持

CUDA 13.0通过跨服务器级和嵌入式设备统一CUDA工具包来简化ARM平台的开发。这种变化消除了对不同ARM目标单独的安装或工具链的需求,从而通过允许在没有代码更改的情况下将单个二进制部署在各种平台上来提高生产率。

该统一使开发人员能够在DGX Spark等高性能系统上模拟应用程序,并将它们直接部署到Thor等嵌入式目标上,从而消除了模拟和部署之间的先前障碍。

增强的开发人员工具和库

该更新还为NVIDIA的开发人员工具带来了增强。 Nsight Compute 2025.3现在包括指令组合和记分板依赖表,协助开发人员确定依赖性失速并优化代码。此外,CUDA工具包数学库得到了改进,为BLAS L3内核提供了更好的性能,并支持SPGEMM计算中64位索引矩阵。

此外,NVCC编译器现在使用ZSTANDARD进行FATBIN压缩,提供更好的压缩比,并且可忽略不计的执行时间影响。这种变化是提高CUDA应用程序效率和性能的更广泛努力的一部分。

持续的支持和未来的前景

CUDA工具包13.0继续支持最新的NVIDIA GPU,包括Blackwell Architecture,并为Jetson Thor提供了支持。该版本还标志着向开源GPU驱动程序转变为Jetson平台,从而可以同时使用集成和离散的GPU。

随着CUDA 13.0为GPU编程的未来奠定了基础,开发人员可以期望持续的增强功能,这将进一步简化开发过程并改善NVIDIA硬件生态系统的性能。

图像来源:Shutterstock


(tagstotranslate)AI(T)加密(T)区块链(T)新闻



关键词:

CUDA工具包13.0揭示了增强GPU编程的高级功能
Comments (0)
Add Comment