泰德·霍索瓦(Ted Hisokawa)
2025年8月22日04:54
NVIDIA的HPC SDK v25.7通过自动化CPU和GPU之间的数据运动来简化海洋建模,从而提高了开发人员的生产率和性能。
在高性能计算(HPC)应用程序的重大进步中,NVIDIA发布了HPC SDK v25.7。此更新标志着GPU加速度的一个里程碑,重点是统一的内存编程,以简化CPU和GPU之间的数据移动。根据NVIDIA的说法,这种发展对科学工作负载特别有益,增强灵活性和减少错误。
简化数据管理
NVIDIA的HPC SDK中统一内存编程的集成提供了一个全面的工具集,可最大程度地减少手动数据管理。 NVIDIA的连贯平台(例如GH200 GRACE HOPPER SUPERCHIP和GB200 NVL72系统)支持了这一进步,它们已经在主要超级计算中心(如瑞士国家超级计算中心)和JülichSuperComputing Center等主要超级计算中心使用。这些平台利用高带宽NVLINK-C2C互连,通过消除对手动数据传输的需求来实现无缝数据移动并提高开发人员的生产率。
对海洋建模的影响
欧洲海洋建模的核(NEMO)一直是证明统一记忆的好处的焦点。巴塞罗那超级计算中心已利用这项技术将Nemo Ocean Model的移植加速到GPU。与传统方法相比,这种方法可以对GPU工作负载进行更灵活的实验。统一内存的使用显着降低了与GPU编程中数据管理相关的复杂性,从而使开发人员可以专注于并行化。
技术见解和性能提高
异步执行和OpenACC指令的引入进一步优化了性能,尤其是在GYRE_PISCES等内存带宽界定基准中。统一记忆通过自动处理数据迁移来简化编程模型,从而改善了局部性和性能。此功能在具有动态分配的数据和复合类型的应用中尤其有利。
尽管移植的早期阶段,但在部分GPU加速工作量中仍观察到了显着的加速。通过逐渐将组件转移到GPU,模拟性能有所改善,证明了统一记忆有效加速科学代码的潜力。
前景
随着NVIDIA的HPC SDK的持续增强功能,开发人员可以期望在管理使用的数据时进一步优化。 OpenACC 3.4规格解决了种族条件,为GPU编程提供了更强大的框架。随着NVIDIA继续完善这些技术,在科学计算方面的性能提高的潜力仍然很有希望。
图像来源:Shutterstock
(tagstotranslate)AI(T)加密(T)区块链(T)新闻
关键词: