The news is by your side.

使用Polars GPU发动机处理VRAM限制:大型数据处理技术

3


扎克·安德森
6月28日,2025年02:49

探索Polars GPU引擎中统一的虚拟内存和多GPU流媒体执行等技术,以有效地处理数据超过VRAM限制的技术。




在数据密集型应用程序的领域中,例如定量融资,算法交易和欺诈检测,数据从业人员经常会遇到超过其硬件能力的数据集。根据NVIDIA的博客文章,利用NVIDIA的CUDF的Polars GPU引擎提出了有效管理如此广泛的数据工作负载的解决方案。

VRAM约束挑战

图形处理单元(GPU)是在处理计算结合的查询方面的出色性能。但是,一个值得注意的挑战是有限的视频RAM(VRAM),通常比系统RAM少,在处理大型数据集时会出现障碍。为了解决这个问题,Polars GPU引擎提供了两种主要策略:统一虚拟内存(UVM)和多GPU流媒体执行。

统一的虚拟内存(UVM)

NVIDIA开发的UVM技术促进了系统RAM和GPU VRAM之间的统一记忆空间。这种集成使Polars GPU发动机在VRAM达到容量时可以将数据卸载到系统RAM,从而防止了存储外错误。此方法对于与可用VRAM略大的单个GPU设置特别有效。尽管由于数据迁移而导致的性能开销,但可以使用Rapids Memory Manager(RMM)将其最小化以进行优化的内存分配。

多GPU流执行

对于扩展到Terabyte范围的数据集,Polars GPU引擎引入了多GPU流流执行。该实验特征分区数据以跨多个GPU进行并行处理,从而提高了处理速度和效率。流式执行人修改了内部表示图,以进行批处理执行,并在GPU上分发任务。该技术利用Dask的调度功能兼容了单个和多GPU执行。

选择最佳策略

UVM和Multi-GPU流媒体执行之间的选择取决于数据集大小和可用硬件。 UVM是适度大型数据集的理想选择,而多GPU流则适用于需要分布式处理的非常大的数据集。两种策略都提高了Polars GPU发动机处理超过VRAM限制的数据集的能力。

有关这些策略的进一步见解,包括详细的配置和性能优化,请访问NVIDIA博客。

图像来源:Shutterstock


(tagstotranslate)AI(T)加密(T)区块链(T)新闻



关键词: