使用NVIDIA CUDA-X增强基于云的数据科学并盘绕


泰德·霍索瓦(Ted Hisokawa)
2025年5月16日08:08

探索NVIDIA CUDA-X和COILIEL基于云的数据科学,如何为数据科学家提供重要的计算加速并简化基础架构管理。




NVIDIA CUDA-X与云平台的集成通过显着提高计算效率并简化基础架构管理,从而改变了数据科学的景观。根据NVIDIA的博客文章,这种开发对于处理大型数据集的数据科学家特别有益。

加速使用NVIDIA RAPIDS的数据处理

CUDA-X套件的一部分Nvidia Rapids为数据科学工作流提供GPU加速,而无需更改代码。通过利用cudf.pandas加速器,数据科学家可以立即在GPU上执行大熊猫操作,从而提高了150倍的速度。这种效率对于分析广泛的数据集至关重要,例如纽约市出租车和豪华轿车委员会(TLC)旅行记录数据,其中包含数百万个乘车详细信息。

云GPU可访问性

云平台可立即访问最新的NVIDIA GPU架构,从而使团队可以根据计算需求扩展资源。这使人们可以访问高级GPU加速,从而实现更快的数据处理和更深入的分析见解。例如,现在可以使用GPU在几秒钟内完成花费CPU的任务,从而可以进行更多的迭代和探索性分析。

用盘绕的简化基础架构

盘绕通过抽象云配置的复杂性来简化GPU加速数据科学的部署。通过使用盘绕,数据科学家可以专注于分析而不是基础架构管理,从而加速创新。盘绕促进了在云GPU上使用Jupyter笔记本和Python脚本,从而确保了从本地开发到云执行的无缝过渡。

案例研究:纽约乘车共享数据集

NYC TLC Trip记录数据可通过S3访问,提供了GPU加速度功能的实际示例。现在可以迅速执行以前需要大量计算资源的操作。例如,与传统的熊猫相比,CUDF.PANDAS的加载和优化数据类型,按公司计算收入和利润以及基于持续时间的旅行进行分类。

性能指标

实际上,与CPU实现相比,数据处理操作的GPU加速版本达到了8.9倍。即使考虑基础设施设置的时间,总体绩效的改进仍然很大,突出了将Nvidia急流与盘绕的益处的好处。

结论

NVIDIA CUDA-X和COILEL的组合为数据科学家提供了强大的工具包,使他们能够加速分析工作流程并减少开发周期,而不会被基础设施管理所困扰。这种方法可确保数据科学家可以专注于从数据中获得见解,而不是管理计算资源。

有关更多详细信息,可以在NVIDIA博客上访问原始文章。

图像来源:Shutterstock


(tagstotranslate)AI(T)加密(T)区块链(T)新闻



关键词:

CUDAX增强基于云的数据科学并盘绕使用NVIDIA
Comments (0)
Add Comment