艾里斯·科尔曼
2024 年 10 月 8 日 02:45
NVIDIA 将 CUDA-X 与 Polars 集成,显着提高了数据处理速度。此次更新有望将性能提高 13 倍,从而提高数据科学家和工程师的效率。
NVIDIA 宣布将其 CUDA-X 平台与 Polars 数据处理库集成,标志着数据分析能力的显着增强。据 NVIDIA 技术博客报道,此次合作将为数据科学家和工程师带来显着的性能提升。
北极星越来越受欢迎
Polars 是一个快速增长的 DataFrame 库,最近每月下载量已超过 900 万次。 Polars 以其在单机上处理数据集的效率而闻名,它放弃了分布式计算系统的复杂性,使其成为许多企业处理复杂数据问题的理想选择。
与 NVIDIA CUDA-X 的集成预计将加速查询执行,使 Polars 比传统的基于 CPU 的处理速度快 13 倍。这一进步对于处理诸如检测信用卡交易中的时间盒模式或管理全球库存转移等任务的企业特别有利。
RAPIDS cuDF 的技术进步
由 RAPIDS cuDF 提供支持的全新 Polars GPU 引擎现已推出公开测试版。这一开发使 Polars 社区能够利用加速计算,而无需更改任何代码。 Polars 的作者兼首席执行官 Ritchie Vink 强调,与 NVIDIA 的合作是利用 NVIDIA RAPIDS 和 GPU 技术增强性能的独特机会。
RAPIDS 是 NVIDIA CUDA-X 的一部分,是一套 GPU 加速库,旨在优化数据科学和分析管道。包含 RAPIDS cuDF(GPU DataFrame 库)可实现高效的数据加载、连接、聚合、过滤和操作。
可扩展的数据处理解决方案
对于数据科学和工程团队来说,选择正确的软件和基础设施对于维持高效运营至关重要。 Polars 凭借其增强的 GPU 支持,为适合单机(例如工作站和笔记本电脑)的工作负载提供了简化的解决方案。这种设置降低了开发复杂性和基础设施成本,提高了生产力并允许进行更多探索性分析。
对于超出单台机器处理能力的大规模数据处理,组织通常会转向 Apache Spark 等框架。然而,CUDA-X 平台旨在解决与大规模工作负载相关的成本和能源效率挑战,同时还为单机任务提供显着的性能改进。
NVIDIA 的加速数据处理能力有望带来令人印象深刻的收益,基准测试显示 Polars 和 pandas 等其他库在支持 GPU 的系统上的性能比 CPU 快 50 倍。
前景
随着世界产生的数据比以往任何时候都多,对加速计算解决方案的需求至关重要。 NVIDIA 将 CUDA-X 与 Polars 集成,无论是在工作站上还是跨数据中心,在高效操作数据方面向前迈出了一步。这些增强功能不仅提高了生产力,还显着降低了成本,使其成为数据驱动型企业的一个令人信服的选择。
图片来源:Shutterstock
关键词:人工智能,加密,区块链,新闻