The news is by your side.

NVIDIA的CUEMBED BEOSTS GPU性能以嵌入查找

5


卡罗琳·毕晓普(Caroline Bishop)
2025年5月16日04:21

Nvidia揭幕了Cuembed,这是一个CUDA库,可显着增强在GPU上的嵌入查找,有望改善推荐系统和其他应用的性能。




NVIDIA推出了Cuembed,这是一个尖端的,仅限标头的CUDA库,旨在提高NVIDIA GPU上嵌入查找的效率。正如Nvidia报道的那样,对于使用推荐系统可以消耗大量计算资源的人,这种开发对于那些使用推荐系统的人尤其有益。

了解嵌入查找

嵌入查找对于在机器学习模型中处理非数字数据至关重要。他们将分类数据转换为浮点数的向量,从而使其整合到神经网络中。通过Cuembed优化的核心操作涉及基于输入索引从嵌入式表中检索和可能将向量组合在一起,该过程由于其不规则的内存访问模式而可能是资源密集的。

用Cuembed优化GPU性能

Cuembed通过实现超过HBM记忆带宽峰值的吞吐率来解决记忆密集型操作的挑战。这是通过各种优化技术来实现的,例如增加飞行中的负载数量和跨GPU线程的合并内存访问。库还利用缓存内存来容纳经常访问的行,从而减少内存系统压力。

实用整合和使用

该库是开源的,允许开发人员自定义和扩展其功能。它无缝地集成到使用C ++和Pytorch的项目中,为各种嵌入用例提供了多功能解决方案。开发人员可以通过将其添加为子模块或通过CMAKE软件包管理器将其包括在其项目中。

现实世界的影响

Cuembed已经证明了其在现实应用程序中的有效性。例如,Pinterest集成了基于GPU的推荐模型,并报告了训练吞吐量增加了15-30%。这种性能提高了图书馆增强机器学习工作负载的潜力。

结论

借助Cuembed,NVIDIA提供了一种强大的工具,用于加速嵌入查找,对于从推荐系统到图形神经网络的一系列应用程序至关重要。其开源性质邀请开发人员进一步创新,扩大其能力,以满足机器学习领域的各种需求。

图像来源:Shutterstock


(tagstotranslate)AI(T)加密(T)区块链(T)新闻



关键词: