Nvidia tensorrt增强了RTX GPU上的稳定扩散3.5

By Amelia On 6 月 13, 2025

丽贝卡·莫恩（Rebeca Moen）
6月12日，2025年06:53

NVIDIA的Tensorrt SDK显着提高了稳定扩散3.5的性能，将VRAM要求降低了40％，并且对RTX GPU的效率增加了一倍。

NVIDIA通过引入高级软件开发套件（SDK）的引入大大提高了NVIDIA GEFORCE RTX和RTX Pro GPU的稳定扩散3.5的效率。根据NVIDIA的说法，这项创新不仅使AI模型的性能增加了一倍，而且还将VRAM使用量减少了40％。

革命性的AI性能

生成的AI继续改变数字内容创建，模型的复杂性和VRAM需求增长。最新的稳定扩散3.5大型模型最初需要18GB的VRAM，从而限制了其可访问性。 NVIDIA通过与稳定性AI合作以应用量化技术，尤其是FP8量化来大大减少VRAM消耗来解决这一问题。

新优化的模型，稳定的扩散3.5大型和中等，利用Tensorrt SDK来增强性能。 SDK优化了专门针对RTX GPU的模型权重和执行图，与以前的Pytorch实现相比，SD3.5大的SD3.5的2.3倍性能提升，SD3.5培养基增加了1.7倍。

RTX的Tensorrt在Microsoft Build上亮相，现在可以作为独立SDK提供，使开发人员可以轻松地集成并优化RTX GPU上的AI模型。这个新版本允许使用即时（JIT）汇编，大大减少了优化不同GPU类所需的时间。

SDK的紧凑型尺寸和与Windows ML的兼容性使其成为寻求部署高性能AI应用程序的开发人员的吸引人选择。通过整合张力，开发人员可以通过最少的内存使用量实现大量的性能改进，为更有效的AI驱动应用铺平了道路。

NVIDIA与稳定性AI的合作范围超出了优化。两家公司正在努力将稳定的扩散3.5作为NVIDIA NIM微服务，从而为创建者和开发人员提供更轻松的部署。预计该微服务将于7月提供，为在各种应用程序中实施AI模型提供了简化的方法。

随着NVIDIA继续进行创新，其在AI和机器学习中的努力将重新定义生成AI模型的功能。随着持续的进步，利益相关者可以预期更加可靠，有效的AI解决方案，以满足数字内容创建及其他因素的不断增长的需求。

图像来源：Shutterstock

（tagstotranslate）AI（T）加密（T）区块链（T）新闻

关键词：