The news is by your side.

Nvidia tensorrt增强了RTX GPU上的稳定扩散3.5

3


丽贝卡·莫恩(Rebeca Moen)
6月12日,2025年06:53

NVIDIA的Tensorrt SDK显着提高了稳定扩散3.5的性能,将VRAM要求降低了40%,并且对RTX GPU的效率增加了一倍。




NVIDIA通过引入高级软件开发套件(SDK)的引入大大提高了NVIDIA GEFORCE RTX和RTX Pro GPU的稳定扩散3.5的效率。根据NVIDIA的说法,这项创新不仅使AI模型的性能增加了一倍,而且还将VRAM使用量减少了40%。

革命性的AI性能

生成的AI继续改变数字内容创建,模型的复杂性和VRAM需求增长。最新的稳定扩散3.5大型模型最初需要18GB的VRAM,从而限制了其可访问性。 NVIDIA通过与稳定性AI合作以应用量化技术,尤其是FP8量化来大大减少VRAM消耗来解决这一问题。

新优化的模型,稳定的扩散3.5大型和中等,利用Tensorrt SDK来增强性能。 SDK优化了专门针对RTX GPU的模型权重和执行图,与以前的Pytorch实现相比,SD3.5大的SD3.5的2.3倍性能提升,SD3.5培养基增加了1.7倍。

RTX的Tensorrt:改变游戏规则的人

RTX的Tensorrt在Microsoft Build上亮相,现在可以作为独立SDK提供,使开发人员可以轻松地集成并优化RTX GPU上的AI模型。这个新版本允许使用即时(JIT)汇编,大大减少了优化不同GPU类所需的时间。

SDK的紧凑型尺寸和与Windows ML的兼容性使其成为寻求部署高性能AI应用程序的开发人员的吸引人选择。通过整合张力,开发人员可以通过最少的内存使用量实现大量的性能改进,为更有效的AI驱动应用铺平了道路。

更广泛的含义和未来的前景

NVIDIA与稳定性AI的合作范围超出了优化。两家公司正在努力将稳定的扩散3.5作为NVIDIA NIM微服务,从而为创建者和开发人员提供更轻松的部署。预计该微服务将于7月提供,为在各种应用程序中实施AI模型提供了简化的方法。

随着NVIDIA继续进行创新,其在AI和机器学习中的努力将重新定义生成AI模型的功能。随着持续的进步,利益相关者可以预期更加可靠,有效的AI解决方案,以满足数字内容创建及其他因素的不断增长的需求。

图像来源:Shutterstock


(tagstotranslate)AI(T)加密(T)区块链(T)新闻



关键词: