乔格·希勒(Joerg Hiller)
7月2日,2025年15:11
黑森林实验室引入了Flux.1 Kontext,使用Nvidia的Tensorrt进行了优化,以增强图像编辑性能,并使用RTX GPU上的低精确量化量化。
Black Forest Labs发布了其最新模型Flux.1 Kontext,该模型有望通过创新的低精确量化技术来增强图像编辑景观。通过与NVIDIA合作开发的这个新模型,通过集成扩散模型推理性能的尖端优化技术来引入图像到图像转换任务的范式转变。
创新的编辑功能
Flux.1 Kontext(DEV)模型通过为用户提供了以更高的灵活性和效率执行图像编辑的能力来脱颖而出。通过远离依赖复杂提示和难以供电的面罩的传统方法,该模型引入了更直观的编辑过程。现在,用户可以执行多转弯图像编辑,从而可以将复杂的任务分解为可管理的阶段,同时保留原始图像的语义完整性。
NVIDIA RTX GPU的优化
利用NVIDIA的RTX GPU的功能,Flux.1 Kontext(DEV)利用张力和量化来实现更快的推断和减少VRAM要求。这种优化建立在NVIDIA在RTX 50系列GPU的FP4图像生成中的现有进步,展示了低精确量化的量化如何彻底改变用户体验。
管道和量化技术
该模型结合了几个关键模块,包括视觉转换器主链和一个自动编码器,可优化以提高性能。使用量化策略(例如FP8和FP4格式),变压器模块占用了很大一部分处理时间,用于优化。这些技术减少了内存使用和计算需求,使该模型在各种硬件配置上更容易访问。
性能和效率
绩效测试表明,从BF16转换为FP8精度时,效率的大幅提高,FP4精度进一步提高。变压器体系结构的关键组成部分的比例点产量 – 注意操作员的量化在提高推理时间效率方面起着关键作用,同时保持高数值精度。
在消费级GPU(例如NVIDIA RTX 5090)上,其性能提高尤其值得注意,该GPU受益于减少的内存足迹,从而可以同时运行多个模型实例,从而提高吞吐量和成本效益。
结论
Flux.1 Kontext(DEV)模型将低精度量化与NVIDIA张力的集成在图像编辑功能方面取得了显着进步。通过优化推理性能并减少记忆消耗,该模型提供了响应式用户体验,可以鼓励创造性探索。黑森林实验室与NVIDIA之间的这种合作为更广泛地采用先进的AI技术铺平了道路,使对强大图像编辑工具的访问民主化。
有关Flux.1 Kontext模型及其优化技术的更详细的见解,请访问NVIDIA开发人员博客。
图像来源:Shutterstock
(tagstotranslate)AI(T)加密(T)区块链(T)新闻
关键词: