詹姆斯·丁
9月9日,2025年16:28
NVIDIA揭幕了Rubin CPX GPU,增强了1M+令牌工作负载前所未有的效率的AI推断,从而改变了软件开发和视频生成等领域。
在AI技术的重大飞跃中,NVIDIA推出了Rubin CPX GPU,这是一个专门的处理器,旨在应对需要处理超过一百万个令牌的推理工作负载的日益复杂性。根据NVIDIA的说法,这种发展标志着AI基础设施的关键发展,有望提高各个领域的性能和效率。
通过分解推理来解决AI复杂性
推断,AI模型解释和对数据作用的过程正在迅速发展。现代AI系统现在需要多步推理和长期记忆,从其计算基础架构中需要更多。 NVIDIA的Rubin CPX旨在通过通过分解基础架构方法优化推理过程来满足这些需求。该体系结构将推理的上下文和生成阶段分开,从而允许对资源进行针对性的优化。
上下文阶段是计算结合的,需要高通量处理来分析大型数据量,而生成阶段则依赖于快速存储器传输。通过独立处理这些阶段,NVIDIA的方法可以增强吞吐量,减少延迟并改善资源利用率。
Rubin CPX:增强长篇文化处理
Rubin CPX GPU专门为长篇小说AI任务而建,将无缝集成到现有的基础架构中,以提高效率和投资回报率(ROI)。它具有30个NVFP4 Compute功率,128 GB的GDDR7内存以及用于视频过程的硬件支持的30个PETAFLOPS,非常适合软件开发和视频生成等高价值应用程序。
Rubin CPX与Nvidia Vera CPU和Rubin GPU一起工作,为复杂的AI工作负载构成了全面的解决方案。 NVIDIA VERA RUBIN NVL144 CPX机架配备了144个Rubin CPX GPU,144 Rubin GPU和36 Vera CPU,可提供无与伦比的性能,配备8个Exaflops NVFP4计算和广泛的内存带宽。
在AI基础架构中设置新标准
NVIDIA的最新产品将重新定义AI基础设施经济学,承诺将获得可观的投资回报。 Vera Rubin NVL144 CPX平台利用Nvidia的Quantum-X800 Infiniband和Spectrum-X以太网,预计将提供30倍至50倍的投资回报率,从1亿美元的投资中产生了数十亿美元的收入。
这项创新不仅增强了AI功能,而且为生成AI应用程序的未来发展树立了新的基准。通过通过NVIDIA Dynamo平台将分类基础架构与高级编排整合在一起,Rubin CPX为能够处理最苛刻的推理任务的更复杂的AI系统铺平了道路。
有关更多详细信息,请访问NVIDIA博客。
图像来源:Shutterstock
(tagstotranslate)AI(T)加密(T)区块链(T)新闻
关键词: