The news is by your side.

AMD 推出 ROCm 6.2.3 增强 Radeon GPU 上的 AI 性能

27


艾里斯·科尔曼
2024 年 10 月 13 日 02:37

AMD发布ROCm 6.2.3,增强Radeon GPU的AI能力,增强对Llama 3、Stable Diffusion和Triton框架的支持,提高AI开发效率。




AMD 推出了最新版本的开放计算软件 AMD ROCm™ 6.2.3,专门用于增强本机 Ubuntu® Linux® 系统上 Radeon GPU 的性能。据 AMD.com 称,此次更新旨在为 AI 模型(尤其是 Llama 3 70BQ4)提供卓越的推理性能,并使开发人员能够将稳定扩散 (SD) 2.1 文本到图像功能集成到他们的 AI 项目中。

ROCm 6.2.3 的主要特点

新的 ROCm 6.2.3 版本带来了多项旨在加速人工智能开发的高级功能:

  • 通过 vLLM 支持 Llama 3: 此功能通过 Llama 3 70BQ4 型号在 Radeon GPU 上提供卓越的推理性能。
  • Flash Attention 2 集成: 此功能旨在优化内存使用并提高推理速度,支持前向启用。
  • 稳定扩散 2.1 支持: 开发人员现在可以将 SD 文本到图像模型合并到他们的 AI 应用程序中。
  • Triton 框架测试版支持: 这使得开发人员能够以最少的专业知识编写高性能 AI 代码,并有效利用 AMD 硬件。

人工智能开发的进步

AMD 软件产品经理 Erik Hultgren 强调,ROCm 6.2.3 的目标是加快生成式 AI 开发的特定功能。该版本包括通过 vLLM 和 Flash Attention 2 对大型语言模型 (LLM) 推理进行专业级性能增强。它还引入了对 Triton 框架的测试版支持,扩大了 AMD 硬件上人工智能开发的范围。

ROCm 支持的演变

从 5.7 版本开始,AMD 对 Radeon GPU 的 ROCm 支持在过去一年中得到了显着发展。 6.0 版本通过合并 ONNX 运行时和正式认证更多 Radeon GPU(包括 Radeon PRO W7800)来扩展功能。 6.1 更新标志着多 GPU 配置支持以及与 TensorFlow 框架集成的另一个里程碑。

在当前版本中,ROCm 6.2.3 继续专注于 Linux® 系统,并计划很快推出 Windows® Subsystem for Linux® (WSL 2) 支持。这一战略方法旨在进一步增强 Radeon GPU 的 ROCm 解决方案堆栈,将其定位为人工智能和机器学习开发的强大选择。

如需更多信息和资源,请访问 AMD 官方社区页面。

图片来源:Shutterstock




关键词:人工智能,加密,区块链,新闻