艾里斯·科尔曼
2024 年 10 月 13 日 02:37
AMD发布ROCm 6.2.3,增强Radeon GPU的AI能力,增强对Llama 3、Stable Diffusion和Triton框架的支持,提高AI开发效率。
AMD 推出了最新版本的开放计算软件 AMD ROCm™ 6.2.3,专门用于增强本机 Ubuntu® Linux® 系统上 Radeon GPU 的性能。据 AMD.com 称,此次更新旨在为 AI 模型(尤其是 Llama 3 70BQ4)提供卓越的推理性能,并使开发人员能够将稳定扩散 (SD) 2.1 文本到图像功能集成到他们的 AI 项目中。
ROCm 6.2.3 的主要特点
新的 ROCm 6.2.3 版本带来了多项旨在加速人工智能开发的高级功能:
- 通过 vLLM 支持 Llama 3: 此功能通过 Llama 3 70BQ4 型号在 Radeon GPU 上提供卓越的推理性能。
- Flash Attention 2 集成: 此功能旨在优化内存使用并提高推理速度,支持前向启用。
- 稳定扩散 2.1 支持: 开发人员现在可以将 SD 文本到图像模型合并到他们的 AI 应用程序中。
- Triton 框架测试版支持: 这使得开发人员能够以最少的专业知识编写高性能 AI 代码,并有效利用 AMD 硬件。
人工智能开发的进步
AMD 软件产品经理 Erik Hultgren 强调,ROCm 6.2.3 的目标是加快生成式 AI 开发的特定功能。该版本包括通过 vLLM 和 Flash Attention 2 对大型语言模型 (LLM) 推理进行专业级性能增强。它还引入了对 Triton 框架的测试版支持,扩大了 AMD 硬件上人工智能开发的范围。
ROCm 支持的演变
从 5.7 版本开始,AMD 对 Radeon GPU 的 ROCm 支持在过去一年中得到了显着发展。 6.0 版本通过合并 ONNX 运行时和正式认证更多 Radeon GPU(包括 Radeon PRO W7800)来扩展功能。 6.1 更新标志着多 GPU 配置支持以及与 TensorFlow 框架集成的另一个里程碑。
在当前版本中,ROCm 6.2.3 继续专注于 Linux® 系统,并计划很快推出 Windows® Subsystem for Linux® (WSL 2) 支持。这一战略方法旨在进一步增强 Radeon GPU 的 ROCm 解决方案堆栈,将其定位为人工智能和机器学习开发的强大选择。
如需更多信息和资源,请访问 AMD 官方社区页面。
图片来源:Shutterstock
关键词:人工智能,加密,区块链,新闻