商业分析企业, IBM推出了旨在显著扩展 IBM Z 大型机系统处理能力的新技术,有助于加速传统 AI 模型和大型语言模型 (LLM) 的使用。
随着许多利用 LLM 的生成式 AI 项目从概念验证转向生产,对节能、安全和可扩展解决方案的需求已成为主要优先事项。
最近的 摩根士丹利 研究项目显示,未来几年,生成式人工智能的电力需求将以每年高达 75% 的速度增长,这将使其在 2026 年消耗的能源量与西班牙在 2022 年的消耗量相当。
引入新创新
IBM 发布了一款名为“IBM Telum II 处理器”的新型处理器芯片,其频率和内存容量均有所提升,缓存增加了 40%,并集成了 AI 加速器核心。IBM 希望这款新型处理器能够帮助企业为 LLM 提供计算解决方案,满足行业复杂的交易需求。
芯片上的新数据处理单元 (DPU) 将加速大型机上网络和存储的复杂 I/O 协议,从而简化系统操作。
IBM 还推出了新款“IBM Spyre Accelerator”芯片,该芯片将提供额外的 AI 计算能力,作为 Telum II 处理器的补充。
Telum II 和 Spyre 芯片将协同工作,支持 AI 建模的集成方法——将多个机器学习或深度学习 AI 模型与编码器 LLM 相结合的做法。通过利用每个模型架构的优势,集成 AI 可以提供比单个模型更准确、更可靠的结果。
“我们强大的多代路线图使我们在技术趋势方面保持领先地位,包括不断增长的人工智能需求,” 蒂娜·塔奎尼奥IBM 负责 IBM Z 和 LinuxONE 产品管理的副总裁。“Telum II 处理器和 Spyre 加速器旨在提供高性能、安全且更节能的企业计算解决方案。经过多年的开发,这些创新将引入我们的下一代 IBM Z 平台,以便客户能够大规模利用 LLM 和生成式 AI。”
IBM 的长期合作伙伴, 三星代工厂,将生产新的 Telum II 处理器和 IBM Spyre Accelerator。两家公司将继续合作,计划支持一系列先进的 AI 驱动用例,旨在释放商业价值并创造新的竞争优势。
服务生成式 AI 用例
新芯片的综合处理能力将为生成式人工智能用例的应用提供入口,例如:
保险索赔欺诈检测
通过集成人工智能 (Ensemble AI) 增强家庭保险索赔中的欺诈检测能力,它将 LLM 与传统神经网络相结合,以提高性能和准确性。
先进的反洗钱措施
高级检测可疑金融活动,支持遵守监管要求并降低金融犯罪的风险。
人工智能助手
推动应用程序生命周期的加速、知识和专业知识的转移、代码解释以及转型。
关键词: