麻省理工学院研究揭示人工智能在保护关键基础设施方面的潜力

By Amelia On 8 月 27, 2024

约尔格·希勒
2024 年 8 月 27 日 01:50

麻省理工学院的新研究揭示了大型语言模型 (LLM) 如何有效检测关键基础设施系统中的异常，并提供即插即用的解决方案。

根据麻省理工学院 (MIT) 的一项新研究，大型语言模型 (LLM) 正在成为保护可再生能源、医疗保健和交通等关键基础设施系统的重要工具。

该研究引入了一种零样本 LLM 模型，用于检测复杂数据中的异常。通过利用人工智能驱动的诊断来监控和标记风力涡轮机、MRI 机器和铁路等设备中的潜在问题，这种方法可以降低运营成本、提高可靠性、减少停机时间并支持可持续的行业运营。

根据该研究的资深作者 Kalyan Veeramachaneni 的说法，使用深度学习模型检测基础设施问题需要大量的时间和资源进行训练、微调和测试。机器学习模型的部署需要机器学习团队（负责训练模型）和运营团队（负责监控设备）之间的密切合作。

“相比之下，LLM 是即插即用的。我们不必为每个新数据流创建独立的模型。我们可以直接在流入的数据上部署 LLM，”Veeramachaneni 说道。

研究人员开发了 SigLLM，这是一个将时间序列数据转换为文本以供分析的框架。然后使用 GPT-3.5 Turbo 和 Mistral LLM 来检测模式异常并标记可能预示系统潜在操作问题的异常。

该团队在 11 个不同的数据集上评估了 SigLLM 的性能，包括 492 个单变量时间序列和 2,349 个异常。这些多样化的数据来自各种应用，包括 NASA 卫星和雅虎流量，具有各种信号长度和异常。

两块 NVIDIA Titan RTX GPU 和一块 NVIDIA V100 Tensor Core GPU 满足了运行 GPT-3.5 Turbo 和 Mistral 进行零样本异常检测的计算需求。

研究发现，LLM 可以检测异常，与传统检测方法不同，SigLLM 利用 LLM 在模式识别方面的固有能力，而无需大量训练。然而，专门的深度学习模型的表现比 SigLLM 高出约 30%。

“我们惊讶地发现，基于 LLM 的方法比一些基于深度学习转换器的方法表现更好，”Veeramachaneni 指出。“不过，这些方法并不像目前最先进的模型那样好，例如带回归的自动编码器 (AER)。我们还需要做一些工作才能达到那个水平。”

这项研究可能代表人工智能驱动监控领域迈出的重要一步，具有有效检测异常的潜力，尤其是在进一步增强模型的情况下。

Veeramachaneni 认为，主要挑战在于确定该方法的稳健性，同时保持 LLM 的优势。该团队还计划研究 LLM 如何在不进行微调的情况下有效预测异常，这将涉及使用各种提示测试 LLM。

研究中使用的数据集在 GitHub 上公开可用。

请参阅 NVIDIA 技术博客上的完整故事。

图片来源：Shutterstock

（标签翻译）人工智能（t）加密（t）区块链（t）新闻

关键词：AI,crypto,blockchain,news