The news is by your side.

NVIDIA 推出采用多代理架构的人工智能日志分析系统

10


托尼·金
2025 年 10 月 10 日 17:14

NVIDIA 推出了使用多代理架构和 RAG 技术的自我纠正 AI 日志分析系统,增强了 QA 和 DevOps 团队的调试和根本原因检测。




据 NVIDIA 称,NVIDIA 宣布推出一款新的人工智能日志分析系统,该系统采用多代理、自我纠正检索增强生成 (RAG) 框架。这一创新解决方案旨在通过将大量日志数据转化为可操作的见解,简化复杂 IT 环境中诊断和解决问题的流程。

应对日志分析挑战

日志是现代系统监控不可或缺的一部分,但其庞大的数量可能使分析变得令人畏惧。随着系统规模的扩大,日志可能会变得势不可挡,通常就像无尽的文本墙。 NVIDIA 的新系统利用人工智能自动进行日志解析、相关性分级和查询自我纠正,帮助团队快速识别超时或配置错误等问题的根本原因。

系统目标用户

日志分析代理对于各个团队特别有利:

  • 质量保证和测试自动化团队: 这些团队可以利用该系统进行日志汇总和根本原因检测,帮助查明测试逻辑或意外行为的问题。
  • 工程和 DevOps 团队: 通过统一异构日志源,系统有助于更快地发现根本原因,减少故障排除时间。
  • CloudOps 和 ITops 团队: 人工智能驱动的分析支持跨服务日志摄取和早期异常检测,这对于管理复杂的云环境至关重要。
  • 平台和可观察性经理: 该系统提供清晰、可操作的摘要而不是原始数据,有助于确定修复的优先级并增强产品体验。

创新架构和组件

NVIDIA 系统的核心是采用大型语言模型 (LLM) 的多代理 RAG 架构。该工作流程集成了:

  1. 混合检索: 使用 NVIDIA NeMo Retriever 嵌入将用于词汇匹配的 BM25 与用于语义相似性的 FAISS 矢量存储相结合。
  2. 重新排名: 使用 NeMo Retriever 优先考虑最相关的日志行。
  3. 等级: 对日志片段的上下文相关性进行评分。
  4. 一代: 生成上下文感知的答案而不是原始数据转储。
  5. 自校正循环: 如果初始结果不充分,系统会重写查询并重试。

多智能体智能

该系统的架构被设计为有向图,其中每个节点代表一个专门的代理,处理检索、重新排名、评分和生成等任务。图中的条件边确保适应性和动态决策,允许系统在必要时循环进行自我校正。

扩展系统的功能

NVIDIA 日志分析系统的模块化设计允许定制和扩展。用户可以微调法学硕士,使系统适应网络安全等特定行业,或跨领域应用,例如 QA、DevOps 和可观察性。该系统还具有自动化错误重现和可观察性仪表板开发的潜力。

对 IT 运营的影响

通过将非结构化日志转化为可操作的见解,NVIDIA 的日志分析系统显着缩短了解决问题的平均时间 (MTTR),从而提高了开发人员的工作效率并使调试更加高效。该技术不仅支持更快的问题诊断,还提供更智能的根本原因检测和上下文答案。

图片来源:Shutterstock




关键词:人工智能,加密,区块链,新闻