The news is by your side.

NVIDIA 利用先进的 RAG 技术增强 O-RAN 规范

8


劳伦斯·詹格
2024 年 10 月 12 日 13:35

NVIDIA 采用先进的 RAG 技术,利用 NIM 微服务来简化 O-RAN 规范,从而增强电信领域的互操作性和效率。




电信行业在管理不断发展的标准的复杂性方面面临着持续的挑战。据 NVIDIA 技术博客称,NVIDIA 正在利用先进的检索增强生成 (RAG) 技术来简化 O-RAN(开放无线电接入网络)规范的解释和应用,这是一项重大进展。

利用生成式人工智能

NVIDIA 正在利用生成式 AI 来自动处理技术标准,从而减少分析和实施复杂协议所需的时间和精力。该公司开发了适用于 O-RAN 标准的聊天机器人演示,展示了人工智能在处理大量技术规范方面的潜力。

O-RAN 旨在通过使用开放接口和模块化组件来增强电信网络的互操作性、开放性和创新。 NVIDIA 的方法涉及使用 NIM 微服务和 RAG 来有效解决与 O-RAN 规范相关的复杂查询。

创新的聊天机器人架构

O-RAN 聊天机器人采用云原生 RAG 架构,利用 NVIDIA NeMo Retriever 进行文本嵌入和基于相关性的重新排名,以改进语义排序。 LangChain 框架促进了各种聊天机器人元素的集成,而 GPU 加速的 FAISS 矢量数据库则存储嵌入。

为了确保准确且相关的响应,NVIDIA 部署了 NeMo Guardrails 并使用 Streamlit 实现了用户友好的界面。这些增强功能使聊天机器人能够与用户无缝交互,为技术问题提供准确的答案。

应对 RAG 挑战

尽管采用创新架构,RAG 系统的初始部署仍面临挑战,包括冗长和语气不一致,以及检索相关文档的问题。 NVIDIA 通过调整提示并尝试高级检索策略(例如 Advanced RAG 和 HyDE RAG)来解决这些问题。

高级 RAG 涉及查询转换以生成多个子查询、扩大搜索空间并提高文档相关性。 HyDE RAG 通过考虑潜在答案来增强检索,从而实现更好的上下文相关文档检索。

评估检索策略

为了评估这些先进技术的功效,NVIDIA 进行了人工和自动评估。 O-RAN 工程师精心设计问题来测试 RAG 方法,并由人类专家对回答的质量和相关性进行评级。自动化评估采用 RAGA 框架,并使用法学硕士作为评委。

结果表明,Advanced RAG 始终优于 Naive 和 HyDE RAG 方法,显着提高了响应质量和检索准确性。

优化语言模型

在确定最佳检索策略后,NVIDIA 评估了各种 LLM NIM 微服务,以进一步提高答案准确性。尽管测试了多个模型,结果显示性能差异很小,这凸显了检索优化是成功的关键因素。

结论

NVIDIA 先进的 RAG 技术展示了将人工智能与电信标准处理相集成的变革潜力。 O-RAN 聊天机器人体现了 NVIDIA 的端到端平台如何在快速发展的电信行业中提高效率并保持竞争优势。

图片来源:Shutterstock




关键词:人工智能,加密,区块链,新闻