通过微调嵌入模型增强自定义信息检索

By Amelia On 6 月 28, 2025

路易莎·克劳福德（Luisa Crawford）
6月26日，2025年12:49

发现Coxwave如何使用NVIDIA NEMO策展人提高特定域的嵌入模型精度，从而在信息检索效率和准确性方面取得了重大提高。

自定义嵌入模型已成为优化信息检索系统的关键策略，尤其是在处理特定领域的数据时，例如法律文档或医疗记录。根据NVIDIA Developer Blog上的最新文章，通用模型通常在捕获这些专业数据集的复杂性方面通常不足，从而促使人们需要量身定制的解决方案。

利用NVIDIA NEMO策展人

专门用于对话AI Analytics的平台Coxwave Align已采用NVIDIA NEMO策展人来开发一个可靠的域特异性数据集。该数据集在微调嵌入模型中发挥了重要作用，这导致了查询和文档之间语义一致性的显着改善。增强的精度超过了开放和封闭式替代方案。

这些精制的嵌入量被整合到Coxwave的检索效果（RAG）管道中，从而提高了回猎犬的效率。改进的检索器确定了更多相关的文档，随后在达到生成阶段之前由Reranker评估。

数据策划和模型效率

与假设较大的数据集等同于更好的性能的假设相反，Coxwave发现细致的数据策展显着影响模型效率。该公司专注于严格的预处理以消除冗余模式，从而减少了六倍的训练时间。这种方法还增强了模型的概括并减少过度拟合。

尽管通过微调引起了潜在的延迟和可扩展性的挑战，但Coxwave的仔细数据策展允许使用较小，更有效的模型。这种优化导致了更快的推理时间，并减少了对重新研究的需求，从而提高了系统的准确性和效率。

克服多转交谈的挑战

Coxwave一致专门分析动态对话历史，这是一个传统信息检索系统经常挣扎的领域。会话数据的独特结构，语义和流程需要专门的方法。为了解决这个问题，Coxwave对其检索模型进行了微调，以更好地理解对话环境和意图，并使用NVIDIA NEMO策展人来策划针对这些特定用例的高质量数据集。

数据策划技术

Coxwave团队始于240万个对话样本的大量数据集，他们使用Nemo Curator精心完善了这些样本。从原始数据中使用精确和模糊的重复数据删除，语义重复数据删除和质量过滤等技术来策划605,000个高质量的样本。这种策展过程不仅将模型准确性提高了12％，而且还将训练时间从32小时减少到只有6个，大大降低了计算成本。

令人印象深刻的结果

在测试中，微调模型表现出卓越的性能，精度指标的表现优于竞争模型。减少的数据集大小还导致训练时间大幅下降并改善了模型稳定性。

有关Coxwave使用的技术和工具的更多信息，请访问NVIDIA开发人员博客。

图像来源：Shutterstock

（tagstotranslate）AI（T）加密（T）区块链（T）新闻

关键词：

通过微调嵌入模型增强自定义信息检索