The news is by your side.

通过微调嵌入模型增强自定义信息检索

5


路易莎·克劳福德(Luisa Crawford)
6月26日,2025年12:49

发现Coxwave如何使用NVIDIA NEMO策展人提高特定域的嵌入模型精度,从而在信息检索效率和准确性方面取得了重大提高。




自定义嵌入模型已成为优化信息检索系统的关键策略,尤其是在处理特定领域的数据时,例如法律文档或医疗记录。根据NVIDIA Developer Blog上的最新文章,通用模型通常在捕获这些专业数据集的复杂性方面通常不足,从而促使人们需要量身定制的解决方案。

利用NVIDIA NEMO策展人

专门用于对话AI Analytics的平台Coxwave Align已采用NVIDIA NEMO策展人来开发一个可靠的域特异性数据集。该数据集在微调嵌入模型中发挥了重要作用,这导致了查询和文档之间语义一致性的显着改善。增强的精度超过了开放和封闭式替代方案。

这些精制的嵌入量被整合到Coxwave的检索效果(RAG)管道中,从而提高了回猎犬的效率。改进的检索器确定了更多相关的文档,随后在达到生成阶段之前由Reranker评估。

数据策划和模型效率

与假设较大的数据集等同于更好的性能的假设相反,Coxwave发现细致的数据策展显着影响模型效率。该公司专注于严格的预处理以消除冗余模式,从而减少了六倍的训练时间。这种方法还增强了模型的概括并减少过度拟合。

尽管通过微调引起了潜在的延迟和可扩展性的挑战,但Coxwave的仔细数据策展允许使用较小,更有效的模型。这种优化导致了更快的推理时间,并减少了对重新研究的需求,从而提高了系统的准确性和效率。

克服多转交谈的挑战

Coxwave一致专门分析动态对话历史,这是一个传统信息检索系统经常挣扎的领域。会话数据的独特结构,语义和流程需要专门的方法。为了解决这个问题,Coxwave对其检索模型进行了微调,以更好地理解对话环境和意图,并使用NVIDIA NEMO策展人来策划针对这些特定用例的高质量数据集。

数据策划技术

Coxwave团队始于240万个对话样本的大量数据集,他们使用Nemo Curator精心完善了这些样本。从原始数据中使用精确和模糊的重复数据删除,语义重复数据删除和质量过滤等技术来策划605,000个高质量的样本。这种策展过程不仅将模型准确性提高了12%,而且还将训练时间从32小时减少到只有6个,大大降低了计算成本。

令人印象深刻的结果

在测试中,微调模型表现出卓越的性能,精度指标的表现优于竞争模型。减少的数据集大小还导致训练时间大幅下降并改善了模型稳定性。

有关Coxwave使用的技术和工具的更多信息,请访问NVIDIA开发人员博客。

图像来源:Shutterstock


(tagstotranslate)AI(T)加密(T)区块链(T)新闻



关键词: