The news is by your side.

使用Tinker和Ray增强文本到SQL模型

12


彼得张
2025年10月2日00:46

发现如何利用修补匠和射线来微调文本到SQL模型,从而增强了AI在生成高效SQL查询时的功能。




在推进文本到SQL模型的创新方法中,AnyScale引入了一种利用Tinker和Ray来简化培训和部署过程的方法。根据Enyscale的说法,这一开发旨在增强AI建筑商在产生高效SQL查询方面的能力。

数据生成技术

该过程涉及两个主要组成部分:数据生成和模型微调。最初,使用QWEN-8B生成数据,QWEN-8B使用VLLM部署,Ray用作任何尺度服务。该设置允许可扩展的LLM推断,对于有效处理大型数据集至关重要。射线核心促进执行许多并行任务以产生候选SQL查询。然后,使用Skyrl-Gym在SQL环境中评估这些查询,该工具旨在计算奖励和评估查询成功。

为了将QWEN-8B模型部署为服务,采用了Ray服务与VLLM的集成。该设置是使用直接脚本执行的,可以并行地部署SQL查询。确定并存储成功的查询以进行进一步处理。

用修补匠微调模型

Tinker API在标记数据和微调模型中起关键作用。提供高水平的控制,Tinker允许对模型参数进行精确调整。 API通过通过令牌化处理示例并应用聊天模板,为模型输入准备数据来支持LLM的培训。

微调过程涉及运行前后通行证的多次迭代,并使用ADAM Optimizer调整模型的权重。该迭代过程旨在最大程度地减少每个令牌的损失,从而提高模型生成SQL查询的准确性。

评估模型性能

一旦模型进行微调,将通过下载模型检查点来评估其性能。提取Lora权重并与基本模型合并,以确保与VLLM的兼容性,从而实现直接服务部署。此步骤对于评估模型在现实世界应用中的能力至关重要。

其他设置要求

为了实现此方法,需要几个设置步骤。其中包括使用Dockerfile定义基本图像以及配置服务和作业文件,以有效地管理部署和数据生成任务。这些配置确保可以在各种环境中部署和测试模型,从而促进更广泛的采用和应用。

总体而言,在微调文本到SQL模型中,Tinker和Ray的集成代表了AI开发中的重要一步,为处理复杂的SQL查询生成任务提供了可扩展有效的解决方案。

图像来源:Shutterstock


(tagstotranslate)AI(T)加密(T)区块链(T)新闻



关键词: