使用Tinker和Ray增强文本到SQL模型

By Amelia On 10 月 2, 2025

彼得张
2025年10月2日00:46

发现如何利用修补匠和射线来微调文本到SQL模型，从而增强了AI在生成高效SQL查询时的功能。

在推进文本到SQL模型的创新方法中，AnyScale引入了一种利用Tinker和Ray来简化培训和部署过程的方法。根据Enyscale的说法，这一开发旨在增强AI建筑商在产生高效SQL查询方面的能力。

数据生成技术

该过程涉及两个主要组成部分：数据生成和模型微调。最初，使用QWEN-8B生成数据，QWEN-8B使用VLLM部署，Ray用作任何尺度服务。该设置允许可扩展的LLM推断，对于有效处理大型数据集至关重要。射线核心促进执行许多并行任务以产生候选SQL查询。然后，使用Skyrl-Gym在SQL环境中评估这些查询，该工具旨在计算奖励和评估查询成功。

为了将QWEN-8B模型部署为服务，采用了Ray服务与VLLM的集成。该设置是使用直接脚本执行的，可以并行地部署SQL查询。确定并存储成功的查询以进行进一步处理。

用修补匠微调模型

Tinker API在标记数据和微调模型中起关键作用。提供高水平的控制，Tinker允许对模型参数进行精确调整。 API通过通过令牌化处理示例并应用聊天模板，为模型输入准备数据来支持LLM的培训。

微调过程涉及运行前后通行证的多次迭代，并使用ADAM Optimizer调整模型的权重。该迭代过程旨在最大程度地减少每个令牌的损失，从而提高模型生成SQL查询的准确性。

评估模型性能

一旦模型进行微调，将通过下载模型检查点来评估其性能。提取Lora权重并与基本模型合并，以确保与VLLM的兼容性，从而实现直接服务部署。此步骤对于评估模型在现实世界应用中的能力至关重要。

其他设置要求

为了实现此方法，需要几个设置步骤。其中包括使用Dockerfile定义基本图像以及配置服务和作业文件，以有效地管理部署和数据生成任务。这些配置确保可以在各种环境中部署和测试模型，从而促进更广泛的采用和应用。

总体而言，在微调文本到SQL模型中，Tinker和Ray的集成代表了AI开发中的重要一步，为处理复杂的SQL查询生成任务提供了可扩展有效的解决方案。

图像来源：Shutterstock

（tagstotranslate）AI（T）加密（T）区块链（T）新闻

关键词：

使用Tinker和Ray增强文本到SQL模型