当前位置: 首页 > news >正文

vanna+deepseek+chainlit 实现自然语言转SQL的精度调优

先说目前遇到的问题吧,单表数据SQL 生成准确度是可以的,但是复杂SQL以及多表联查时,生成的SQL就一言难尽了。

目前的解决方案:

一、数据训练后台

创建后台来管理三类训练数据,DDL 、SQL、DOC文档。

使用三个集合,来分别管理这三类数据

添加训练SQL:

二、前端与用户交互,询问是否将本次对话加入到训练库中

前端与用户交互,询问是否将本次对话加入到训练库中,如果确认,则给用户回显当前训练库中相似度最高的前3条SQL供用户预览,然后二次确认是否需要将本次对话加入到训练库中

三、对于复杂SQL 如多表查询

对于复杂SQL 如多表查询,生产SQL,主要是基于训练的SQL生成。

用户提问,然后对于训练库数据召回。

  • ≥99.5%相似度:直接使用训练库中的SQL
  • 80%-99.5%相似度:基于已有SQL让大模型微调
  • <80%相似度:正常生成流程(DDL+SQL+DOC交给大模型生成)

后续我会把源码放出来。。。

http://www.lqws.cn/news/188695.html

相关文章:

  • Auto-Coder使用GPT-4o完成:在用TabPFN这个模型构建一个预测未来3天涨跌的分类任务
  • MySQL 性能调优入门 - 慢查询分析与索引优化基础
  • 行业案例 | ASOS 借助 Azure AI Foundry(国际版)为年轻时尚爱好者打造惊喜体验
  • [electron]预脚本不显示内联script
  • AIGC 基础篇 Python基础 01
  • [特殊字符]解决 “IDEA 登录失败。不支持早于 14.0 的 GitLab 版本” 问题的几种方法
  • Halcon透视矩阵
  • 深入了解JavaScript当中如何确定值的类型
  • 经典文献阅读之--PIVOT-R(原始驱动的航点感知世界模型用于机器人操作)
  • 蓝桥春晚魔术(欧拉定理+快速幂)
  • 今日行情明日机会——20250606
  • 车牌识别技术解决方案
  • 大模型在脑梗塞后遗症风险预测及治疗方案制定中的应用研究
  • 使用VTK还是OpenGL集成到qt程序里哪个好?
  • 电脑桌面太单调,用Python写一个桌面小宠物应用。
  • 计算机视觉与深度学习 | 基于MATLAB的相机标定
  • 【 *p取出内容 a得到地址】
  • 服务器健康摩尔斯电码:深度解读S0-S5状态指示灯
  • 循环神经网络(RNN)
  • 增量式网络爬虫通用模板
  • Numpy5——数组的扩充(相加、复制、广播)排序,形状调整
  • RabbitMQ 学习
  • android debug包和release包的区别
  • EDA断供危机下的冷思考:中国芯片设计软件的破局之道优雅草卓伊凡
  • 关于dropbear ssh服务
  • MySQL基本操作
  • 构建SDK-C Docker镜像
  • 服务器中日志分析的作用都有哪些
  • Spring整合MyBatis的两种方式
  • 二分算法