当前位置: 首页 > news >正文

Ai大模型 - ocr图像识别形成结构化数据(pp-ocr+nlp结合) 以及训练微调实现方案(初稿)

全局目录,一步到位

  • 功能流程
  • 第一阶段 基于现有条件进行 `调研,测试与评估`
    • 1.1 ocr深度学习模型 pp-ocr
    • 1.2 nlp结构化模型
    • 1.3 硬件要求:
  • 第二阶段 模型训练微调
    • 2.1 更换ocr-GPU模型, 下载相关环境
    • 2.2 nlp模型 语义训练
    • 2.3 最低硬件要求:
    • 2.4 样本数据: (重点)
    • 2.5 进一步增强模型能力
    • 2.5 python语言类库 (深度学习框架)
  • 第三阶段: 结果
  • 注意事项
  • 至此, 医疗领域-此方向的专属ocr大模型就完成了

功能流程

数据预处理
检测模型微调
识别模型微调
模型联调
NLP后处理
错误分析
迭代优化

第一阶段 基于现有条件进行 调研,测试与评估

全部先使用 预训练完成的模型(本地进行测试,评估后进行二阶段训练微调)

在这里插入图片描述

1.1 ocr深度学习模型 pp-ocr

  1. 了解 百度开源模型 pp-ocr
  2. 先在windows上使用预训练模型 可先选cpu版本查看执行效果
  3. 下载nlp自然语言模型进行json格式化输出
  4. 模型评估: 上述结果不能满足业务需求, 进行第二阶段

1.2 nlp结构化模型

先选: DD-Parse(尽量先使用百度pp全家桶)

1.3 硬件要求:

先基于现有电脑进行测试, 不满足在升级

第二阶段 模型训练微调

官方明确说明 windows仅支持推理,不支持训练
解决方案: linux部署 或者 WSL2或Docker方案解决

2.1 更换ocr-GPU模型, 下载相关环境

2.2 nlp模型 语义训练

2.3 最低硬件要求:

cpu i7 /i5 等都可以(满足: x64/ Intel 64/ AMD64 即可) 核心数要多 
内存 32g(最低) 不然训练时候会频繁报错
显存: 8g - 12g 太小训练效率低
硬盘: 512g/1T(推荐)

2.4 样本数据: (重点)

3000-5000, 需要进行数据标注,进行 监督学习

2.5 进一步增强模型能力

  • 可通过用户反馈进行学习训练
  • 对模型的性能 准确率进行评估

2.5 python语言类库 (深度学习框架)

python --version: 3.8/3.9/3.10/3.11/3.12/3.13
pip 版本为 20.2.2更高版本
Python 和 pip 是 64bit,并且处理器架构是 x86_64(或称作 x64、Intel 64、AMD64)架构

paddleocr 3.0
shapely
pyclipper
lmdb
tqdm
sklearn
requirements.txt (将版本写清楚,工程初始化用) 

第三阶段: 结果

  1. 微调后的PP-OCR检测/识别模型(.pdparams)
  2. API接口封装文档(FastAPI部署方案)
  3. 训练的python项目代码

注意事项

  1. 需要对错误数据进行记录(用户反馈等)
  2. 持续的进行训练 直到达到模型评估的标注,满足业务要求
  3. 模型安装的安全性以及用户隐私数据的保护

至此, 医疗领域-此方向的专属ocr大模型就完成了

如果后续需要拓展升级, 再出相关方案 windows版本官方文档上不支持

http://www.lqws.cn/news/547975.html

相关文章:

  • 第六章 总线
  • 四大高频设计题深度解析:【LRU缓存】、【LFU缓存】、最大频率栈、餐盘栈
  • 论面向服务的架构设计
  • Java项目:基于SSM框架实现的宠物综合服务平台管理系统【ssm+B/S架构+源码+数据库+毕业论文+开题报告】
  • MySQL在C中常用的API接口
  • 楼宇自控系统以智能化管控,全方位满足建筑节约、安全与可靠运行需求
  • 嵌入式项目:基于QT与Hi3861的物联网智能大棚集成控制系统
  • 模型部署和推理架构学习笔记
  • <script setup> 语法糖
  • 中高端服装品牌开展全渠道零售业务,如何选OMS订单管理系统?|商派
  • 成都芯谷金融中心·文化科技产业园:绘就区域腾飞新篇章
  • 【Pandas】pandas DataFrame resample
  • 疲劳检测与行为分析:工厂智能化实践
  • 解剖智能运维三基石:Metrics/Logs/Traces
  • 广东广电U点-创维E900-S-海思MV310芯片-海兔线刷烧录固件包
  • 香港 8C 站群服务器买来可以做哪些业务?
  • TCP/IP协议简要概述
  • linux初阶---一些指令
  • day49-硬件学习之I2C(续)
  • Tomcat Maven 插件
  • 第六章 STM32内存管理
  • 黑马JVM解析笔记(五):深入理解Java字节码执行机制
  • SpringBoot自动配置原理详解
  • 修复opensuse 风滚草rabbitmq的Error: :plugins_dir_does_not_exist问题
  • 关于前端npm install安装依赖和打包的一些问题记录
  • Django实战:自定义中间件实现全链路操作日志记录
  • 设计模式 | 桥接模式
  • K8s port、targetPort和nodePort区别
  • 使用Puppeteer提取页面内容的技巧
  • 小米路由器 AX3000T 解锁 SSH