当前位置：首页 > news >正文

基于cnn的通用图像分类项目

news 2025/8/5 3:52:37

背景

项目上需要做一个图像分类的工程。本人希望这么一个工程可以帮助学习ai的新同学快速把代码跑起来，快速将自己的数据集投入到实战中！

代码仓库地址：imageClassifier: 图片分类器

数据处理

自己准备的分类图像，按照文件夹分类，放在dataset目录下。

运行一下data_partitioning的方法，会自动按照比例将数据划分为训练集和测试集。存放在data目录下。

执行完之后可以看到data文件夹下出现了train文件夹和test文件夹，这两个文件夹下按照分类也做了数据划分。

模型训练

在train_model.py里面首先是超参数设置。这里面的数值都有默认值，根据数据集不同，经常修改的值通常是批次大小和轮数。

举例：如果需要将训练轮次设置为50轮，批次大小设置为64的话，只需要按照下图所示，在ide的运行配置里加上即可。注意，不同的配置字段之间用空格隔开。

关于轮次大小和批次大小的设置，这里建议：

第一次训练时可以将轮次调整为一个较大的值，数据量越大建议轮数越高。由于代码里存在早停机制，所以即使轮数大到过于夸张，在训练后期由于准确率提升不明显，训练流程会自动停止。
第一次训练可以将批次大小调整为一个较小的值。由于训练期间同一批次的数据会一起放入显存中，所以批次过大容易出现爆显存的现象。当训练期间发现显存没有被占满时，可以提高批次大小，提升训练速度。

执行以上方法就可以开始训练了。图像分类的类别通过文件夹数量获取即可，不需要人为设置。

训练后参数文件会保存在dict文件夹下面。

模型测试

在训练完成后，到model_test.py文件里运行代码即可，会把在测试集中的数据完整验证一遍，计算出准确率，并打印出每条数据的预测值与真实值。

模型推理

推理过程我们要做的是，导入一张图片，经过模型运算得出其分类类型。在model_inference.py里面，我们需要指定一张用来推理的图片。图片的路径放在inference目录下，图片名称可以改成真实的图片名称。

运行model_inference.py的方法，即加载模型->加载图片->模型推理->得出预测值。

示例

在master分支上是一个猫狗分类的项目。其中dog文件夹里有4999张狗的图片，cat文件夹里有4990张猫的图片。

下图为训练100轮次的loss变化与准确率变化。由于训练阶段中也会切分训练-验证数据集，所以通常是通过val-acc来观察实际的准确率，可以看到最后准确率约达到90%。

运行模型测试代码，得出准确率为93.8%。

在inference文件夹里放入一个猫/狗图片，注意这张图片不要来自于训练数据。

运行推理程序，得出分类类型为cat。

http://www.lqws.cn/news/127585.html

相关文章：

从npm库 Vue 组件到独立SDK：打包与 CDN 引入的最佳实践

ann算法的种类有哪些，之间的区别，各自的适用场景

[蓝桥杯]填字母游戏

开发源码搭建一码双端应用分发平台教程：逐步分析注意事项

# Vue + OpenLayers 完整项目开发指南

物联网协议之MQTT（一）基础概念和设备

C++内存列传之RAII宇宙：智能指针

20-项目部署(Docker)

haribote原型系统改进方向

编程笔试练习（1）

6.4本日总结

mac版excel如何制作时长版环形图

Delft3D软件介绍及建模原理和步骤；Delft3D数值模拟溶质运移模型建立；地表水环境影响评价报告编写思路

破解HTTP无状态：基于Java的Session与Cookie协同工作指南

华为云服务器 Java 项目部署 “版本穿越” 危机破解指南

机器学习基础(四) 决策树

linux系统--iptables实战案例

技术文档的降维打击：3大原则+5步结构+CSDN流量密码

Windows下运行Redis并设置为开机自启的服务

Git忽略规则.gitignore不生效解决

信号与系统汇总

zabbix 6 监控 docker 容器

零基础玩转Python生物信息学：数据分析与算法实现

【算法深练】分组循环：“分”出条理，化繁为简

施耐德特价型号伺服电机VIA0703D31A1022、常见故障

【趣味Html】第11课：动态闪烁发光粒子五角星博客

基于大模型的结节性甲状腺肿智能诊疗系统技术方案

人脸识别技术应用备案主体与条件

SVM超详细原理总结

五大主流大模型推理引擎深度解析：llama.cpp、vLLM、SGLang、DeepSpeed和Unsloth的终极选择指南