图像分类
图像分类模型采用轻量级架构,推理速度快、计算效率高,在保持高分类精度的同时实现低延迟预测。输出为图像级类别标签,适用于快速图像分类、内容过滤及预处理等场景。
图像分类特点:
- 数据标注简单
- 训练速度快
- 推理速度快、延迟低
- 准确率高
图像分类在很多场景中都有应用,也经常作为复杂任务中的一个环节。如:
- 图像预筛选
- 颜色分类
- 方向分类
- 零部件分类等。
准备数据集
文件结构
图像分类任务建议按照如下方式创建文件夹;
- 通常单个任务为 1 个文件夹,如最外层的【颜色分类】;任务文件夹下包含训练集、工作目录和项目文件。
- 训练集:参考下方分类模型的训练集中的介绍
- 工作目录:存放训练完成的模型,此外还有模型训练日志、过漏检数据、中间结果等。
- Demo-颜色分类.dva 为 AI 项目文件,在创建项目后自动生成,里面保存了当前任务的设置,如数据路径,训练参数等。
分类模型的训练集
分类模型的类别按照训练集中的第一层文件夹的名称,在颜色分类任务中,有9个文件夹,名称分别是 白色、橙色、粉色、红色、黄色、蓝色、浅绿色、深绿色、紫色;
分类标注
图像分类的标注过程很简单,只需要将图像放入对应类别的文件夹中即可。
创建项目
项目名称可以按需设置,训练集和工作目录要选择正确。
新项目创建完成后会出现在项目列表的第一个,点击【项目名称】可以进入,该项目。
项目详情
数据分析
训练前,需要【加载数据集】,这个过程会读取数据路径中的所有标注数据信息,统计类别数量,自动计算神经网络中的神经元个数。
数据增强
分类模型的尺寸大小通常设置为 224×224,其他的数据增强可以按需设置,如随机调整亮度和对比度等。
训练参数
-
数据集比例通常设置为 8: 2 或 9:1。
-
数据倍增:在初期数据量较少(10张左右时),数据倍增参数设置为 10-20;随着数据增加,数据倍增参数相应减少,通常为 5、4、2,数据量极大时(>2000),设置为 1。本次实验中可以设置为 5。
-
训练参数通常使用默认参数,在【评估参数】中勾选【保存过漏检数据】可以查看过漏检数据。
训练记录
- 训练时间:183张图,RTX4090 笔记本,数据倍增 5,尺寸 224,分类模型训练时间约为 64 秒。
- Loss 曲线:正确的趋势为逐步下降并收敛。
- 准确率曲线:正确的趋势为逐渐上升并收敛。
- 混淆矩阵可以显示不同类别之间的过漏检情况。
AI 模型
训练完成的模型保存在设置的【工作目录】中。
在测试平台中测试模型结果
可以在训练记录中一键跳转到测试平台,会自动加载训练集和 AI 模型;也可以手动打开测试平台,加载需要测试的数据和模型。