评估参数
评估间隔
模型训练至多少代评估一次。默认一代评估一次
调整评估间隔会影响模型训时长,训练时间会随着评估间隔的增大而缩短,但不会影响模型结果。
不同评估间隔对比
评估间隔为:1
评估间隔为:4
通过周期性评估验证模型在测试集的检出能力,可实时跟踪模型的收敛趋势与泛化能力。不同任务会有不同的指标,包括精确率、准确率、召回率、IoU、混淆矩阵等。
训练 loss 反映模型对训练数据的拟合程度,mAP(Mean Average Precision)与 mAR(Mean Average Recall)是评估模型过检与漏检的核心指标。
mAP与mAR指标
mAP 与 mAR 同步提升
模型精度与召回达到优平衡,整体性能优化。
低 mAP + 高 mAR
模型过检率或误检率较高,漏检控制较好。
高 mAP + 低 mAR
召回不足,模型漏检率较高,过检误检控制较好。
保存过漏检数据
模型最后一代训练完成后,会对测试集及原有标注进行验证,通过设定标准计算出的评估指标后,输出过漏检数据及混淆矩阵。
过漏检数据
过漏检数据会存在模型路径下,以模型开始训练时间命名的文件夹里。