跳到主要内容

评估参数

评估间隔

模型训练至多少代评估一次。默认一代评估一次

调整评估间隔会影响模型训时长,训练时间会随着评估间隔的增大而缩短,但不会影响模型结果。

alt text

不同评估间隔对比

评估间隔为:1

alt text

评估间隔为:4

alt text

通过周期性评估验证模型在测试集的检出能力,可实时跟踪模型的收敛趋势与泛化能力。不同任务会有不同的指标,包括精确率、准确率、召回率、IoU、混淆矩阵等。

训练 loss 反映模型对训练数据的拟合程度,mAP(Mean Average Precision)与 mAR(Mean Average Recall)是评估模型过检与漏检的核心指标。

mAP与mAR指标

mAP 与 mAR 同步提升

模型精度与召回达到优平衡,整体性能优化。

alt text

低 mAP + 高 mAR

模型过检率或误检率较高,漏检控制较好。

alt text

高 mAP + 低 mAR

召回不足,模型漏检率较高,过检误检控制较好。

保存过漏检数据

模型最后一代训练完成后,会对测试集及原有标注进行验证,通过设定标准计算出的评估指标后,输出过漏检数据及混淆矩阵。

过漏检数据

过漏检数据会存在模型路径下,以模型开始训练时间命名的文件夹里。

alt text

混淆矩阵

alt text