评估参数

评估间隔

模型训练至多少代评估一次。默认一代评估一次

调整评估间隔会影响模型训时长，训练时间会随着评估间隔的增大而缩短，但不会影响模型结果。

alt text

评估间隔为：1

alt text

评估间隔为：4

alt text

通过周期性评估验证模型在测试集的检出能力，可实时跟踪模型的收敛趋势与泛化能力。不同任务会有不同的指标，包括精确率、准确率、召回率、IoU、混淆矩阵等。

训练 loss 反映模型对训练数据的拟合程度，mAP（Mean Average Precision）与 mAR（Mean Average Recall）是评估模型过检与漏检的核心指标。

mAP 与 mAR 同步提升

模型精度与召回达到优平衡，整体性能优化。

alt text

低 mAP + 高 mAR

模型过检率或误检率较高，漏检控制较好。

alt text

高 mAP + 低 mAR

召回不足，模型漏检率较高，过检误检控制较好。

模型最后一代训练完成后，会对测试集及原有标注进行验证，通过设定标准计算出的评估指标后，输出过漏检数据及混淆矩阵。

过漏检数据会存在模型路径下，以模型开始训练时间命名的文件夹里。

alt text

alt text