场景解释:
二分类场景会有两种输出。我的样本里有猫的图片和其他的图片。我的输出值是“是猫”和“非猫”。这个场景下,“是猫”是我的正样本(Postive)。“非猫”是我的负样本(Negative)。
Confusion matrix:
横向表示预测的结果。纵向表示真实的结果。
Postive和Negative用来表示预测的结果。预测“是猫”,则Positive。预测为“非猫”,则negative.
Ture和False用来表示预测正确与否。预测值与真实值一致则为True,不一致为False。
所以可以看到斜对角的Ture与False值是一致的。竖向同一列的Postive与Negative值是一致的。
所以四个格子的意思也很好理解:
TP:预测是猫,实际是猫
FP:预测是猫,其实非猫
FN:预测非猫,其实是猫
TN,预测非猫,实际非猫
Recall和Precision
Recall=TP/(TP+FN)。这个值叫查全率。目的是看有没有把所有真正的P都找出来。
Precision= TP/(TP+FP)。这个值是精确度,目的是看预测出来的P里有多少是正确预测的。
F1 score是Recall和Precision的综合分数。
注重Recall场景:
遗漏正样本的风险很大。比如正样本是猫,负样本是石头,我们识别猫,是为了把它们拎出来。剩下的石头要被打碎。所以不可以遗漏任何一只正样本。
注重Precision的场景:
把负样本当成正样本的风险很大。比如正样本是没绝育的猫,负样本是绝育的猫。把负样本当成正样本会造成猫被二次绝育。不能这样干,