1. Fβ-score 概述
Fβ-score 是一种综合考量精确率(precision)和召回率(recall)的分类评估指标。其公式为:
1.1 Precision(精确率):预测为正类的样本中,实际为正类的比例。
- True Positives (TP):模型正确预测为正类的样本数量。
- False Positives (FP):模型错误预测为正类,但实际是负类的样本数量。
精确率关注的是:当模型预测一个样本为正类时,它有多大概率是对的。所以,它表示我们预测出的正类中,实际正类的比例。高精确率意味着模型的正类预测很可靠,误报(即将负类预测为正类的情况)较少。
1.2 Recall(召回率):所有实际为正类的样本中,成功被预测为正类的比例。
- True Positives (TP):模型正确预测为正类的样本数量。
- False Negatives (FN):模型错误预测为负类,但实际是正类的样本数量。
召回率关注的是:模型能在所有实际正类样本中找出多少来。因此,召回率强调的是模型在正类中的漏判情况,表示有多少正类样本被成功识别出来。高召回率意味着模型能找到大多数的正类样本。
两者的使用取决于具体的任务需求。例如:
- 如果你在做垃圾邮件过滤,需要确保非垃圾邮件(负类)不会被误判为垃圾邮件(正类),那么你可能更关注 精确率。
- 如果你在做疾病筛查,更希望模型能检测出所有的患病患者(正类),即使这会带来更多的误报,你会更关注 召回率。
2. Fβ-score 的 β 参数
- β 是控制 precision 和 recall 之间相对重要性的参数。
- 如果 β = 1,则 precision 和 recall 的权重是相等的,计算的就是我们常见的 F1-score。
- 如果 β > 1,则更关注 recall,这意味着在指标中召回率的重要性更高。
- 如果 β < 1,则更注重 precision,精确率在指标中的重要性更大。