在二分类问题中,我们常用准确率(precision)和召回率(recall)来进行评价。实际上,许多问题都可以转变为二分类问题。对于这其中的一些概念,之前都是死记硬背,今天在看目标检测的评价指标时突然有一点理解,赶快写下来。
References:
参考文献:
[1]统计学习方法(第2版)
4种情况
通常我们把关注的类称为正类,其它类称为负类。而分类器在测试数据集上的预测可能是正确的也可能是不正确的。由此就出现了四种情况。
TP:True Positive(真的正类),即把正类预测为正类的个数。
FN:False Negative(假的负类),即把正类预测为负类的个数。
FP:False Positive,即把负类预测为正类的个数。
TN:True Negative,即把负类预测为负类的个数。一般不关注这一项。
准确率和召回率
由此我们可定义准确率为$P=\frac{TP}{TP+FP}$。
定义召回率为$R=\frac{TP}{TP+FN}$。
此外,还定义了$F_{1}$为准确率和召回率的调和均值,即$\frac{2}{F_{1}}=\frac{1}{P}+\frac{1}{R}$。可变换定义式求得$F_{1}$值。易得,当准确率和召回率都高时,$F_{1}$也会高。
我们可以结合下图来直观地理解一下。
结合上图和准确率与召回率地定义,由于一般在问题中我们只对我们预测的正类做标注,因此我觉得可以这样理解准确率和召回率:
准确率:预测出的结果中,有多少是正确的。
召回率:所有属于正类的目标中,有多少被正确地预测出来了。