machine learning笔记:准确率和召回率

在二分类问题中,我们常用准确率(precision)和召回率(recall)来进行评价。实际上,许多问题都可以转变为二分类问题。对于这其中的一些概念,之前都是死记硬背,今天在看目标检测的评价指标时突然有一点理解,赶快写下来。

References

参考文献:
[1]统计学习方法(第2版)


4种情况

通常我们把关注的类称为正类,其它类称为负类。而分类器在测试数据集上的预测可能是正确的也可能是不正确的。由此就出现了四种情况。
TP:True Positive(真的正类),即把正类预测为正类的个数。
FN:False Negative(假的负类),即把正类预测为负类的个数。
FP:False Positive,即把负类预测为正类的个数。
TN:True Negative,即把负类预测为负类的个数。一般不关注这一项。


准确率和召回率

由此我们可定义准确率为$P=\frac{TP}{TP+FP}$。
定义召回率为$R=\frac{TP}{TP+FN}$。
此外,还定义了$F_{1}$为准确率和召回率的调和均值,即$\frac{2}{F_{1}}=\frac{1}{P}+\frac{1}{R}$。可变换定义式求得$F_{1}$值。易得,当准确率和召回率都高时,$F_{1}$也会高。
我们可以结合下图来直观地理解一下。

结合上图和准确率与召回率地定义,由于一般在问题中我们只对我们预测的正类做标注,因此我觉得可以这样理解准确率和召回率:
准确率:预测出的结果中,有多少是正确的。
召回率:所有属于正类的目标中,有多少被正确地预测出来了。


碰到底线咯 后面没有啦

本文标题:machine learning笔记:准确率和召回率

文章作者:高深远

发布时间:2020年01月30日 - 12:18

最后更新:2020年01月30日 - 14:00

原始链接:https://gsy00517.github.io/machine-learning20200130121842/

许可协议: 署名-非商业性使用-禁止演绎 4.0 国际 转载请保留原文链接及作者。

0%