分类器评估指标详解
在机器学习领域,准确评估分类器的性能至关重要。本文将详细介绍几种常用的分类器评估指标,包括精确率 - 召回率曲线、累积响应曲线和提升曲线,并通过实例展示如何运用这些指标来评估不同分类器的性能。
1. 精确率 - 召回率曲线(Precision - Recall Curves)
精确率和召回率是评估分类器性能的两个重要指标。精确率指的是正预测的价值,即预测为正例的样本中实际为正例的比例;召回率则衡量了对实际正例的识别能力,即实际为正例的样本中被正确预测为正例的比例。可以用“精确率对应正预测,召回率对应正现实”来记忆。
1.1 精确率 - 召回率权衡
精确率 - 召回率曲线与灵敏度 - 特异度曲线有一个重要区别。在灵敏度 - 特异度曲线中,两个值代表行总和的部分,权衡的是对现实世界中正例和负例的性能。而在精确率 - 召回率曲线中,我们处理的是混淆矩阵中的列部分和行部分,它们可以更独立地变化。更重要的是,精确率的增加并不意味着召回率的增加。
以下是一个具体的例子:
初始状态下,精确率为 5/10,召回率为 5/10:
| | PredP | PredN |
| — | — | — |
| RealP | 5 | 5 |
| RealN | 5 | 5 |
当提高将样本分类为正例的阈值时,假设每个预测为正例的样本中有两个(两个实际为正例和两个预测为正例但实际为负例)移动到预测为负例:
| | PredP | PredN |
| — | — | — |
| RealP | 3 | 7 |
| RealN | 3 | 7
超级会员免费看
订阅专栏 解锁全文

9718

被折叠的 条评论
为什么被折叠?



