麦克内马尔检验(McNemar‘s Test)

原创

已于 2022-03-10 20:41:02 修改 · 1.2w 阅读

·

3

·

标签

#概率论 #机器学习 #人工智能

于 2022-03-10 20:18:00 首次发布

麦克内马尔检验是一种用于比较配对名义数据的统计方法，尤其适用于评估机器学习模型的性能差异。它基于2x2列联表，通过计算卡方统计量和p值来判断两个模型的预测效果是否有显著差异。当样本量较小或不适用卡方分布时，可以采用精确的二项检验。在示例中，通过mlxtend库展示了如何在Python中执行麦克内马尔检验，以判断模型之间的性能是否相等。

麦克内马尔检验(McNemar’s Test)

配对标称数据的麦克内马尔检验(McNemar’s Test)

from mlxtend.evaluate import mcnemar

概述

McNemar的检验[1]（有时也称为“受试者内卡方检验”）是对配对名义数据的统计检验。在机器学习中，我们可以使用两种统计模型（NEMAR）来测试机器学习的准确性。麦克内马尔的测试是基于两个模型预测的2倍连续表。

McNemar’s Test Statistic

在麦克内马尔的检验中，我们提出了零假设，即概率 $p (b)$ and $p (c)$ ，或者用简化的术语来说：两个模型中没有一个比另一个更好。因此，另一种假设是，这两种模型的性能并不相同。

在这里插入图片描述

McNemar检验统计量（“卡方”）可计算如下：
$\chi^2 = \frac{(b - c)^2}{(b + c)},$
如果单元格c和b的总和足够大，则 $\chi^2$ 值遵循一个自由度的卡方分布。设置显著性阈值后，例如， $α = 0.05$ 。我们可以计算 $p$ 值——假设零假设为真， $p$ 值是观察这个经验（或更大）卡方值的概率。如果 $p$ 值低于我们选择的显著性水平，我们可以拒绝两个模型性能相等的无效假设。

连续性校正

在Quinn McNemar发表McNemar测试[1]大约一年后，Edwards[2]提出了一个连续性修正版本，这是当今更常用的变体：
<

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

或许，这就是梦想吧！ 如果对你有用，欢迎打赏。

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。