一个二分类下没有免费午餐定理的题

一个证明题

周志华《机器学习》第一章中,有一个关于“没有免费的午餐”定理的题目,题目是这样的:

假设样本空间X\mathcal{X}X和假设空间H\mathcal{H}H都是离散的,令P(h∣X,La)P(h|X,\mathcal{L}_a)P(hX,La)为算法La\mathcal{L}_aLa基于训练数据XXX产生假设hhh的概率,令fff代表真实目标函数。考查二分类问题fff可以是任何函数X↦{ 0,1}\mathcal{X} \mapsto \{0,1\}X{ 0,1},函数空间为{ 0,1}∣X∣\{0,1\}^{\vert \mathcal{X} \vert}{ 0,1}X,假设fff均匀分布(即不管h(x)h(x)h(x)是什么,都有一半的fffxxx的预测与h(x)h(x)h(x)不一致)。现在采用ℓ(h(x),f(x))\ell(h(x),f(x))(h(x),f(x))作为分类器的性能度量,考虑La\mathcal{L}_aLa的“训练集外误差”:
Eote(La∣X,f)=∑h∑x∈X−XP(x)ℓ(h(x),f(x))P(h∣X,La) E_{ote}(\mathcal{L}_a | X,f)=\sum_h \sum_{x\in \mathcal{X}-X} P(x)\ell({h(x),f(x)}) P(h|X, \mathcal{L}_a) Eote(LaX,f)=hxXXP(x)(h(x),f(x))P(hX,La)
试证明“没有免费午餐定理”成立。

分析与解答

题目未给定ℓ(h(x),f(x))\ell(h(x),f(x))(h(x),f(x))的具体形式,但在二分类问题中,无非就4种情况。记ℓ(1,1)=ℓ1\ell(1,1)=\ell_1(1,1)=1ℓ(0,1)=ℓ2\ell(0,1)=\ell_2(0,1)=2ℓ(1,0)=ℓ3\ell(1,0)=\ell_3(1,0)=3ℓ(0,0)=ℓ4\ell(0,0)=\ell_4(0,0)=4,它们都是常数。将La\mathcal{L}_aLa的训练集外误差对所有fff均匀分布求和为:

∑fEote(La∣X,f)=∑f∑h∑x∈X−XP(x)ℓ(h(x),f(x))P(h∣X,La)=∑x∈X−XP(x)∑hP(h∣X,La)∑fℓ(h(x),f(x))=∑x∈X−XP(x)∑hP(h∣X,La)(2∣X∣I(h(x)=1)(12ℓ1+12ℓ3))+∑x∈X−XP(x)∑hP(h∣X,La)(2∣X∣I(h(x)=0)(12ℓ2+12ℓ4)) \begin{aligned} &\sum_f E_{ote}(\mathcal{L}_a | X,f) \\ =& \sum_f \sum_h \sum_{x\in \mathcal{X}-X} P(x)\ell({h(x),f(x)}) P(h|X, \mathcal{L}_a) \\ =& \sum_{x\in \mathcal{X}-X} P(x) \sum_h P(h|X, \mathcal{L}_a) \sum_f \ell({h(x),f(x)})\\ =& \sum_{x\in \mathcal{X}-X} P(x) \sum_h P(h|X, \mathcal{L}_a) \left( 2^{\vert\mathcal{X}\vert}\mathbb{I}(h(x)=1) (\dfrac{1}{2} \ell_1+\dfrac{1}{2} \ell_3) \right)\\ +& \sum_{x\in \mathcal{X}-X} P(x) \sum_h P(h|X, \mathcal{L}_a) \left( 2^{\vert\mathcal{X}\vert}\mathbb{I}(h(x)=0) (\dfrac{1}{2} \ell_2+\dfrac{1}{2} \ell_4) \right)\\ \end{aligned}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值