方法来源
Mixup是2018年发表在ICLR上的一种数据增强方法,它通过将多组不同数据集的样本进行线性组合,生成新的样本,从而扩充数据集。
核心思想是从每个batch中随机选择两张图像,并以一定比例混合生成新的图像,新图像的标签也是进行线性组合得到的。
需要注意的是,全部训练过程都只采用混合的新图像训练,原始图像不参与训练过程。
Mixup是发源于CV领域的一种数据增强技术,发展到现在不仅在CV领域,在NLP、时间序列预测等领域都有其踪影,是一种提分神器。
Mixup也可以增加数据集的多样性,从而降低模型的方差,提高模型的鲁棒性。
paper:mixup: Beyond Empirical Risk Minimization

存在问题:大型深度神经网络功能强大,但表现出不良行为,如对记忆和对抗性实例的敏感性。
Mixup是一种简单有效的数据增强方法(学习原则),能够缓解这些问题。
Mixup核心公式

其中 x i x_i xi


1595

被折叠的 条评论
为什么被折叠?



