【数据增强】Mixup

原创

已于 2024-11-01 09:12:52 修改 · 1.6k 阅读

标签

#算法 #数据增强 #学习策略

收录于

于 2024-10-31 16:16:09 首次发布

方法来源

Mixup是2018年发表在ICLR上的一种数据增强方法，它通过将多组不同数据集的样本进行线性组合，生成新的样本，从而扩充数据集。
核心思想是从每个batch中随机选择两张图像，并以一定比例混合生成新的图像，新图像的标签也是进行线性组合得到的。
需要注意的是，全部训练过程都只采用混合的新图像训练，原始图像不参与训练过程。
Mixup是发源于CV领域的一种数据增强技术，发展到现在不仅在CV领域，在NLP、时间序列预测等领域都有其踪影，是一种提分神器。
Mixup也可以增加数据集的多样性，从而降低模型的方差，提高模型的鲁棒性。

paper：mixup: Beyond Empirical Risk Minimization
在这里插入图片描述