[论文]FixMatch: Simplifying Semi-Supervised Learning with Consistency and Confidence

2020年1月21日于Arxiv公开，https://arxiv.org/abs/2001.07685

FixMatch整合了一致性正则化与伪标签两种方法。文中将数据增强分为弱增强和强增强，弱增强为标准的平移与翻转，强增强为RandAugment或CTAugment，之后接Cutout。FixMatch的流程如下：首先，将未标记图像的弱增强版本输入模型中以获得预测值。预测值高于某个阈值时，预测值将会转换为one-hot伪标记。然后，将对同一张图片的强增强版本计算输入模型获得预测。通过标准的交叉熵损失，使其在强增强版本上的预测与伪标记匹配。

为了测试FixMatch局限性，在CIFAR-10上每类只用一个样例用于训练，发现选择不同的样例最终的准确率会有较大差异，所以设想样例的质量可能会影响模型对数据的学习，进一步的实验也证明如此。

总结：FixMatch是一个比较简单的半监督学习算法，在许多数据集中达到了SOTA，并在极低标签（每类一个）获得较高精度（78%）。同时权重衰减和优化器的选择也较为重要。

其他介绍： https://zhen8838.github.io/2020/02/06/ssl-fixmatch/