2020年1月21日于Arxiv公开,https://arxiv.org/abs/2001.07685

FixMatch整合了一致性正则化与伪标签两种方法。文中将数据增强分为弱增强和强增强,弱增强为标准的平移与翻转,强增强为RandAugment或CTAugment,之后接Cutout。FixMatch的流程如下:首先,将未标记图像的弱增强版本输入模型中以获得预测值。预测值高于某个阈值时,预测值将会转换为one-hot伪标记。然后,将对同一张图片的强增强版本计算输入模型获得预测。通过标准的交叉熵损失,使其在强增强版本上的预测与伪标记匹配。

为了测试FixMatch局限性,在CIFAR-10上每类只用一个样例用于训练,发现选择不同的样例最终的准确率会有较大差异,所以设想样例的质量可能会影响模型对数据的学习,进一步的实验也证明如此。

总结:FixMatch是一个比较简单的半监督学习算法,在许多数据集中达到了SOTA,并在极低标签(每类一个)获得较高精度(78%)。同时权重衰减和优化器的选择也较为重要。

其他介绍: https://zhen8838.github.io/2020/02/06/ssl-fixmatch/