[论文]Semi-supervised Audio Classification with Consistency-Based Regularization
发表于2019 Interspeech。 将半监督方法Mean Teacher用于Google Speech Commands和UrbanSound8Ku数据集,其关键在于对音频数据的扰动,包括时间和频率转换、高斯噪声、环境噪声和Mixup,所用的音频数据均被转换为频谱图图像。环境噪声和Mixup两种方法是独立添加的,为防止互相影响。实验结果显示Mixup的效果要好于添加环境噪声。 ...