在基于深度神经网络开展医学图像分类任务中,能够使用高质量标签训练数据对于学习效果至关重要,因为训练数据中存在错误标签(噪声标签)会大大降低干净测试数据上模型的准确性。一方面,若想训练更好的深度网络,大数据或海量数据是必要的。而另一方面,深度网络往往会记住噪声标签的训练数据,从而导致模型在实践中性能较差。图1验证了噪声标签对深度学习模型性能的不利影响,而且随着噪声比例的增大,训练出的分类模型的性能越差。因此,为了降低医学图像分类任务噪声标签的影响,MILab提出一种基于贝叶斯统计理论的图像标签修正的方法,相关研究论文《Bayesian Statistics Guided Label Refurbishment Mechanism: Mitigating Label Noise in Medical Image Classification》于近期发表在国际学术期刊Medical Physics。

图1. 基于噪声标签的OCT图像分类。(噪声比例从10%到40%以及不含噪声的情形)
添加评论