深度神经网络(DNNs)在训练过程中容易受到标签噪声的影响,这会降低其泛化性能。医学图像的标注依赖于标注者的专业知识和经验,从而不可避免地引入了标签噪声。因此,本研究创新性地设计了一种对抗标签噪声的训练方法,同时突破了传统标签修正方法依赖于噪声比例的先验信息的局限。具体来说,本研究将自监督中的对比学习和注意力图像融合策略融入到传统的监督学习过程中。对比学习有助于增强DNNs在特征提取过程中的视觉表征能力,而注意力图像融合策略通过加权图像融合操作,构造出大量在一定程度上能抑制噪声的融合样本。有关的研究论文《Suppressing label noise in medical image classification using mixup attention and self-supervised learning》最近发表在国际学术期刊《Physics in Medicine and Biology》上。
图1. 本研究提出的对抗噪声标签方法的示意图。除了传统的监督损失模块,本研究创新性地融入了对比学习模块和注意力特征融合模块。对比学习模块可以更好地学习图像特征的表达,注意力特征融合模块旨在降低噪声标签图像对模型参数更新的影响
...
本研究针对三个多分类医学数据库:眼科OCT数据库、血细胞数据库和结肠病理学数据库,进行了一系列对比实验。这些实验统一使用了实例相关性标签噪声(包括均匀和非均匀标签噪声)以及实例无关性标签噪声模型,并涵盖了从低噪声比例(10%)到高噪声比例(40%)的范围。
图2. 基于眼科OCT数据库,在四个噪声比例下的噪声标签学习方法ROC曲线的对比,训练集噪声比例分别为:(a)10%;(b)20%;(c)30%;(d)40%
...
表1. 基于血细胞数据库,在均匀噪声比例下的噪声标签学习方法测试准确率的对比
在血细胞数据库中,本研究通过将每个类别的标签按照噪声比例翻转到相近的类别,产生了非均匀噪声标签,并进行了实例无关性和实例相关性的噪声标签实验。表1示例列出了基于均匀噪声在不同噪声比例下的实验结果。可以观察到,本研究提出的方法在所有情况下均获得了最佳的分类结果,尤其是在高噪声比例时更为明显。即便在噪声比例高达40%的情况下,本方法的表现也远超默认方法,并且比次优的JoCoR方法高出4.94%。在低噪声比例(10%)下,本研究提出的方法仍展现出竞争力,获得了次优的分类性能。与眼科OCT数据库上的二分类任务相比,当处理该数据库上的多类分类任务时,抗噪声训练方法的性能虽随噪声比例增加而逐渐降低,但衰减趋势较为缓慢,这在均匀噪声环境下尤为明显。本研究推测,当不同噪声比例的噪声标签被分布到多个类别时,影响到准确类别的主导地位的可能性几乎不存在。
图3. 基于结肠病理学数据库,在30%的非均匀标签噪声下,Default方法(a)、Co-Correcting方法(b)及本研究方法(c),在测试集合上得出的混淆矩阵的对比。
...