深度神经网络(DNNs)在训练过程中容易受到标签噪声的影响,这会降低其泛化性能。医学图像的标注依赖于标注者的专业知识和经验,从而不可避免地引入了标签噪声。因此,本研究创新性地设计了一种对抗标签噪声的训练方法,同时突破了传统标签修正方法依赖于噪声比例的先验信息的局限。具体来说,本研究将自监督中的对比学习和注意力图像融合策略融入到传统的监督学习过程中。对比学习有助于增强DNNs在特征提取过程中的视觉表征能力,而注意力图像融合策略通过加权图像融合操作,构造出大量在一定程度上能抑制噪声的融合样本。相关研究论文《Suppressing label noise in medical image classification using mixup attention and self-supervised learning》最近发表在国际学术期刊《Physics in Medicine and Biology》上。
图1. 本研究提出的对抗噪声标签方法的示意图。除了传统的监督损失模块,本研究创新性地融入了对比学习模块和注意力特征融合模块。对比学习模块可以更好地学习图像特征的表达,注意力特征融合模块旨在降低噪声标签图像对模型参数更新的影响
我们提出了一个具备对标签噪声鲁棒性的训练框架,如图1所示。具体地,为了降低由标签错误样本导致的梯度传播误差,本研究结合了对比学习和注意力图像融合策略。首先,对比学习可以在不依赖图像标签的情况下进行,这使得所有训练样本都可以被充分利用,且不受标签错误样本的影响。同时,我们设计了一种注意力图像融合策略,通过动态降低噪声样本的权重,生成相对“干净”的图像特征,以用于后续的分类。与采用两个独立网络的协同训练方法相比,我们的方法采用了一个共享的特征编码器,并增加了三个独立的支路网络,分别是分类器(C(⋅))、投影网络(H(⋅))和图像融合支路分类器(M(⋅))。值得一提的是,本研究提出的方法易于实现,并且不需要如标签噪声比例、训练集数据分布或额外的准确标签数据集等先验知识。
本研究针对三个多分类医学数据库:眼科OCT数据库、血细胞数据库和结肠病理学数据库,进行了一系列对比实验。这些实验统一使用了实例相关性标签噪声(包括均匀和非均匀标签噪声)以及实例无关性标签噪声模型,并涵盖了从低噪声比例(10%)到高噪声比例(40%)的范围。
图2. 基于眼科OCT数据库,在四个噪声比例下的噪声标签学习方法ROC曲线的对比,训练集噪声比例分别为:(a)10%;(b)20%;(c)30%;(d)40%
首先,本研究针对眼科OCT数据库进行了二分类实验。在二分类任务中,非均匀噪声退化为均匀噪声模型。图2展示了基于眼科OCT数据集,在各个噪声比例下的ROC曲线对比,并补充了对应的AUC值。可以看出,在噪声比例为30%时,本研究提出的方法具有识别正常和异常眼科OCT图像的最佳能力,其AUC达到了95.81%,比次优的Co-teaching+方法高出2.47%。
表1. 基于血细胞数据库,在均匀噪声比例下的噪声标签学习方法测试准确率的对比
在血细胞数据库中,本研究通过将每个类别的标签按照噪声比例翻转到相近的类别,产生了非均匀噪声标签,并进行了实例无关性和实例相关性的噪声标签实验。表1示例列出了基于均匀噪声在不同噪声比例下的实验结果。可以观察到,本研究提出的方法在所有情况下均获得了最佳的分类结果,尤其是在高噪声比例时更为明显。即便在噪声比例高达40%的情况下,本方法的表现也远超默认方法,并且比次优的JoCoR方法高出4.94%。在低噪声比例(10%)下,本研究提出的方法仍展现出竞争力,获得了次优的分类性能。与眼科OCT数据库上的二分类任务相比,当处理该数据库上的多类分类任务时,抗噪声训练方法的性能虽随噪声比例增加而逐渐降低,但衰减趋势较为缓慢,这在均匀噪声环境下尤为明显。本研究推测,当不同噪声比例的噪声标签被分布到多个类别时,影响到准确类别的主导地位的可能性几乎不存在
图3. 基于结肠病理学数据库,在30%的非均匀标签噪声下,Default方法(a)、Co-Correcting方法(b)及本研究方法(c),在测试集合上得出的混淆矩阵的对比。
在针对结肠病理学数据库的10类分类任务中,本研究根据前述模式生成了实例相关性和实例无关性的噪声标签,并在这些标签噪声条件下进行了实验。图3示例显示出在非均匀噪声条件下(比例均为30%),我们提出的方法与默认方法以及Co-Correcting方法在结肠病理图像分类的测试混淆矩阵结果进行比较。可以观察到,我们方法的混淆矩阵在对角线条目中均显示最大值,这表明它比其他对比方法更为优越,有助于在每个类别中推导出更准确的预测标签。尽管处于相对较高的噪声比例(30%)环境中,我们的方法仍能在各个类别上均衡提升分类模型的泛化性能。
此外,作者分别基于眼科OCT数据库、血细胞数据库和结肠病理学数据库,比较了三种代表性方法的分类特征的t-SNE可视化,包括默认方法、Co-teaching方法和本研究提出的方法,对比结果如图4所示。具体来说,在测试过程中,从训练好的模型的最后一个卷积层中提取测试图像的特征向量,并通过t-SNE进行可视化。结果表明,本研究提出方法的特征空间比另外两种对比方法实现了更好的聚类效果,特别是在血细胞数据库上。总的来说,本研究提出方法有助于优化具有高内聚和低耦合的特征空间,从而降低标签噪声的影响,提高分类性能。
图4. 基于30%的均匀噪声模型,对比三种典型噪声标签学习方法分类特征的t-SNE可视化。
MILab已毕业博士博士高孟娣和南方科技大学姜泓羊博士是本文的共同第一作者,谢肇恒助理教授和南方科技大学的刘江教授为本文的共同通讯作者。其他合作者包括北京大学的任秋实教授等。该研究获得了国家自然科学基金(编号62394311、62394310)和深圳市自然科学基金(编号JCYJ20200109140820699)等项目的支持。
文章链接:https://iopscience.iop.org/article/10.1088/1361-6560/ad4083/meta
添加评论