Interpretable Medical Image Classification Using Prototype Learning and Privileged Information
摘要
.可解释性通常是医学成像的基本要求。需要先进的深度学习方法来满足这种对可解释性和高性能的需求。
本文研究了训练过程中可用的其他信息是否可用于创建易于理解且强大的模型。
提出了一种名为Proto-Caps的创新解决方案,该解决方案利用了胶囊网络、原型学习和特权信息使用的优势。
代码地址
本文方法
骨干是一个由三层组成的胶囊网络:大小为 1×32×32 的输入图像的特征由包含 256 个大小为 9×9 的内核的 2D 卷积层提取。
然后,初级胶囊层将低级特征分离成 8 个不同的胶囊,每个胶囊应用 256 个大小为 9 × 9 的内核。最终的密集胶囊层由每个属性的一个胶囊组成,并提取高级特征,总共产生八个 16 维向量。这些向量构成了不同预测分支的起点。
目标头是一个完全连接的层,结合了胶囊编码。其中放射科医生恶性肿瘤注释的分布使用Kullback-Leibler散度Lmal进行优化,以反映观察者之间的一致性,从而反映不确定性。用于预测结节分割掩模的重建分支由一个简单的解码器组成,该解码器具有三个全连接层,其输出滤波器为512、1024,以及所得图像1×32×32的大小。重建损失 Lrecon 实现了输出和二进制分割掩码之间的均方误差。研究表明,结合重建学习对表现有益
每个可能的属性类学习两个原型,导致每个属性(即胶囊)有 8-12 个原型。在训练过程中,组合损失函数鼓励训练样本接近正确属性类的原型,而远离专用于其他属性类的原型。随机初始化的原型是训练后每个属性的训练数据集的代表性子集。为此,聚类成本将样本的胶囊向量 Oa 的欧几里得距离减小到最接近的 Pas 群原型向量 pj 的距离,该原型向量 pj 专用于其正确的属性
实验结果