当前位置：网站首页>[0701] [论文阅读] Alleviating Data Imbalance Issue with Perturbed Input During Inference

[0701] [论文阅读] Alleviating Data Imbalance Issue with Perturbed Input During Inference

2022-07-02 17:38:00 【xiongxyowo】

[论文地址] [代码] [MICCAI 21]

Abstract

由于常见疾病和罕见疾病之间的数据不平衡，智能诊断往往偏向于常见疾病。即使在模型训练期间应用了再平衡策略，这种偏见仍然可能存在。为了进一步缓解这种偏见，我们提出了一种新的方法，这种方法不是在训练阶段而是在推理阶段发挥作用。对于任何测试输入数据，基于温度调整后的分类器输出和从不同疾病的反频率中得出的目标概率分布之间的差异，输入数据可以以类似于对抗性学习的方式被轻微扰动。与原始输入相比，对被扰乱的输入的分类器预测将变得不那么偏向常见疾病。所提出的推理阶段方法可以自然地与任何训练阶段的再平衡策略相结合。在三种不同的医学图像分类任务和三种分类器骨干上进行的广泛评估表明，我们的方法能够持续地提高分类器的性能，即使是经过任何再平衡策略的训练。特别是在少数类别上，性能的提高是巨大的，这证实了所提出的方法在缓解分类器对主导类别的偏见方面的有效性。

Method

本文解决的是医学诊断中数据集不均衡的问题，即，罕见病的样本是比较难收集的。具体方法则属于一种基于测试时后处理(Test-Time Postprocessing)的方法，相比于传统的测试前预处理(Training-Time Preprocessing)的方式而言有一定的新颖之处。总体流程如下所示：
在这里插入图片描述
考虑数据集一共包含 $C$ 类训练数据，其中第 $c$ 类的样本数为 $n_c$ 。如果某一类别 $i$ 的样本占主导地位，那么对于任意输入样本 $x$ ，输出的softmax概率 $p$ 也会倾向于预测为类别 $i$ 。那么本文的做法也很简单，在测试时对样本进行扰动，使其softmax输出偏向于少数类。

在样本 $x$ 输入到网络后，可以得到FC层的logit输出向量 $z = [z_1, z_2,...,z_C]^T$ 。最终的分类概率计算还要通过把这个 $z$ 给输入到softmax分类器中。对于softmax而言，其有一个温度系数 $T$ ，正常分类的时候我们是将其设为1的，而在一些任务比如知识蒸馏中，我们会将其设为大于1，从而使得softmax输出更为"平滑"。那么在这里也是一个道理，增大T，使得对于常见类的预测概率压低一些，而不常见类的预测概率提高一些 $\hat{p}_{c}=\frac{\exp \left(z_{c} / T\right)}{\sum_{k=1}^{C} \exp \left(z_{k} / T\right)}$ 当然，仅做到这一步，只能说缩短不同类之间的预测概率差距，并不会直接把"概率第二高的类优化成第一高的类"。而为了实现这一点，本文实现了一个扰动向量： $p_{c}^{*}=\frac{g\left(n_{c}\right)}{\sum_{k=1}^{C} g\left(n_{k}\right)}$ 那么这个玩意的思路其实还是很原始的。其中 $g(n_c) = log(M/n_c)$ ，也就是某个类在训练集中出现的频次越高，那么其 $g(n_c)$ 就越低。现在，我们将 $p_{c}^{*}$ 视为一种真值，那么可以得到 $p_{c}^{*}$ 与原始预测 $p_{c}$ 的差异。基于这一差异，可以推出相应需要加的噪声： $\tilde{\mathbf{x}}=\mathbf{x}-\varepsilon \cdot \operatorname{sign}\left(\nabla \ell\left(\hat{\mathbf{p}}, \mathbf{p}^{*}\right)\right)$ 从而在实际测试阶段实现纠偏的效果。

Experiment

在3个带bias的医学数据集Skin7，OCTMNIST，X-ray6上进行了实验。
对比方法包括传统的class-level re-weighting，focal loss以及比较现代化的two-stage deferred re-sampling，margin-based method LDAM。

原网站

版权声明
本文为[xiongxyowo]所创，转载请带上原文链接，感谢
https://blog.csdn.net/qq_40714949/article/details/125565366