当前位置：网站首页>CVPR2022 | 可精简域适应

CVPR2022 | 可精简域适应

2022-06-24 14:29:00 【科技新语】

背景

深度神经网络通常对离线采集的图像（标记的源数据）进行训练，然后嵌入到边缘设备中，以测试从新场景中采集的图像（未标记的目标数据）。在实践中，这种模式由于域转移而降低了网络性能。近年来，越来越多的研究者对无监督领域适应（UDA）进行了深入研究，以解决这一问题。

Vanilla UDA旨在将源数据和目标数据对齐到联合表示空间中，以便根据源数据训练的模型可以很好地推广到目标数据。但是，学术研究与工业需求之间仍然存在差距：大多数现有的UDA方法仅使用固定的神经结构进行权重自适应，但无法有效地满足现实世界应用中各种设备的要求。

以图1所示的广泛使用的应用场景为例，在这种情况下，普通UDA方法必须反复训练一系列具有不同容量和体系结构的模型，以满足具有不同计算预算的设备的需求，这既昂贵又耗时。

为了解决上述问题，作者提出了Slimmable Domain Adaption（SlimDA），即只对模型进行一次训练，这样就可以灵活地从中抽取具有不同容量和体系结构的定制模型，以满足不同计算预算的设备的需求。

图1 SlimDA

当纤细的神经网络满足无监督领域自适应时，仍然存在两个挑战：

1）权重自适应：如何同时提高模型库中所有模型的自适应性能。

2）架构适应：给定特定的计算预算，如何在未标记的目标数据上搜索适当的模型。

对于第一个挑战，作者提出了随机集成蒸馏（SEED）来交互模型库中的模型，以抑制模型内自适应对未标记目标数据的不确定性。表1显示了SEED和传统知识蒸馏之间的差异。

表1 传统知识蒸馏（CKD）与随机集成蒸馏（SEED）

对于第二个挑战，作者提出了一种无监督的绩效评估指标，可以缓解候选模型和锚模型之间的输出差异。度量值越小，假设性能越好。

贡献

1.提出了SlimDA，一个“一劳永逸”的框架，以共同适应资源有限设备的适应性能和计算预算。

2.提出了SEED，能够同时提高模型库中所有模型的适应性能。

3.设计了一个优化分离的三分类器来调节模型内适应和模型间交互之间的优化。

4.提出了一种无监督的性能评估指标，以促进架构适应。

方法

1. SlimDA框架

在可精简的神经网络中已经证明，具有不同宽度（即层通道）的众多网络可以耦合到权重共享模型库中，并同时进行优化。从一个基线开始，在此基线中，SymNet直接与纤细的神经网络合并。

为了简单起见，SymNet的总体目标统一为Ldc。在每次训练迭代中，可以从模型库{（Fj，Csj，Ctj）}mj=1中随机抽样几个模型∈（F，Cs，Ct），命名为模型批次，其中m表示模型批次大小。此处（F、Cs、Ct）可被视为最大模型，其余模型可通过权重共享的方式从中采样。

为了确保模型库能够得到充分的训练，应在每次训练迭代中对最大和最小的模型进行采样，并将其构成模型批的一部分。

该基线可被视为Eqn的两个交替过程。为了鼓励上述基线中的模型间交互，作者提出了SlimDA框架，如图2所示。该框架由随机集成蒸馏（SEED）和优化分离三分类器（OSTC）设计组成。

SEED旨在利用模型库中的互补知识进行多模型交互。Cs和Ct分类器上的红色箭头表示领域混淆训练Ldc和模型库中的知识聚合。Ca分类器上的紫色箭头表示种子优化Lseed。

图2 SlimDA框架

2. 随机集成蒸馏（SEED）

SEED旨在利用模型库中的互补知识进行多模型交互。模型库中的不同模型可以直观地学习有关未标记目标数据的补充知识。受带有模型扰动的贝叶斯学习的启发，作者通过蒙特卡罗采样利用模型库中的模型来抑制未标记目标数据的不确定性。

模型置信度定义：

锐化函数以诱导种子训练期间的隐式熵最小化：

3. 优化分离三分类器（OSTC）

其中前两个用于域混淆训练，最后一个用于接收随机聚合的知识以进行蒸馏。蒸馏损失公式如下：

4. 无监督性能评估指标

无监督绩效评估指标（UPEM）：

原网站

版权声明
本文为[科技新语]所创，转载请带上原文链接，感谢
https://cloud.tencent.com/developer/article/2029127

当前位置：网站首页>CVPR2022 | 可精简域适应

CVPR2022 | 可精简域适应

背景

贡献

相关方法

1.无监督域自适应（UDA）

2. 神经架构搜索（NAS）

3.跨域网络压缩

方法

1. SlimDA框架

3. 优化分离三分类器（OSTC）

4. 无监督性能评估指标

边栏推荐

猜你喜欢

随机推荐