当前位置:网站首页>自监督论文阅读笔记 Incremental-DETR:Incremental Few-Shot Object Detection via Self-Supervised Learning
自监督论文阅读笔记 Incremental-DETR:Incremental Few-Shot Object Detection via Self-Supervised Learning
2022-08-03 05:23:00 【YoooooL_】


![]()
上一步中匹配的所有对的Hungarian Loss 定义为:

其中
表示预测和目标之间的最佳分配。Lcls是sigmoid Focal Loss ,Lbox是l1 loss和广义IoU loss的线性组合,具有与DETR相同的权重超参数。

为了使DETR的 类特定组件 的参数 在增量少样本微调阶段 能够很好地推广到具有少量样本的新类,本文以自监督的方式 微调类特定组件,同时在第一阶段的基础模型微调中 保持类未知组件冻结,其中,模型的参数用 预训练的基础模型 初始化。
基础模型微调 依赖于 对基础数据的其他潜在类未知对象 以及基础类的真值对象进行预测。本文使用 选择性搜索算法 为每个原始图像生成一组 类别未知的目标候选框。
选择性搜索是一种成熟且非常有效的无监督目标候选框生成算法,它利用颜色相似度、纹理相似度、区域大小和区域间的匹配度来生成目标候选框。然而,目标候选框的数量很大,排名也不准确。为了避免这个问题,我们使用选择性搜索算法中的目标排序 来删除不精确的目标候选框。
具体来说,选择排名列表中 与基类的真值目标不重叠的前O个对象 作为伪真值目标候选框。

![]()

如图2所示,首先用 第一阶段微调的基础模型 初始化 新模型的参数。然后,在冻结类未知组件的时候,使用一些新类的样本来 微调 类特定的投影层和分类头。然而,在新类学习过程中,投影层和分类头的不断更新会加剧基类的灾难性遗忘。
因此,本文使用 知识蒸馏 来缓解灾难性遗忘。具体而言,基础模型 用于防止新模型的投影层输出特征 与 基础模型的投影层输出特征 偏离太多。然而,在全部的特征映射上 直接 知识蒸馏 会影响性能。本文使用 新类的 真值边界框 作为二进制掩码,以防止 基础模型的特征 对 新类的学习产生负面影响。

对于DETR 分类头 上的知识蒸馏,首先 从基本模型的M个预测输出中 选择预测输出作为基本类的伪真值。
对于输入的新图像,当其类概率大于0.5且其边界框与新类的真值边界框没有重叠时,我们将基础模型的预测输出 视为基础类的伪真值。然后,采用KL散度损失
![]()
![]()
Conclusion:
本文提出了一种新的增量少样本目标检测框架:针对更具挑战性和现实性的场景,没有来自基类的样本,只有来自新类的少量样本。本文使用 两阶段微调策略 和 自监督学习来保留基类的知识,并学习更好的泛化表示。然后,利用 知识蒸馏策略,使用新类中的少量样本,将知识从基础转移到新模型。在基准数据集上的大量实验结果表明了该方法的有效性。
边栏推荐
猜你喜欢

Gradle插件与代理服务器导致Sync Project失败的问题

Browser multi-threaded off-screen rendering, compression and packaging scheme

动态调整web主题(2) 萃取篇

边缘辅助无人机网络的分层联邦学习

MySql 怎么查出符合条件的最新的数据行?

Let small program development into ` tailwind jit ` era

用iPhone前摄3D人像建模,Meta:我看行

解决Gradle Download缓慢的百种方法

MySQL 下载和安装详解

【HQL】(二) 查询使用正则表达式做列选择
随机推荐
寄存器常见指令
【 command execution and middleware loopholes 】
【DC-4靶场渗透】
边缘辅助无人机网络的分层联邦学习
Delightful Nuxt3 Tutorial (1): Application Creation and Configuration
block底层探索
Browser multi-threaded off-screen rendering, compression and packaging scheme
Android学习 | 08.SQLiteOpenHelper
进程间通讯 (IPC 技术) - 信号
速来围观,17个运维实用技巧
spark sql 报错 Can‘t zip RDDs with unequal numbers of partitions
解决Gradle Download缓慢的百种方法
IO 复用
【IDEA】字体修改-护眼主题-文件注释头设置
中国生活垃圾处理行业十四五规划与投融资模式分析报告2022~2028年
BeanFactory和FactoryBean的区别
自监督论文阅读笔记Efficient Self-supervised Vision Pretraining with Local Masked Reconstruction
中国石油行业并购重组趋势与投资战略规划建议报告2022~2028年
中国磷化铟晶圆行业发展前景与投资规划分析报告2022~2028年
Kotlin 中的泛型介绍