当前位置:网站首页>自监督论文阅读笔记 Incremental-DETR:Incremental Few-Shot Object Detection via Self-Supervised Learning
自监督论文阅读笔记 Incremental-DETR:Incremental Few-Shot Object Detection via Self-Supervised Learning
2022-08-03 05:23:00 【YoooooL_】
上一步中匹配的所有对的Hungarian Loss 定义为:
其中表示预测和目标之间的最佳分配。Lcls是sigmoid Focal Loss ,Lbox是l1 loss和广义IoU loss的线性组合,具有与DETR相同的权重超参数。
为了使DETR的 类特定组件 的参数 在增量少样本微调阶段 能够很好地推广到具有少量样本的新类,本文以自监督的方式 微调类特定组件,同时在第一阶段的基础模型微调中 保持类未知组件冻结,其中,模型的参数用 预训练的基础模型 初始化。
基础模型微调 依赖于 对基础数据的其他潜在类未知对象 以及基础类的真值对象进行预测。本文使用 选择性搜索算法 为每个原始图像生成一组 类别未知的目标候选框。
选择性搜索是一种成熟且非常有效的无监督目标候选框生成算法,它利用颜色相似度、纹理相似度、区域大小和区域间的匹配度来生成目标候选框。然而,目标候选框的数量很大,排名也不准确。为了避免这个问题,我们使用选择性搜索算法中的目标排序 来删除不精确的目标候选框。
具体来说,选择排名列表中 与基类的真值目标不重叠的前O个对象 作为伪真值目标候选框。
如图2所示,首先用 第一阶段微调的基础模型 初始化 新模型的参数。然后,在冻结类未知组件的时候,使用一些新类的样本来 微调 类特定的投影层和分类头。然而,在新类学习过程中,投影层和分类头的不断更新会加剧基类的灾难性遗忘。
因此,本文使用 知识蒸馏 来缓解灾难性遗忘。具体而言,基础模型 用于防止新模型的投影层输出特征 与 基础模型的投影层输出特征 偏离太多。然而,在全部的特征映射上 直接 知识蒸馏 会影响性能。本文使用 新类的 真值边界框 作为二进制掩码,以防止 基础模型的特征 对 新类的学习产生负面影响。
对于DETR 分类头 上的知识蒸馏,首先 从基本模型的M个预测输出中 选择预测输出作为基本类的伪真值。
对于输入的新图像,当其类概率大于0.5且其边界框与新类的真值边界框没有重叠时,我们将基础模型的预测输出 视为基础类的伪真值。然后,采用KL散度损失
Conclusion:
本文提出了一种新的增量少样本目标检测框架:针对更具挑战性和现实性的场景,没有来自基类的样本,只有来自新类的少量样本。本文使用 两阶段微调策略 和 自监督学习来保留基类的知识,并学习更好的泛化表示。然后,利用 知识蒸馏策略,使用新类中的少量样本,将知识从基础转移到新模型。在基准数据集上的大量实验结果表明了该方法的有效性。
边栏推荐
猜你喜欢
Oracle 注释详解(--、/**/、rem)
梯度下降、反向传播
自监督论文阅读笔记 Ship Detection in Sentinel 2 Multi-Spectral Images with Self-Supervised Learning
HoloLens联合发明人:打造理想的全天AR需要解决这些问题
自监督论文阅读笔记 Self-Supervised Deep Learning for Vehicle Detection in High-Resolution Satellite Imagery
Delightful Nuxt3 Tutorial (1): Application Creation and Configuration
动态调整web系统主题? 看这一篇就够了
softmax和最大熵
Execute the mysql script file in the docker mysql container and solve the garbled characters
Apache2-XXE漏洞渗透
随机推荐
php连接数据库脚本
Qlik Sense 字符串截取和拼接详解(Left、Right、&)
该描述怎么写成SQL语句
Greetings(状压DP,枚举子集转移)
ASP.NET MVC3的伪静态实现
关于如何向FastAPI的依赖函数添加参数
中国生物降解塑料行业市场运营态势及发展趋势研究报告2022~2028年
Invalid signature file digest for Manifest main attributes解决方法
详解背包问题(DP分支)
联邦学习摘录
自监督论文阅读笔记 Self-Supervised Deep Learning for Vehicle Detection in High-Resolution Satellite Imagery
浏览器多线程离屏渲染压缩打包方案
SAP HANA 新增一列时报错详解
IO 复用
The ` monorepo ` ` hoist ` mechanism lead to the change of the loading configuration file path
Convolutional Nerual Nertwork(CNN)
[frp intranet penetration]
【CSRF,SSRF,XXE,PHP反序列化,Burpsuite】
opencv目标检测
中国生活垃圾处理行业十四五规划与投融资模式分析报告2022~2028年