当前位置:网站首页>自监督论文阅读笔记 Incremental-DETR:Incremental Few-Shot Object Detection via Self-Supervised Learning
自监督论文阅读笔记 Incremental-DETR:Incremental Few-Shot Object Detection via Self-Supervised Learning
2022-08-03 05:23:00 【YoooooL_】


上一步中匹配的所有对的Hungarian Loss 定义为:
其中表示预测和目标之间的最佳分配。Lcls是sigmoid Focal Loss ,Lbox是l1 loss和广义IoU loss的线性组合,具有与DETR相同的权重超参数。
为了使DETR的 类特定组件 的参数 在增量少样本微调阶段 能够很好地推广到具有少量样本的新类,本文以自监督的方式 微调类特定组件,同时在第一阶段的基础模型微调中 保持类未知组件冻结,其中,模型的参数用 预训练的基础模型 初始化。
基础模型微调 依赖于 对基础数据的其他潜在类未知对象 以及基础类的真值对象进行预测。本文使用 选择性搜索算法 为每个原始图像生成一组 类别未知的目标候选框。
选择性搜索是一种成熟且非常有效的无监督目标候选框生成算法,它利用颜色相似度、纹理相似度、区域大小和区域间的匹配度来生成目标候选框。然而,目标候选框的数量很大,排名也不准确。为了避免这个问题,我们使用选择性搜索算法中的目标排序 来删除不精确的目标候选框。
具体来说,选择排名列表中 与基类的真值目标不重叠的前O个对象 作为伪真值目标候选框。
如图2所示,首先用 第一阶段微调的基础模型 初始化 新模型的参数。然后,在冻结类未知组件的时候,使用一些新类的样本来 微调 类特定的投影层和分类头。然而,在新类学习过程中,投影层和分类头的不断更新会加剧基类的灾难性遗忘。
因此,本文使用 知识蒸馏 来缓解灾难性遗忘。具体而言,基础模型 用于防止新模型的投影层输出特征 与 基础模型的投影层输出特征 偏离太多。然而,在全部的特征映射上 直接 知识蒸馏 会影响性能。本文使用 新类的 真值边界框 作为二进制掩码,以防止 基础模型的特征 对 新类的学习产生负面影响。
对于DETR 分类头 上的知识蒸馏,首先 从基本模型的M个预测输出中 选择预测输出作为基本类的伪真值。
对于输入的新图像,当其类概率大于0.5且其边界框与新类的真值边界框没有重叠时,我们将基础模型的预测输出 视为基础类的伪真值。然后,采用KL散度损失
Conclusion:
本文提出了一种新的增量少样本目标检测框架:针对更具挑战性和现实性的场景,没有来自基类的样本,只有来自新类的少量样本。本文使用 两阶段微调策略 和 自监督学习来保留基类的知识,并学习更好的泛化表示。然后,利用 知识蒸馏策略,使用新类中的少量样本,将知识从基础转移到新模型。在基准数据集上的大量实验结果表明了该方法的有效性。
边栏推荐
猜你喜欢
【frp内网穿透】
自监督论文阅读笔记SELF-SUPERVISED SPECTRAL MATCHING NETWORK FOR HYPERSPECTRAL TARGET DETECTION
嵌入式实验三(代码几乎都要改才能运行)
边缘辅助无人机网络的分层联邦学习
嵌入式实验二注意点
Browser multi-threaded off-screen rendering, compression and packaging scheme
当奈飞的NFT忘记了web2的业务安全
Kettle 从资源库中载入新的转换出错(Invalid byte 1 of 1-byte UTF-8 sequence)
【 Nmap and Metasploit common commands 】
关于梯度下降法的一些优化方法
随机推荐
mysql 客户端SSL错误2026 (HY000)
Greetings(状压DP,枚举子集转移)
Qlik Sense 聚合函数及范围详解(Sum、Count、All、ToTaL、{1})
BeanFactory和FactoryBean的区别
MySql 怎么查出符合条件的最新的数据行?
UPC-Longest X
深度学习理论课程第四、五章总结
进程间通讯 (IPC 技术) - 信号
寄存器常见指令
MySQL 慢查询
滚动条 scrollbar 和scrollbar-thumb 样式
详解背包问题(DP分支)
【 Nmap and Metasploit common commands 】
【HQL】(一)json字符串处理json_tuple和get_json_object
编程软件配备
docker mysql 容器中执行mysql脚本文件并解决乱码
MySQL 排序
Leetcode刷题——一些用层次遍历解决的问题(111. 二叉树的最小深度、104. 二叉树的最大深度、226. 翻转二叉树、剑指 Offer 27. 二叉树的镜像)
中国磷化铟晶圆行业发展前景与投资规划分析报告2022~2028年
取某一区间中素数的个数--洛谷P1865 A % B Problem