当前位置:网站首页>Contrastive learning of Class-agnostic Activation Map for Weakly Supervised Object Localization and
Contrastive learning of Class-agnostic Activation Map for Weakly Supervised Object Localization and
2022-07-01 02:27:00 【Rainylt】
一句话总结: 认为前景和背景feature天然相似度较低,且相同纹理的前/背景feature相似度高,因此直接在feature后接分割头预测前背景分数,与feature相乘取出前/背景feature。在一个batch内降低前-背景pair的相似度,提高前景-前景和背景-背景相似度,但根据相似度排名降低该pair的loss权重。
详细来说,通过对特征降维可以发现
(1)纹理类似的前景的feature的相似度高,
(2)前景与背景相似度低
(3)纹理相似的背景相似度高
因此,在预训练的encoder提取出feature后,直接预测前/背景分数,并用对比损失强化上面的结论,以使得前/背景预测更准确
如上图所示, h ( ⋅ ) h(\cdot) h(⋅)是预训练的encoder, z j z_j zj是提取的特征图,通过随机初始化的二分类分割头 φ ( ⋅ ) \varphi{(\cdot)} φ(⋅)得到随机的(开始时)分割结果,如分数P
注:此时并不知道P是代表前景还是背景,暂时也不用管
此时通过P or (1-P)与feature相乘,可取出随机的(开始时)前/背景feature。
在一个batch内,计算前景-背景pair的相似度,并最小化该相似度:
对于同类(同为前景、背景类)feature,先计算相似度,排名,根据排名分配权重:
排名越靠前(越小)的pair的权重越大,反之越小。这是因为并不是所有背景/前景都相似,只有那些纹理相近的才相似。
这里意思其实是希望最开始的feature就满足前述假设,这样直接通过相似度就能找到纹理接近的region,然后通过对比损失使得分割头预测的前景-背景pair相似度小(这样实际上就要求分割头准确分割前景/背景region?),同时要求前景-前景相似度大,实际上是要求batch内cross-image纹理相近的物体相似度大。
举个反例
(1)假设一个batch内所有前景/背景纹理都不相似
(2)假设一个batch内只有个别sample的前/背景纹理相似
(3)假设前/背景有多个物体,比较复杂,多个物体的混合纹理仍满足假设?
当然,最终这个只是完成了二分类分割,对于多类目标,只能辅助CAM来做:
边栏推荐
- Detailed data governance knowledge system
- SWT/ANR问题--AMS/WMS
- import tensorflow.contrib.slim as slim报错
- ANR问题的分析与解决思路
- Machine learning 9-universal approximator radial basis function neural network, examining PDA and SVM from a new perspective
- Gartner研究:在中国,混合云的采用已成为主流趋势
- Short video platform development, relying on drawerlayout to achieve side sliding menu effect
- How do I open an account on my mobile phone? Also, is it safe to open an account online?
- Pychart software deployment gray unable to point
- Ernie-gram, 显式、完备的 n-gram 掩码语言模型,实现了显式的 n-gram 语义单元知识建模。
猜你喜欢

RestCloud ETL实践之无标识位实现增量数据同步
![Pytorch - - Basic Reference North Deux élèves du secondaire peuvent comprendre [Rétropropagation et Gradient descendant]](/img/6e/279dbb7a8d7a5ecd240de464c5b8b2.png)
Pytorch - - Basic Reference North Deux élèves du secondaire peuvent comprendre [Rétropropagation et Gradient descendant]

在unity中使用jieba分词的方法

Image preloading in JS

In the fourth week of June, the list - flying melon data up main growth ranking list (BiliBili platform) was released!

Machine learning 9-universal approximator radial basis function neural network, examining PDA and SVM from a new perspective

CentOS installs multiple versions of PHP and switches

What are the applications of SMS in enterprises?

机器学习9-通用逼近器径向基函数神经网络,在新观点下审视PDA和SVM

Small program cloud development -- wechat official account article collection
随机推荐
VirtualBox installation enhancements
Static domain and static method
Pycharm 打开远程目录 Remote Host
Pychart software deployment gray unable to point
Pulsar geo replication/ disaster recovery / regional replication
Open source basic software companies, looking for you to create the future together (api7.ai)
小程序自定义顶部导航栏,uni-app微信小程序自定义顶部导航栏
Analysis and solution of anr problems
Video tutorial | Chang'an chain launched a series of video tutorial collections (Introduction)
SWT / anr problem - deadlock
Machine learning 10 belief Bayesian classifier
LabVIEW calculates the camera image sensor resolution and lens focal length
Leetcode(524)——通过删除字母匹配到字典里最长单词
Viewing JVM parameters
halcon数组的一些使用
C # generates PPK files in putty format (supports passphrase)
pycharm 软件deployment 灰色 无法点
Objects and object variables
機器學習10-信念貝葉斯分類器
FL studio20.9 fruit software advanced Chinese edition electronic music arrangement