当前位置:网站首页>對比學習之 Unsupervised Learning of Visual Features by Contrasting Cluster Assignments
對比學習之 Unsupervised Learning of Visual Features by Contrasting Cluster Assignments
2022-07-07 11:15:00 【InfoQ】

- 諸神黃昏時代的對比學習
- “軍備競賽”時期的對比學習好。
- 將整個imagenet做成字典,從中抽取一個mini batch作為正樣本。再從中隨機抽取4096條作為負樣本。
- 從數據集中抽取一個mini batch對其增廣,使用一個孿生網絡,將原圖放進一個網絡,將增强之後的圖放進另一個網絡,二者同時進行訓練,對二者使用一個NCE loss或者infoNCE loss。一張圖片和它的增廣作為正樣本,剩餘的圖片及其增廣作為負樣本。
- 從數據集中抽取一個mini batch對其進行兩次增廣,使用一個孿生網絡,將一組圖片增强放進一個網絡,將另一組圖片增强放進另一個網絡,二者同時進行訓練,對二者使用一個NCE loss或者infoNCE loss。
- 它可能會重複的抽取到同一數據。雖然你數據集有很多圖片,但是你從中抽可能會抽到相同的圖片。極端的情况下,如果你抽到一組圖片作為正樣本,然後你又抽到同樣重複的一組圖片作為負樣本。那這樣就會對訓練造成影響。
- 也可能不具有整個數據集的代錶性。比如這個數據其實有很多很多種動物,但是你抽到的都是狗,這樣數據就是沒有代錶性的。
- 當然這樣的選取的越全面效果越好,但是如果你選取的過多的負樣本又會造成計算資源的浪費。

- 先說重複問題:因為你使用的是聚類中心進行比較。雖然是不同的聚類中心,那麼他肯定不可能出現重複的情况。
- 再說一下沒有代錶性的問題:聚類就是將眾多的圖片聚成不同的類別。與每一個類別的中心進行對比,是絕對具有代錶性的。
- 再說一下過去有過多負樣本造成資源浪費的問題。如果要跟很多的負樣本去做類比,可能就需要成千上萬的負樣本,而且即使如此也只是一個近似,而如果只是跟聚類中心做對比,則可以用幾百或者最多3,000個聚類中心,就足以錶示了。大大减少了計算資源消耗。

边栏推荐
猜你喜欢

面试被问到了解哪些开发模型?看这一篇就够了

Ping tool ICMP message learning

90后,辞职创业,说要卷死云数据库

高考作文,高频提及科技那些事儿……

Avoid mutating a prop directly since the value will be overwritten whenever the parent component

测试优惠券要怎么写测试用例?

VR development optimization
![[machine learning 03] Lagrange multiplier method](/img/14/7d4eb5679606e272f137ddbda4938c.png)
[machine learning 03] Lagrange multiplier method

学习笔记|数据小白使用DataEase制作数据大屏

2021-05-21
随机推荐
VIM命令模式与输入模式切换
Use of dotween
创意信息获2家机构调研:GreatDB 数据库已在9地部署
QT document
[untitled]
使用引用
如何在博客中添加Aplayer音乐播放器
普通测试年薪15w,测试开发年薪30w+,二者差距在哪?
uniCloud
Go redis Middleware
[machine learning 03] Lagrange multiplier method
Input type= "password" how to solve the problem of password automatically brought in
Compile QT project script with qmake
[untitled]
V-for img SRC rendering fails
How to get hardware information in unity
面试被问到了解哪些开发模型?看这一篇就够了
Mysql的json格式查询
基于STC8G1K08的0.96寸IIC液晶屏驱动程序
【pyqt】tableWidget里的cellWidget使用信号与槽机制