当前位置:网站首页>自监督论文阅读笔记: MoCoV2使用动量对比学习改进基线
自监督论文阅读笔记: MoCoV2使用动量对比学习改进基线
2022-08-03 05:23:00 【YoooooL_】
在本文中,通过在MoCo框架中实现SimCLR的两个设计改进来验证其有效性。通过对MoCo的简单修改——即 使用MLP投影头和更多的数据增强——我们建立了比SimCLR性能更好的更强的基线,并且不需要大规模的批量训练。
引言:
我们报告了SimCLR中使用的两个设计改进,即 MLP投影头 和 更强的数据增强,与MoCo和SimCLR框架正交,当与MoCo一起使用时,它们会带来更好的图像分类和目标检测迁移学习结果。此外,MoCo框架可以处理大量的负样本,而不需要大量的训练批次(图1)。与SimCLR的大量4k ~ 8k批次(需要TPU支持)相比,我们的“MoCo v2”基线可以在典型的8-GPU机器上运行,并获得比SimCLR更好的结果。
背景:
在端到端机制中(图1a)[13, 8, 17, 1, 9, 2],负key来自同一批,通过反向传播端到端更新。SimCLR[2]基于这种机制,需要大量批处理来提供大量负样本集。在MoCo机制(图1b)[6]中,负key保持在一个队列中,在每个训练批中只编码 查询 和 正键。采用动量编码器来提高当前key与早期key表示的一致性。MoCo将批大小与负样本的数量解耦。
改进设计:
SimCLR[2]在三个方面改进了实例识别的端到端变体:(i)批量大大增加(4k或8k),可以提供更多的负样本;(ii)将输出fc投影头[16]替换为MLP头;(iii)数据增强
在MoCo框架中,大量的负样本是现成的;MLP头和数据增强与对比学习如何实例化是正交的。接下来,我们在MoCo中研究这些改进。
实验:
根据SimCLR,我们将MoCo中的fc头替换为2层MLP头(隐藏层2048-d,用ReLU)。
我们通过加入SimCLR[2]的高斯模糊增强来扩展MoCo[6]的原始增强效果(我们发现[2]中较强的颜色失真在我们较高的基线中收益递减)。这表明线性分类精度与检测中的传输性能不是单调相关的。通过MLP,额外的增强可以将ImageNet的精度提高到67.3%,见表1(c)。
表2和3表明,对于良好的准确性来说,大量的批次并不是必需的,而且最先进的结果可以更容易获得。我们研究的改进只需要对MoCo v1进行几行代码更改,
边栏推荐
猜你喜欢
随机推荐
极光推送 能否缓存 消息
The ` monorepo ` ` hoist ` mechanism lead to the change of the loading configuration file path
Kotlin 中的泛型介绍
【Arduino】关于“&”和“|” 运算-----多个参数运算结果异常的问题解决
漫谈Map Reduce 参数优化
Invalid signature file digest for Manifest main attributes解决方法
浏览器多线程离屏渲染压缩打包方案
当我们在看Etherscan的时候,到底在看什么?
自监督论文阅读笔记Reading and Writing: Discriminative and Generative Modelingfor Self-Supervised Text Recogn
玩转Markdown(2) —— 抽象语法树的提取与操纵
【反弹shell与提权】
详解背包问题(DP分支)
【HQL】(二) 查询使用正则表达式做列选择
Kettle 从资源库中载入新的转换出错(Invalid byte 1 of 1-byte UTF-8 sequence)
神经网络基础
中国食品微生物检测行业深度监测及投资战略规划建议报告2022~2028年
docker mysql 容器中执行mysql脚本文件并解决乱码
A-B数对问题|UPC-Count Interval|洛谷-P1102A-B数对
中国生活垃圾处理行业十四五规划与投融资模式分析报告2022~2028年
【DC-2 Range Penetration】








