当前位置:网站首页>【论文阅读】Mining Cross-Image Semantics for Weakly Supervised Semantic Segmentation
【论文阅读】Mining Cross-Image Semantics for Weakly Supervised Semantic Segmentation
2022-08-04 05:29:00 【≈落小朵】
摘要:
当前流行的解决方案利用分类器中的对象定位映射作为监视信号,并努力使定位映射捕获更完整的对象内容。与以往主要关注图像内信息的努力不同,我们强调了跨图像语义关系对全面对象模式挖掘的价值
adress:two neural coattentions are incorporated into the classifier to complimentarily capture cross-image semantic similarities and differences. 互补的获取图像语义的异同点
特别地,给定一对训练图像,
一个共同注意强制分类器从共同注意的对象识别共同语义
另一个,称为对比共同注意,驱动分类器从其余的不寻常的对象识别非共享语义。
除了促进对象模式学习之外,协同注意还可以利用其他相关图像的上下文来改进定位图的推断,从而最终有利于语义分割的学习
更重要的是,我们的算法提供了一个统一的框架,可以很好地处理不同的WSSS设置,即
(1)仅通过精确的图像级监督来学习WSSS,
(2)额外简单的单标签数据
(3)网络数据噪声过大。它在所有这些方面都树立了新的艺术境界,很好地展示了它的效力和普遍性。
简介:
其中,仅使用图像级标签实现弱监督语义分割(WSSS)是一个突出且具有吸引力的趋势,其注释工作量最小,本文也遵循了这一趋势
然而,经过训练的分类器往往会过度处理最具识别性的部分,而不是整个对象,这成为了这一领域的焦点。
研究了多种解决方案,通常采用:图像级操作,
如区域隐藏和擦除[30,69],
扩大初始激活区域的区域增长策略[27,62],
以及从深层特征中收集多尺度上下文的特征级增强[33,71]。
这些努力取得了良好的效果,说明了识别对象模式挖掘对WSSS的重要性。然而,如图1(a)所示,他们通常只使用单一图像信息来发现对象模式,忽略了在注释薄弱的数据之间丰富的语义上下文。
通过图像级标签,不仅可以识别出每幅图像的语义,还可以给出图像间的语义关系,即两幅图像是否共享某种语义,可以作为目标模式挖掘的线索。
受此启发,我们不再仅仅依赖图像内部信息,而是进一步探讨了交叉图像语义相关性对于完整的目标模式学习和有效的类激活映射推理的价值(见图1(b-c))。
特别是,我们的分类器配备了可区分的共注意机制,解决语义同质性和不同理解训练图像对。
具体来说,在分类器中学习了两种共关注。前者的目标是获取跨图像的公共语义,使分类器能够更好地将公共语义标签置于共同关注区域之上。
后者被称为对比共同注意,侧重于其余部分,非共享语义,这是有帮助的,该分类器可以更好地分离不同对象的语义模式。这两种关注点协同工作,使分类器对对象模式的理解更加全面
对于给定的训练图像,协同注意利用一组相关图像(即具有某种共同语义的图像)来捕获更丰富的上下文,生成更精确的定位图
另一个优点是,由于使用了训练图像对,我们的基于共注意的分类器学习范式带来了一个有效的数据增强策略。
总的来说,在分类器的训练阶段和定位图推理阶段,我们的共同关注都促进了对象发现。这提供了获得更精确的伪像素级注释的可能性,这有助于最终的语义分割学习
此外,我们的方法也很自然地处理了领域差距,因为共注意有效地解决了领域共享对象模式学习问题,并作为共注意参数学习的一部分实现了领域适应。
(1)我们解决了交叉图像语义相关性对于完整目标模式学习和目标位置推断的价值,这是通过在成对的训练样本上工作的共注意分类器实现的。
(2)我们的共注意分类器以更全面的方式挖掘语义线索。除了单一图像语义外,它还分别通过共注意和对比共注意从交叉图像语义的异同中挖掘互补监督
(3)我们的方法是通用的,足以学习具有精确图像级监督的WSSS,或具有特别简单的单标签,甚至是有噪声的网络爬行数据的WSSS。它优雅地解决了不同WSSS设置的固有挑战,并一致地显示了有希望的结果。
方法:
到目前为止,分类器的学习是标准化的,即仅使用个体图像信息进行语义学习。我们可以直接使用激活映射来监督下一阶段的语义分割学习,如[22,32)。不同的是,我们的分类器还利用了一种共同关注机制来进一步挖掘跨图像语义,并最终更好地定位目标。
3.2 Co-Attention for Cross-Image Common Semantics Mining.
我们的共同关注关注两个图像,即即时消息和在,同时,并捕捉他们的相关性。首先计算Fm与Fn之间的亲和矩阵P:
因此,通过计算两幅相关图像的共注意,可以明确地帮助分类器关联语义标签和对应的物体区域,更好地理解物体不同部分之间的关系。它基本上充分利用了训练数据之间的上下文
直观上,对于基于共注意的共同语义分类,我们使用Im和In共享的标签lm \ ln来监督学习:
- 必须有共同的语义标签!!
Contrastive Co-Attention for Cross-Image Exclusive Semantics Mining
除了上述探索交叉图像公共语义的共同注意之外,我们还提出了一种挖掘成对图像之间语义差异的对比共同注意。共注意和对比共注意互补,有助于分类器更好地理解对象的概念。
相对于共同注意研究通用语义作为信息线索来提高对象模式挖掘的方法,对比共同注意解决了成对图像间语义差异的互补知识。图2(b)给出了一个直观的例子。通过计算Im和In (Eq. 7)的对比共关注,突出了Table和Cow这两个在原始图像中独一无二的特征。
基于对比的共关注特征,即Fmmnn和Fnnnm,分类器需要进行准确识别分别是Table和Cow类。当通过对比共关注滤除公共对象时,分类器有机会更多地关注剩余图像区域,更有意识地挖掘未共享语义。这也有助于分类器更好地区分不同对象的语义,因为通过对比的共同注意可以理清公共对象和非共享对象的语义。例如,如果奶牛的某些部位被错误地识别为与人相关的部位,对比共同注意就会在Fnnnm中丢弃这些部位。然而,Fnnnm中的rest语义可能不足以识别牛。这将强制分类器更好地区分不同的对象。对于基于对比共注意的非共享语义分类,监督损失设计为:
讨论
我们的共注意分类器可以从辅助任务学习在我们的例子中,而不是传统的广泛研究的单图像语义识别任务。在WSSS方法中,我们探索了两个辅助任务,即从图像对中预测常见语义和不常见语义,以便从弱监控中充分挖掘监控信号的角度来解释[14,43],自监督学习领域通过从固有的数据结构中探索辅助任务来提高数据效率和鲁棒性。通过关注(对比)共注意特征来驱动分类器更好地理解跨图像语义,而不是仅仅依赖于图像内部信息(图2)。此外,这种策略也具有图像共分割的精神。由于训练集的图像级语义是已知的,因此应该将一些图像共享或不共享某些语义的知识作为提示或监督信号,以更好地定位对应对象。我们的基于共注意的学习管道也提供了一种有效的数据增强策略,因为使用了成对的样本,其数量接近于单一训练图像数量的平方。
边栏推荐
猜你喜欢
随机推荐
SQL的性能分析、优化
【CV-Learning】图像分类
ValueError: Expected 96 from C header, got 88 from PyObject
(十一)树--堆排序
postgres recursive query
视图、存储过程、触发器
Thread 、Handler和IntentService的用法
剑指 Offer 20226/30
SQl练习 2022/6/29
SQL练习 2022/7/2
TensorFlow2 study notes: 6. Overfitting and underfitting, and their mitigation solutions
软著撰写注意事项
基于PyTorch的FCN-8s语义分割模型搭建
Halcon缺陷检测
pgsql函数中的return类型
Android foundation [Super detailed android storage method analysis (SharedPreferences, SQLite database storage)]
thymeleaf中 th:href使用笔记
Install dlib step pit record, error: WARNING: pip is configured with locations that require TLS/SSL
[Introduction to go language] 12. Pointer
(十)树的基础部分(一)