当前位置:网站首页>【CV-Learning】语义分割

【CV-Learning】语义分割

2022-08-04 05:29:00 小梁要努力哟

语义分割

定义:给图像的每个像素分配类别标签,不区别实例,只考虑像素类别。在这里插入图片描述

旧思路(滑动窗口)

在这里插入图片描述

思路:以某一个像素点为中心,选取一个区域,对该区域进行分类。
问题:效率太低,重叠的区域特征反复被计算。

新思路(全卷积)

在这里插入图片描述

思路:在Convolutions时进行pooling,使得图像尺寸及深度不变,之后得到深度为C的Scores,其中每个深度代表一个类别,可以对每个像素进行类别判断。最终通过判断每个像素的交叉熵损失之和,进行反馈对总损失进行控制,使其越低越好。
问题:Convolutions处理过程中保持图像的原始分辨率,对显存的需求十分庞大。于是可以对Convolutions过程进行优化处理,得到性能的提升。

性能提升

在这里插入图片描述

思路:在Convolutions过程中,先进行下采样,提取到高级的语义特征,之后再通过上采样将原本的学习回来,建立高级语义到类标的映射。

下采样

pooling、strided convolution

上采样t

unpooling or strided transpose convolution

硬编码上采样
在这里插入图片描述
在这里插入图片描述

可学习的上采样(转置卷积Transpose convolution)
下采样
在这里插入图片描述
上采样
在这里插入图片描述

一维上采样例子
Filter为滤波器核,是一个可以学习的矩阵。
在这里插入图片描述

卷积与矩阵相乘(一维)
以下图例均为先进行下采样,然后进行上采样复原。
例1:步长为1
在这里插入图片描述
例2:步长为2
在这里插入图片描述

UNET

上采样是根据下采样得到的高级语义得到的,但是有时候高级语义效果并不好,还需要使用低级语义。
针对这个问题,提出了UNET,将下采样过程中的低级语义整合到上采样过程中,从而使得效果更好。

整合思路:
1.将左边红色的特征通道进行拷贝,与上采样后的特征通道拼起来。
2.将左边红色的特征通道通过卷积处理后,与上采样后的特征通道拼起来。
在这里插入图片描述

原网站

版权声明
本文为[小梁要努力哟]所创,转载请带上原文链接,感谢
https://blog.csdn.net/Y0704__00/article/details/126128018