当前位置:网站首页>【CV-Learning】语义分割
【CV-Learning】语义分割
2022-08-04 05:29:00 【小梁要努力哟】
语义分割
定义:给图像的每个像素分配类别标签,不区别实例,只考虑像素类别。
旧思路(滑动窗口)
思路:以某一个像素点为中心,选取一个区域,对该区域进行分类。
问题:效率太低,重叠的区域特征反复被计算。
新思路(全卷积)
思路:在Convolutions时进行pooling,使得图像尺寸及深度不变,之后得到深度为C的Scores,其中每个深度代表一个类别,可以对每个像素进行类别判断。最终通过判断每个像素的交叉熵损失之和,进行反馈对总损失进行控制,使其越低越好。
问题:Convolutions处理过程中保持图像的原始分辨率,对显存的需求十分庞大。于是可以对Convolutions过程进行优化处理,得到性能的提升。
性能提升
思路:在Convolutions过程中,先进行下采样,提取到高级的语义特征,之后再通过上采样将原本的学习回来,建立高级语义到类标的映射。
下采样
pooling、strided convolution
上采样t
unpooling or strided transpose convolution
硬编码上采样
可学习的上采样(转置卷积Transpose convolution)
下采样
上采样
一维上采样例子
Filter为滤波器核,是一个可以学习的矩阵。
卷积与矩阵相乘(一维)
以下图例均为先进行下采样,然后进行上采样复原。
例1:步长为1
例2:步长为2
UNET
上采样是根据下采样得到的高级语义得到的,但是有时候高级语义效果并不好,还需要使用低级语义。
针对这个问题,提出了UNET,将下采样过程中的低级语义整合到上采样过程中,从而使得效果更好。
整合思路:
1.将左边红色的特征通道进行拷贝,与上采样后的特征通道拼起来。
2.将左边红色的特征通道通过卷积处理后,与上采样后的特征通道拼起来。
边栏推荐
猜你喜欢
随机推荐
对象存储-分布式文件系统-MinIO-3:MinIo Client(mc)
es6 学习记录
关系型数据库-MySQL:体系结构
TensorFlow2学习笔记:8、tf.keras实现线性回归,Income数据集:受教育年限与收入数据集
yolov3数据读入(二)
npm install dependency error npm ERR! code ENOTFOUNDnpm ERR! syscall getaddrinfonpm ERR! errno ENOTFOUND
自动化运维工具Ansible(5)流程控制
flink on yarn指定第三方jar包
ISCC2021———MISC部分复现(练武)
k3s-轻量级Kubernetes
flink-sql所有数据类型
oracle临时表与pg临时表的区别
WARNING: sql version 9.2, server version 11.0.Some psql features might not work.
js 基础学习笔记
什么是跨域和同源
with recursive用法
【树 图 科 技 头 条】2022年6月28日 星期二 伊能静做客树图社区
CTFshow—Web入门—信息(1-8)
剑指 Offer 2022/7/3
【go语言入门笔记】13、 结构体(struct)