当前位置:网站首页>深度学习网络模型的改进与调整
深度学习网络模型的改进与调整
2022-08-02 06:38:00 【算法之名】
更换骨干网
MobileNet V2
MobileNet V2可以作为一些深度学习网络应用的骨干网使用。
MobileNet V2的主要贡献是一个新颖的层模块:具有线性瓶颈的倒残差(inverted residual):该模块将低维压缩表示作为输入,首先将其扩展为高维度并使用轻量级深度可分离卷积(depthwise convolution)进行滤波。然后通过线性卷积将特征投射回低维表示。
通过上图,我们可以看到输入经过一个1*1的扩展卷积层,对输入进行升维。中间部分跟MobileNet V1是一样的,使用的是3*3的深度可分离卷积来进行特征提取。最后经过一个1*1的卷积层将深刻可分离卷积提取的特征还原回输入的形状(降维)进行输出,这里跟MobileNet V1不同的是它没有再使用Relu激活函数。另外它还有一个直接的连接,将输入与输出进行相加。
基本构建块是一个深度可分离卷积与残差连接。块的输入和输出是低维张量,而块内发生的滤波步骤是在高维张量上完成。如上图中,输入是一个56*56*24的feature map,经过1*1卷积核的扩展变成56*56*144的状态,它的扩展因子为6。再经过深度可分离卷积进行特征提取之后(这里形状未发生变化)经过1*1卷积变回56*56*24的形状,再经过一个残差连接,将输入、输出进行相加。
与MobileNet V1相比,深度可分离卷积之前多了一个1*1的"扩张"层,目的是为了提升通道数,获得更多特征。最后不采用ReLu,而是全连接层,目的是防止ReLu破坏特征。
同ResNet相比,它们俩都有残差块。ResNet是先压缩,再卷积来提取特征。注:这里说的ResNet是ResNet的一个变种,一般用于ResNet-101结构中,它的残差模块是先通过1*1的卷积来进行降维,减少通道数,再经过3*3的卷积来提取特征,再经过1*1的卷积来恢复成输入的通道数,也就是升维。所以这里叫做先压缩。
而MobileNet V2则刚好相反,它是先扩张,再提取通道,再压缩。深度可分离卷积提取特征受限于输入的通道数,如果按照ResNet的方式先压缩,再卷积提取特征,那么深度可分离的卷积可提取的特征就太少了。当采用”扩张“->“卷积提取特征”->"压缩"之后会遇到一个问题,那就是ReLu会破坏特征。ReLu对于负的输入,输出全为0;而本来特征就已经被压缩,再经过ReLu的话,又要损失一部分特征,因此这里不采用ReLu,就称为Linear bottlenecks。
- 线性瓶颈
ReLu激活函数对低维特征信息造成大量损失。对于输入的真实图像,层激活(对于任何层)形成"感兴趣流形"。人们一直认为神经网络中感兴趣流形可以嵌入到低维子空间中去。
在上图中输入的是一个螺旋形线圈,使用一个随机矩阵T对该螺旋进行变换,然后使用ReLu将初始螺旋嵌入到n维空间(高维空间)中,然后使用将其投影到2D空间。当n=2、3的时候,导致信息丢失。在上图中我们可以看到第二和第三张图,图形就不再呈现螺旋的形状了。其中流形的某些点彼此塌陷。而对于n=15到30,变换是高度非凸的。
边栏推荐
- 实例030:回文数
- 【心电信号】基于matlab心率检测【含Matlab源码 1993期】
- 【红队】ATT&CK - 创建或修改系统进程实现持久化(更新ing)
- 关于ue4.27像素流送打包后的本地服务器问题
- In-depth analysis of the initialization of member variables and local variables
- Connection reset by peer problem analysis
- 【请教】SQL语句按列1去重来计算列2之和
- 暑期总结(三)
- Submit code process
- 【CNN回归预测】基于matlab卷积神经网络CNN数据回归预测【含Matlab源码 2003期】
猜你喜欢
File upload vulnerability (2)
【图像隐藏】基于matlab混合DWT-HD-SVD数字图像水印方法技术【含Matlab源码 2007期】
【请教】SQL语句按列1去重来计算列2之和
实例026:递归求阶乘
Specified URL is not reachable,caused by :‘Read timed out
Revitalize rural circular economy and digital chain to link agricultural "ecological chain"
正则表达式的理解学习
Specified URL is not reachable,caused by :‘Read timed out
Detailed explanation of 9 common reasons for MySQL index failure
2022.07.31(LC_6132_使数组中所有元素都等于零)
随机推荐
[数据集][VOC]眼睛佩戴数据集VOC格式6000张
punch day05
倍福使用AdsRemote组件实现和C#的ADS通讯
实例031:字母识词
MPLS的相关技术
[Dataset][VOC] Male and female dataset voc format 6188 sheets
【故障诊断分析】基于matlab FFT轴承故障诊断(包络谱)【含Matlab源码 2002期】
Leetcode Weekly 304
Detailed explanation of 9 common reasons for MySQL index failure
2022年8月计划,着重ue4视频教程
(Notes are not completed) [Graph Theory] Traversal of graphs
System.Security.SecurityException: 未找到源,但未能搜索某些或全部事件日志。不可 访问的日志: Security
根据一个字段的内容去更新另一个字段的数据,这样的sql语句该怎么样书写
正则表达式的理解学习
反射课后习题及做题记录
【论文精读】Geometric Structure Preserving Warp for Natural Image Stitching
Redis 常用命令和基本数据结构(数据类型)
数据库概论-MySQL的数据表的基本操作
chrome 插件开发指南
docker 安装mysql