当前位置:网站首页>深度学习网络模型的改进与调整
深度学习网络模型的改进与调整
2022-08-02 06:38:00 【算法之名】
更换骨干网
MobileNet V2

MobileNet V2可以作为一些深度学习网络应用的骨干网使用。

MobileNet V2的主要贡献是一个新颖的层模块:具有线性瓶颈的倒残差(inverted residual):该模块将低维压缩表示作为输入,首先将其扩展为高维度并使用轻量级深度可分离卷积(depthwise convolution)进行滤波。然后通过线性卷积将特征投射回低维表示。

通过上图,我们可以看到输入经过一个1*1的扩展卷积层,对输入进行升维。中间部分跟MobileNet V1是一样的,使用的是3*3的深度可分离卷积来进行特征提取。最后经过一个1*1的卷积层将深刻可分离卷积提取的特征还原回输入的形状(降维)进行输出,这里跟MobileNet V1不同的是它没有再使用Relu激活函数。另外它还有一个直接的连接,将输入与输出进行相加。

基本构建块是一个深度可分离卷积与残差连接。块的输入和输出是低维张量,而块内发生的滤波步骤是在高维张量上完成。如上图中,输入是一个56*56*24的feature map,经过1*1卷积核的扩展变成56*56*144的状态,它的扩展因子为6。再经过深度可分离卷积进行特征提取之后(这里形状未发生变化)经过1*1卷积变回56*56*24的形状,再经过一个残差连接,将输入、输出进行相加。

与MobileNet V1相比,深度可分离卷积之前多了一个1*1的"扩张"层,目的是为了提升通道数,获得更多特征。最后不采用ReLu,而是全连接层,目的是防止ReLu破坏特征。

同ResNet相比,它们俩都有残差块。ResNet是先压缩,再卷积来提取特征。注:这里说的ResNet是ResNet的一个变种,一般用于ResNet-101结构中,它的残差模块是先通过1*1的卷积来进行降维,减少通道数,再经过3*3的卷积来提取特征,再经过1*1的卷积来恢复成输入的通道数,也就是升维。所以这里叫做先压缩。
而MobileNet V2则刚好相反,它是先扩张,再提取通道,再压缩。深度可分离卷积提取特征受限于输入的通道数,如果按照ResNet的方式先压缩,再卷积提取特征,那么深度可分离的卷积可提取的特征就太少了。当采用”扩张“->“卷积提取特征”->"压缩"之后会遇到一个问题,那就是ReLu会破坏特征。ReLu对于负的输入,输出全为0;而本来特征就已经被压缩,再经过ReLu的话,又要损失一部分特征,因此这里不采用ReLu,就称为Linear bottlenecks。
- 线性瓶颈
ReLu激活函数对低维特征信息造成大量损失。对于输入的真实图像,层激活(对于任何层)形成"感兴趣流形"。人们一直认为神经网络中感兴趣流形可以嵌入到低维子空间中去。

在上图中输入的是一个螺旋形线圈,使用一个随机矩阵T对该螺旋进行变换,然后使用ReLu将初始螺旋嵌入到n维空间(高维空间)中,然后使用
将其投影到2D空间。当n=2、3的时候,导致信息丢失。在上图中我们可以看到第二和第三张图,图形就不再呈现螺旋的形状了。其中流形的某些点彼此塌陷。而对于n=15到30,变换是高度非凸的。
边栏推荐
猜你喜欢
![(Notes are not completed) [Graph Theory] Traversal of graphs](/img/1d/d2909dcfa0ab5c207005971a7b4a2d.gif)
(Notes are not completed) [Graph Theory] Traversal of graphs

2022夏暑假每日一题(六)

【CNN回归预测】基于matlab卷积神经网络CNN数据回归预测【含Matlab源码 2003期】

MySQL Advanced Statements (1)

chrome 插件开发指南

_2_顺序表

入门opencv,欢笑快乐每一天

解决:- SPY: No data found for this date range, symbol may be delisted报错

Pagoda+FastAdmin 404 Not Found

根据一个字段的内容去更新另一个字段的数据,这样的sql语句该怎么样书写
随机推荐
2022.07.31(LC_6132_使数组中所有元素都等于零)
love
宝塔+FastAdmin 404 Not Found
【图像隐藏】基于matlab混合DWT-HD-SVD数字图像水印方法技术【含Matlab源码 2007期】
获取间隔的日期列表工具类
[数据集][VOC]男女数据集voc格式6188张
C# FileInfo类
新产品立大功 伟世通第二季度营收双增
聊天机器人如何提升独立站的营销水平?
交换--STP协议
GCC编译器技术解析
Servlet
返回文件名问题
In-depth analysis of the initialization of member variables and local variables
php删除一维数组中一个值
[数据集][VOC]眼睛佩戴数据集VOC格式6000张
About the local server problem after ue4.27 pixel streaming package
能与观众实时互动的Claper
MPLS的相关技术
解决Pytorch模型在Gunicorn部署无法运行或者超时问题