当前位置:网站首页>深度学习网络模型的改进与调整
深度学习网络模型的改进与调整
2022-08-02 06:38:00 【算法之名】
更换骨干网
MobileNet V2

MobileNet V2可以作为一些深度学习网络应用的骨干网使用。

MobileNet V2的主要贡献是一个新颖的层模块:具有线性瓶颈的倒残差(inverted residual):该模块将低维压缩表示作为输入,首先将其扩展为高维度并使用轻量级深度可分离卷积(depthwise convolution)进行滤波。然后通过线性卷积将特征投射回低维表示。

通过上图,我们可以看到输入经过一个1*1的扩展卷积层,对输入进行升维。中间部分跟MobileNet V1是一样的,使用的是3*3的深度可分离卷积来进行特征提取。最后经过一个1*1的卷积层将深刻可分离卷积提取的特征还原回输入的形状(降维)进行输出,这里跟MobileNet V1不同的是它没有再使用Relu激活函数。另外它还有一个直接的连接,将输入与输出进行相加。

基本构建块是一个深度可分离卷积与残差连接。块的输入和输出是低维张量,而块内发生的滤波步骤是在高维张量上完成。如上图中,输入是一个56*56*24的feature map,经过1*1卷积核的扩展变成56*56*144的状态,它的扩展因子为6。再经过深度可分离卷积进行特征提取之后(这里形状未发生变化)经过1*1卷积变回56*56*24的形状,再经过一个残差连接,将输入、输出进行相加。

与MobileNet V1相比,深度可分离卷积之前多了一个1*1的"扩张"层,目的是为了提升通道数,获得更多特征。最后不采用ReLu,而是全连接层,目的是防止ReLu破坏特征。

同ResNet相比,它们俩都有残差块。ResNet是先压缩,再卷积来提取特征。注:这里说的ResNet是ResNet的一个变种,一般用于ResNet-101结构中,它的残差模块是先通过1*1的卷积来进行降维,减少通道数,再经过3*3的卷积来提取特征,再经过1*1的卷积来恢复成输入的通道数,也就是升维。所以这里叫做先压缩。
而MobileNet V2则刚好相反,它是先扩张,再提取通道,再压缩。深度可分离卷积提取特征受限于输入的通道数,如果按照ResNet的方式先压缩,再卷积提取特征,那么深度可分离的卷积可提取的特征就太少了。当采用”扩张“->“卷积提取特征”->"压缩"之后会遇到一个问题,那就是ReLu会破坏特征。ReLu对于负的输入,输出全为0;而本来特征就已经被压缩,再经过ReLu的话,又要损失一部分特征,因此这里不采用ReLu,就称为Linear bottlenecks。
- 线性瓶颈
ReLu激活函数对低维特征信息造成大量损失。对于输入的真实图像,层激活(对于任何层)形成"感兴趣流形"。人们一直认为神经网络中感兴趣流形可以嵌入到低维子空间中去。

在上图中输入的是一个螺旋形线圈,使用一个随机矩阵T对该螺旋进行变换,然后使用ReLu将初始螺旋嵌入到n维空间(高维空间)中,然后使用
将其投影到2D空间。当n=2、3的时候,导致信息丢失。在上图中我们可以看到第二和第三张图,图形就不再呈现螺旋的形状了。其中流形的某些点彼此塌陷。而对于n=15到30,变换是高度非凸的。
边栏推荐
猜你喜欢
随机推荐
HCIP 第四天
2022年8月计划,着重ue4视频教程
Py's mlxtend: a detailed guide to the introduction, installation, and usage of the mlxtend library
At age 94, pioneer Turing award winner, computational complexity theory, Juris Hartmanis, died
yml字符串读取时转成数字了怎么解决
rhce homework
Pagoda+FastAdmin 404 Not Found
返回文件名问题
实例029:反向输出
July 18-July 31, 2022 (Ue4 video tutorials and documentation, 20 hours. Total 1412 hours, 8588 hours left)
入门opencv,欢笑快乐每一天
[21天学习挑战赛——内核笔记](一)——设备树的概述(硬件、目标、效果、文件类型)
Two good php debug tutorials
Reverse resolve dns server
倍福使用AdsRemote组件实现和C#的ADS通讯
See the picture to understand | How to choose sales indicators to measure the health of business growth
.NET Static Code Weaving - Rougamo Release 1.1.0
【图像去噪】基于matlab双立方插值和稀疏表示图像去噪【含Matlab源码 2009期】
August 2022 plan, focusing on ue4 video tutorials
Swagger的简单介绍,集成,以及如何在生产环境中关闭swagger,在测试和开发环境中自动打开









