当前位置:网站首页>Shuffle Net_v1-shuffle_v2
Shuffle Net_v1-shuffle_v2
2022-07-28 05:23:00 【山上的小酒馆】
目录
shuffleNet结合ResNeXt的组卷积(GConv)与MobileNet的DW卷积。ResNeXt中1*1卷积占用了94.3%的Mdds,引入组卷积GConv减少计算复杂度。进行组卷积时,每组卷积独立进行,因此引入shuffle操作使得Group与Group间信息交互。
1.shuffle操作

2.计算复杂度对比:

相较于ResNet,ShuffleNet_v1对1*1的卷积进行了分组,并且中间3*3卷积使用DW卷积,组数g=通道数m。
3.Shuffle Net_v1模型架构以及参数设定
接下来看模型架构与各层的参数:

每个stage的第一个block步距stride为2,下个阶段输出channels翻倍(下采样)如结构图(c)。bottleneck(中间3*3DW卷积)的通道数为输出通道的1/4。
4.Shuffle Net_v1准确率

shufflenet_v2
5.Shuffle Net_v2设计准则
shufflenet_v2提出了四条高效设计网络的指标,
FLOPs是间接指标,而速度才是模型计算快慢的直接指标,MAC(内存占用)、平台、并行度都是影响模型快慢的指标,提出四条设计高效网络的准则:
(1)卷积层的输入特征矩阵与输出特征矩阵通道数相等时,MAC最小。

(2)当GConv的group增大时(FLOPs不变),MAC也增大。

(3)网络的碎片化程度越高,网络越慢。虽然提高精度,但对具备并行运算的硬件设备不友好。
(4)Element—wise(ReLU、shortcut等)的影响不可忽略。

6.Shuffle Net_v2网络架构改进
根据以上四条原则, shufflenet_v2对 shufflenet_v1进行了一系列改进,网络架构如下图:

1处采用划分channle_split的方式,减少进入bneck的通道数,对半分。
2处将组卷积改回普通1*1卷积,遵循第二条2,较少组数g。
3处采用shuffle的位置变化。
4处采用concat拼接保证整体input_c=output_c。
5处ReLU的位置变化。
6bneck中1*1—3*3—1*1三层卷积的输入通道数与输出通道数相等。
(d)图中下采样操作,通道划分channle_split,输出通道数增加为两倍。
7.Shuffle Net_v2参数

对于每一个stage的第一个block,channel翻倍,比如stage2的block1,每个分支有58个channels,对应(d)图。而其他block采用split的方法将input_channels均分。
边栏推荐
- Overview of unconstrained low resolution face recognition III: homogeneous low resolution face recognition methods
- 开关电源电路EMI设计在layout过程中注意事项
- FLUKE福禄克Aircheck wifi测试仪无法配置文件?---终极解决心得
- 生活随机-1
- Classification of iris based on Neural Network
- (PHP graduation project) based on PHP Gansu tourism website management system to obtain
- Chinese display problem of calendarextender control
- Reading experience of protecting against DNN model steaming attacks
- Transformer 自注意力机制 及完整代码实现
- Adaface: quality adaptive margin for face recognition image quality adaptive edge loss for face recognition
猜你喜欢

Nanjing University of Posts and Telecommunications CTF topic writeup (I) including topic address

(PHP graduation project) obtained based on PHP novel website management system

Arduino reads the analog voltage_ How mq2 gas / smoke sensor works and its interface with Arduino

Tensorflow2.1 basic concepts and common functions

福禄克DTX-1800其配件DTX-CHA002通道适配器CHANNEL更换RJ45插座小记

AEM testpro K50 and south Guangdong survey

(PHP graduation project) obtained based on thinkphp5 campus news release management system

福禄克DSX2-5000、DSX2-8000模块如何找到校准到期日期?

使用PowerCli来创建自定义ESXi ISO镜像

What is the AEM testpro cv100 and fluke dsx-8000 of category 8 network cable tester?
随机推荐
针对大量数据,MATLAB生成EXCEL文件并进行排版处理的源码
EIGamal cryptosystem description
ESXi社区版网卡驱动再次更新
RS232 RS485 RS422 通信 学习及备忘笔记
EIGamal 密码体制描述
Create a basic report using MS chart controls
详解爬电距离和电气间隙
论福禄克DTX-1800如何测试CAT7网线?
权重衰减 weight decay
VAN(DWConv+DWDilationConv+PWConv)
The short jumper dsx-8000 test is normal, but the dsx-5000 test has no length display?
(PHP graduation project) based on PHP online travel website management system to obtain
The difference and connection between cookies, sessions and tokens
如何测试工业以太网线缆(利用FLUKE DSX-8000)?
Nsctf web Title writeup
A comparative study of backdoor attack and counter sample attack
4、 Model optimizer and inference engine
基于直方图修改的可逆数字水印方法
浅谈误码仪的使用场景?
Clustering of machine learning
