当前位置:网站首页>【2022新生学习】第三周要点
【2022新生学习】第三周要点
2022-07-29 04:59:00 【AI前沿理论组@OUC】
1、Batch Normalization
使用BN时需要注意的问题:
- 因为训练时会实时统计均值和方差,但是测试时要使用历史统计的值,不用当前的,所以要进行设置。在pytorch中可通过创建模型的model.train()和model.eval()方法控制。(类似的还有 Dropout)
- batch size尽可能设置大点,设置的越大求的均值和方差越接近整个数据集的真实分布。(但也要考虑你的硬件设备)
- 将BN层放在卷积层(Conv)和激活层(例如ReLU)之间,且卷积层不要使用偏置bias。
2、分组卷积

Group Convolution 是对输入feature map进行分组,然后每组分别卷积。如果分为G组,则参数量会降低为原来的 1/G。
速度提升: 理论上可以提高网络的速度,但实际上未必有3X3的卷积效率高,这是因为 pytorch 专门对 3X3 的卷积进行了优化,而分组卷积破坏了这种优化。
精度提升: 分组可以把特征变为若干子空间(subspace),对于图像信息有更加全面的了解。有些像Transformer 里的 Multi-Head Self-Attention,只不过 Transformer 里面是对注意力计算分组,起了个名字叫做“多头”,而组卷积里是对 convolution 分组。

Transformer来自于自然语言处理,在真实语言环境中,每一个词和不同的词,都有不同的关系。可以用不同的 Attention 来补充这些不同的关系。上图展示了三种 attention,即三个子空间,放在子空间里可以更好的学习这种关系。

AlexNet里也有一个经典的发现,上图中前三行是 GPU1 学习到的滤波器,后三行是GPU2学习到的滤波器。可以发现一个主要学习了纹理、梯度信息,另一个主要学习了色彩信息,可以理解为不同的子空间。
3、Res2Net

来自于南开大学程明明老师组的工作,特征分组+多尺度的完美结合。论文中有两个实验讨论了特征的分组。可以看出,随着尺度的提升,准确率会提升,速度会降低。而且,分组大于4的时候,相对于分组为4提升并不十分明显。所以,特征分组并不是越多越好,组数增加会增加计算消耗,需要一定的平衡。


边栏推荐
- Connection database time zone setting
- Common rules of makefile (make) (II)
- < El table column> place multiple pictures
- Mysql:the user specified as a definer ('root '@'%) does not exist
- 数据湖:分布式开源处理引擎Spark
- Climbing the pit of traffic flow prediction (II): the simplest LSTM predicts traffic flow using tensorflow2
- Implementation of img responsive pictures (including the usage of srcset attribute and sizes attribute, and detailed explanation of device pixel ratio)
- 输入的查询SQL语句,是如何执行的?
- AttributeError: ‘module‘ object has no attribute ‘create_connection‘
- MySQL time calculation function
猜你喜欢

office2010每次打开都要配置进度怎么解决?

The most comprehensive promotion plan for the launch of new products

Ethernet of network

1 句代码,搞定 ASP.NET Core 绑定多个源到同一个类

SparkSql批量插入或更新,保存数据到Mysql中

WPS插入超链接无法打开,提示“无法打开指定文件”怎么办!

虚拟偶像的歌声原来是这样生成的!

On prepayment of house purchase

Take you to understand JS array
![Academic | [latex] super detailed texlive2022+tex studio download installation configuration](/img/4d/f8c60c0fbbd98c4da198cfac7989fa.png)
Academic | [latex] super detailed texlive2022+tex studio download installation configuration
随机推荐
如何避免示波器电流探头损坏
What are the core features of the digital transformation of state-owned construction enterprises?
SGuard64.exe ACE-Guard Client EXE:造成磁盘经常读写,游戏卡顿,及解决方案
SparkSql批量插入或更新,保存数据到Mysql中
Wechat picture identification
How to monitor micro web services
P1009 [noip1998 popularization group] sum of factorials
2021-10-23
What if the office prompts that the system configuration cannot run?
Nail dialog text converted to pictures cannot be copied and pasted on the document
IDEA中使用注解Test
C语言实现三子棋
Office提示系统配置无法运行怎么办?
新产品上市最全推广方案
How to debug UDP port
Box horizontal vertical center layout (summary)
MySQL定时调用预置函数完成数据更新
Reveal installation configuration debugging
The song of the virtual idol was originally generated in this way!
【微信小程序--解决display:flex最后一行对齐问题。(不连续排列会分到两边)】