当前位置：网站首页>深度学习报告（3）

深度学习报告（3）

2022-07-26 22:42:00 【弯道超车手】

一、为什么要初始化？

二、什么是好的初始化？

三、常见的初始化

1、全零初始化

全零初始化：参数初始值为0。
缺点：同一层的神经元会学习到相同的特征,不能破坏不同神经元的对称性质。如果神经元的权重被初始化为0 ,所有神经元的输出都将是相同的,除了输出之外,所有的中间层的节点的值都为零。一般神经网络拥有对称的结构, 那么在进行第一次误差反向传播时,更新后的网络参数将会相同,在下一次更新时,相同的网络参数学习提取不到有用的特征,因此深度学习模型都不会使用0初始化所有参数。

2、随机初始化

随机初始化：将参数初始化为小的随机数。一般随机值从均值为μ ,标准差是σ的高斯分布中取样,最终参数的每个维度来自一个多维的高斯分布。
缺点:一旦随机分布选择不当,就会导致网络优化陷入困境。若参数初始值取得太小,在反向传播时会导致小的梯度,对于深度网络来说，会产生梯度弥散问题,降低参数的收敛速度。若参数初始值取得太大,那么神经元会容易饱和。

3、Xavier初始化