当前位置:网站首页>深度学习理论 —— 初始化、参数调节
深度学习理论 —— 初始化、参数调节
2022-08-04 05:30:00 【学习历险记】
初始化
深度学习模型训练的过程本质是对参数w进行更新,这需要每个参数有相应的初始值。
为什么要初始化?
神经网络要优化一个非常复杂的非线性模型,而且基本没有全局最优解,初始化在其中扮演着非常重要的作用。
□ 初始点的选取,有时能够决定算法是否收敛;
□ 当收敛时,初始点可以决定学习收敛的多快,是否收敛到一个代价高或低的点;
□ 过大的初始化导致梯度爆炸,过小的初始化导致梯度消失。
什么是好的初始化?
好的初始化应该满足以下两个条件:
□ 让神经元各层激活值不会出现饱和现象;
□ 各层激活值也不能为0。
全零初始化:参数初始化为0。
缺点:同一层的神经元会学习到相同的特征,不能破坏不同神经元的对称性质。
如果神经元的权重被初始化为0,所有神经元的输出都将是相同的,除了输出之外,所有的中间层的节点的值都为零。一般神经网络拥有对称的结构,那么在进行第一次误差反向传播时,更新后的网络参数将会相同,在下一次更新时,相同的网络参数学习提取不到有用的特征,因此深度学习模型都不会使用0初始化所有参数。
参数调节
![]()
批量 batchsize 选择2的指数倍 与计算机内存相符
超参数调节方法
试错法、网络搜索、随机搜索、贝叶斯优化、高斯过程
边栏推荐
- TensorFlow2 study notes: 4. The first neural network model, iris classification
- 线性回归简介01---API使用案例
- TensorFlow:tf.ConfigProto()与Session
- 度量学习(Metric learning、损失函数、triplet、三元组损失、fastreid)
- thymeleaf中 th:href使用笔记
- 读研碎碎念
- The use of the attribute of the use of the animation and ButterKnife
- Vision Transformer 论文 + 详解( ViT )
- pytorch学习-没掌握的点
- 【深度学习21天学习挑战赛】备忘篇:我们的神经网模型到底长啥样?——model.summary()详解
猜你喜欢
Polynomial Regression (PolynomialFeatures)
[Deep Learning 21 Days Learning Challenge] 2. Complex sample classification and recognition - convolutional neural network (CNN) clothing image classification
浅谈外挂常识和如何防御
基于PyTorch的FCN-8s语义分割模型搭建
打金?工作室?账号被封?游戏灰黑产离我们有多近
TensorRT 5 初步认识
简单明了,数据库设计三大范式
强化学习中,Q-Learning与Sarsa的差别有多大?
SQL注入详解
线性回归简介01---API使用案例
随机推荐
Introduction of linear regression 01 - API use cases
PCL1.12 解决memory.h中EIGEN处中断问题
AIDL communication between two APPs
Thoroughly understand box plot analysis
Unity ML-agents 参数设置解明
Image-Adaptive YOLO for Object Detection in Adverse Weather Conditions
TensorFlow2 study notes: 6. Overfitting and underfitting, and their mitigation solutions
图像合并水平拼接
[CV-Learning] Convolutional Neural Network Preliminary Knowledge
[Go language entry notes] 13. Structure (struct)
线性回归02---波士顿房价预测
【深度学习21天学习挑战赛】2、复杂样本分类识别——卷积神经网络(CNN)服装图像分类
动手学深度学习_卷积神经网络CNN
yoloV5 使用——训练速度慢,加速训练
YOLOV4流程图(方便理解)
postgres recursive query
Deep Adversarial Decomposition: A Unified Framework for Separating Superimposed Images
No matching function for call to ‘RCTBridgeModuleNameForClass‘
pytorch学习-没掌握的点
Polynomial Regression (PolynomialFeatures)