当前位置:网站首页>梯度消失和梯度爆炸
梯度消失和梯度爆炸
2022-08-03 09:16:00 【好程序不脱发】
如果我们使用标准化初始w,那么各个层次的相乘都是0-1之间的小数,而激活函数f的导数也是0-1之间的数,其连乘后,结果会变的很小,导致梯度消失。若我们初始化的w是很大的数,w大到乘以激活函数的导数都大于1,那么连乘后,可能会导致求导的结果很大,形成梯度爆炸。
边栏推荐
猜你喜欢
随机推荐
多媒体数据处理实验4:LSH索引
dflow入门1——HelloWorld!
Automated test browser driver download version
获取JDcookie的方法
pytorch one-hot tips
mysql8安装步骤教程
013-二叉树
dflow入门4——recurse&reuse&conditional
gpnmb+ gpnmb-AT2 cell idling mapping Epithelial cell idling mapping
SQL Daily Practice (Nioke New Question Bank) - Day 5: Advanced Query
MySQL1
深度学习之 10 卷积神经网络1
10 Convolutional Neural Networks for Deep Learning 2
英文语法-状语从句
Qt 下拉复选框(MultiSelectComboBox)(一) 实现下拉框多选,搜索下拉框内容
线程介绍与使用
牛客 - 最佳直播时间 (差分)
dflow入门3——dpdispatcher插件
Machine learning (formula derivation and code implementation)--sklearn machine learning library
【LeetCode】622.设计循环队列