当前位置:网站首页>梯度消失和梯度爆炸
梯度消失和梯度爆炸
2022-08-03 09:16:00 【好程序不脱发】
如果我们使用标准化初始w,那么各个层次的相乘都是0-1之间的小数,而激活函数f的导数也是0-1之间的数,其连乘后,结果会变的很小,导致梯度消失。若我们初始化的w是很大的数,w大到乘以激活函数的导数都大于1,那么连乘后,可能会导致求导的结果很大,形成梯度爆炸。
边栏推荐
猜你喜欢
行业 SaaS 微服务稳定性保障实战
MySQL1
LINGO 18.0 software installation package download and installation tutorial
pytorch one-hot tips
MySQL8重置root账户密码图文教程
SAP Analytics Cloud 和 SAP Cloud for Customer 两款 SaaS 软件的集成
selenium IDE的3种下载安装方式
线程介绍与使用
English Grammar - Adverbial Clauses
"Easy to use" websites that others don't know, make you more efficient
随机推荐
批量将PNG格式转化为JPG格式
milvus
Validate floating point input
scala reduce、reduceLeft 、reduceRight 、fold、foldLeft 、foldRight
自动化测试浏览器驱动下载版本对应关系
dflow部署简记
The display of the article list and the basics of creating articles and article details
Let‘s Encrypt 使用
深度学习之 10 卷积神经网络1
系统io统计
110道 MySQL面试题及答案 (持续更新)
bihash总结
PostgreSQL的架构
线程介绍与使用
STP普通生成树安全特性— bpduguard特性 + bpdufilter特性 + guard root 特性 III loopguard技术( 详解+配置)
命令行加载特效 【cli-spinner.js】 实用教程
scala减少,reduceLeft reduceRight,折叠,foldLeft foldRight
MySQL-TCL语言-transaction control language事务控制语言
SQL每日一练(牛客新题库)——第5天:高级查询
Redis集群概念与搭建