当前位置:网站首页>梯度消失和梯度爆炸
梯度消失和梯度爆炸
2022-08-03 09:16:00 【好程序不脱发】
如果我们使用标准化初始w,那么各个层次的相乘都是0-1之间的小数,而激活函数f的导数也是0-1之间的数,其连乘后,结果会变的很小,导致梯度消失。若我们初始化的w是很大的数,w大到乘以激活函数的导数都大于1,那么连乘后,可能会导致求导的结果很大,形成梯度爆炸。
边栏推荐
- scala减少,reduceLeft reduceRight,折叠,foldLeft foldRight
- Guava的缓存
- 【收获合辑】k-NN与检索任务的异同+jupyter转pdf
- scala 并行集合、并行并发、线程安全问题、ThreadLocal
- 【字节面试】word2vector输出多少个类别
- When deleting a folder, the error "Error ox80070091: The directory is not empty" is reported. How to solve it?
- bihash总结
- 【愚公系列】2022年07月 Go教学课程 026-结构体
- Chrome F12 keep before request information network
- NFT到底有哪些实际用途?
猜你喜欢
随机推荐
LeetCode第三题(Longest Substring Without Repeating Characters)三部曲之二:编码实现
【微信小程序】底部有安全距离,适配iphone X等机型的解决方案
Redis集群概念与搭建
合并两个有序链表
cert-manager使用
Path Prefixes (倍增!树上の二分)
【LeetCode】老虎证券面试-括号嵌套且满足优先级
oracle ASM磁盘空间的查看
SQL每日一练(牛客新题库)——第5天:高级查询
PostgreSQL的架构
dflow入门1——HelloWorld!
dflow入门2——Slices
selenium IDE的3种下载安装方式
015-Balanced binary tree (1)
dflow入门3——dpdispatcher插件
编程踩坑合集
【愚公系列】2022年07月 Go教学课程 026-结构体
批量将PNG格式转化为JPG格式
Machine learning (formula derivation and code implementation)--sklearn machine learning library
MySQL2