当前位置:网站首页>【深度学习基础知识 - 39】BN、LN、WN的比较
【深度学习基础知识 - 39】BN、LN、WN的比较
2022-07-27 16:58:00 【雁宇up】
BN
- batch normalization,使之在激活函数接收输入之前将数据的分布规范到标准正态分布中,使得激活函数的输入值落在对输入比较敏感的区域,也就是梯度较大的区域。从而避免梯度消失、减少训练时间。
- BN比较适合batch较大的场景,并且数据分布要相对比较接近。
WN
- weigit normalization,主要就是对网络的权重进行正则化,使得网络不要过于复杂,权重不要过大,可以防止过拟合。
LN
- layer normalization,它相对于BN,不依赖于整个batch,而是针对某一层的输入进行规范化处理,比较适用于小batch、RNN、MLP场景中。
博主会持续更新一些深度学习相关的基础知识以及工作中遇到的问题和感悟,喜欢请关注、点赞、收藏。
边栏推荐
- c语言:8、makeFile编写
- rxbinding
- C language: 14. Preprocessing
- C language printing diamond
- VMware: set up SSH
- 【深度学习基础知识 - 47】贝叶斯网络与朴素贝叶斯
- Big guys, Oracle CDC, local operation, always encounter this an exception occurred in
- C language: clion debugging method
- c语言:7、c语言多源码文件使用方法
- C language case: password setting and login > clear solution getchar and scanf
猜你喜欢

SQL field type conversion

Memory management A4

c语言:15、结构体

C语言案例:密码设置及登录> 明解getchar与scanf

golang设置国内镜像,vscode配置golang开发环境,vscode调试golang代码

搭建阿里云+typora+Picgo图床错误分析

The go zero singleton service uses generics to simplify the registration of handler routes

Web3.0热浪之下 门萨Mensa生态震撼来袭

A low code development platform that brings high-value user experience
技术实践干货 | 初探大规模 GBDT 训练
随机推荐
英特尔发布Horse Ridge芯片:22nm工艺,能够控制多个量子位
Flink简介以及运行架构
Dry goods of technical practice | preliminary exploration of large-scale gbdt training
嵌入式C语言对次数不定的循环的优化
c语言:15、结构体
Time complexity and space complexity
应用程序池已被禁用
SQL time processing (SQL server\oracle)
c语言:c语言代码风格
Complete source code of E-commerce mall applet project (wechat applet)
Kettle switch / case control to realize classification processing
搭建阿里云+typora+Picgo图床错误分析
HDU1323_ Perfection [water question]
下放三星3J1传感器:代码暗示Pixel 7人脸识别安全性将大增
Make your chat bubbles colorful
27. Basics of golang - mutex lock, read / write lock
台积电5nm即将量产:苹果A14独占7成产能,华为麒麟1020拿下3成
估值超156亿元!华勤通讯完成10亿元B轮融资!高通创投、英特尔资本领投
一种比读写锁更快的锁,还不赶紧认识一下
A low code development platform that brings high-value user experience