当前位置:网站首页>类神经网络训练不起来怎么办
类神经网络训练不起来怎么办
2022-08-01 04:59:00 【bolite】
内容取自李宏毅2021/2022春机器学习课程p18-22
当你的Loss值太大时候
1.有可能是模型构造有问题

可能模型构造的太简单,导致我们需要的模型不在训练的范围之内。
我们可以重新设计我们的模型,增加模型的弹性:1.增加更多的feature(特点,数据),2.增加更多层数
2.可能是优化过程出现问题

我们取的θ并不是真正最小的那个θ
在选出最小的θ的时候会遇到局部最小值和鞍点的问题
我们需要通过Hessian来区分到底那个θ局部最值还是鞍点
如果我们红色方框内的值一直大于0,就表示当前的θ是局部最小值
如果我们红色方框内的值一直小于0,就表示当前的θ是局部最大值
如果我们红色方框内的值有的大于0有的小于0,则是鞍点。
当我们处在鞍点的时候,只要找到θ=θ’+u就可以让Loss变小。
所以我们遇到鞍点的时候可以比较轻松的解决优化问题,在大部分情况下,如果我们遇到的是局部最值的时候,在我们当前的维度上看可能是局部最值问题,如果我们放在更高的维度上看待的时候,他可能就变成了一个鞍点的情况
gradient descent+moment技术

每次取g的反方向于上一次移动的方向进行向量和求出这一次移动的方向
常用的optimization:Adam 可以直接调用
from keras.optimizers import Adam
当你的train的Loss值是小的,但是test的Loss值大
Overfitting
解决Overfitting的俩种方法:1.增加训练数据,2.增加约束条件
边栏推荐
- 请问表格储存中用sql只能查询到主键列,ots sql非主键不支持吗?
- Swastika line-by-line parsing and realization of the Transformer, and German translation practice (a)
- ModuleNotFoundError: No module named ‘tensorflow.keras‘报错信息的解决方法
- (2022牛客多校四)N-Particle Arts(思维)
- How to promote new products online?
- Code Interview Guide for Programmers CD15 Generating an Array of Windowed Maximums
- (Codeforce 757) E. Bash Plays with Functions
- 解决ffmpeg使用screen-capture-recorder录屏,有屏幕缩放的情况下录不全的问题
- PMP 项目沟通管理
- 在互联网时代,有诸多「互联网+」模式的诞生
猜你喜欢
随机推荐
万字逐行解析与实现Transformer,并进行德译英实战(三)
scheduleWithFixedDelay和scheduleAtFixedRate的区别
Visual Studio提供的 Command Prompt 到底有啥用
LeetCode 9. 回文数
LeetCode 231. 2 的幂
typescript25-类型断言
Immutable
Mysql中的数据类型和运算符
LeetCode 387. 字符串中的第一个唯一字符
The method of solving stored procedure table name passing through variable in mysql
PAT乙级 1001 害死人不偿命的(3n+1)猜想
Immutable
LeetCode 1189. “气球” 的最大数量
PMP子过程定义总结
怀念故乡的月亮
(2022牛客多校四)D-Jobs (Easy Version)(三维前缀或)
Excel做题记录——整数规划优化模型
(2022 Nioke Duo School IV) D-Jobs (Easy Version) (3D prefix or)
华为Android开发面试后得出的面试秘诀
typescript20-接口









