当前位置:网站首页>类神经网络训练不起来怎么办
类神经网络训练不起来怎么办
2022-08-01 04:59:00 【bolite】
内容取自李宏毅2021/2022春机器学习课程p18-22
当你的Loss值太大时候
1.有可能是模型构造有问题

可能模型构造的太简单,导致我们需要的模型不在训练的范围之内。
我们可以重新设计我们的模型,增加模型的弹性:1.增加更多的feature(特点,数据),2.增加更多层数
2.可能是优化过程出现问题

我们取的θ并不是真正最小的那个θ
在选出最小的θ的时候会遇到局部最小值和鞍点的问题
我们需要通过Hessian来区分到底那个θ局部最值还是鞍点
如果我们红色方框内的值一直大于0,就表示当前的θ是局部最小值
如果我们红色方框内的值一直小于0,就表示当前的θ是局部最大值
如果我们红色方框内的值有的大于0有的小于0,则是鞍点。
当我们处在鞍点的时候,只要找到θ=θ’+u就可以让Loss变小。
所以我们遇到鞍点的时候可以比较轻松的解决优化问题,在大部分情况下,如果我们遇到的是局部最值的时候,在我们当前的维度上看可能是局部最值问题,如果我们放在更高的维度上看待的时候,他可能就变成了一个鞍点的情况
gradient descent+moment技术

每次取g的反方向于上一次移动的方向进行向量和求出这一次移动的方向
常用的optimization:Adam 可以直接调用
from keras.optimizers import Adam
当你的train的Loss值是小的,但是test的Loss值大
Overfitting
解决Overfitting的俩种方法:1.增加训练数据,2.增加约束条件
边栏推荐
- 产品经理访谈 | 第五代验证码的创新与背景
- 项目风险管理必备内容总结
- Progressive Reconstruction of Visual Structure for Image Inpainting 论文笔记
- The Principle Of Percona Toolkit Nibble Algorithm
- (2022 Niu Ke Duo School IV) N-Particle Arts (Thinking)
- Dry goods!How to Construct SRv6-TE Performance Test Environment Using Instrumentation
- ApiFile
- 冲刺金九银十,Android开发面试(内含面试资料|面试题|源码)
- Swastika line-by-line parsing and realization of the Transformer, and German translation practice (a)
- typescript19-对象可选参数
猜你喜欢
随机推荐
程序员代码面试指南 CD15 生成窗口最大值数组
pytroch、tensorflow对比学习—专栏介绍
怀念故乡的月亮
pytroch、tensorflow对比学习—功能组件(数据管道、回调函数、特征列处理)
7 行代码搞崩溃 B 站,原因令人唏嘘!
开源许可证 GPL、BSD、MIT、Mozilla、Apache和LGPL的区别
(Codeforce 757)E. Bash Plays with Functions(积性函数)
(2022牛客多校四)D-Jobs (Easy Version)(三维前缀或)
【堆】小红的数组
干货!如何使用仪表构造SRv6-TE性能测试环境
MySQL-数据定义语言-DDLdatebase define language
August 22 Promotion Ambassador Extra Reward Rules
typescript21-接口和类型别名的对比
pytorch、tensorflow对比学习—功能组件(优化器、评估指标、Module管理)
一个往年的朋友
56:第五章:开发admin管理服务:9:开发【文件上传到,MongoDB的GridFS中,接口】;(把文件上传到GridFS的SOP)
Lawyer Interpretation | Guns or Roses?Talking about Metaverse Interoperability from the Battle of Big Manufacturers
typescript25-类型断言
(2022 Niu Ke Duo School IV) K-NIO's Sword (Thinking)
阿叶的目标









