当前位置:网站首页>类神经网络训练不起来怎么办
类神经网络训练不起来怎么办
2022-08-01 04:59:00 【bolite】
内容取自李宏毅2021/2022春机器学习课程p18-22
当你的Loss值太大时候
1.有可能是模型构造有问题
可能模型构造的太简单,导致我们需要的模型不在训练的范围之内。
我们可以重新设计我们的模型,增加模型的弹性:1.增加更多的feature(特点,数据),2.增加更多层数
2.可能是优化过程出现问题
我们取的θ并不是真正最小的那个θ
在选出最小的θ的时候会遇到局部最小值和鞍点的问题
我们需要通过Hessian来区分到底那个θ局部最值还是鞍点
如果我们红色方框内的值一直大于0,就表示当前的θ是局部最小值
如果我们红色方框内的值一直小于0,就表示当前的θ是局部最大值
如果我们红色方框内的值有的大于0有的小于0,则是鞍点。
当我们处在鞍点的时候,只要找到θ=θ’+u就可以让Loss变小。
所以我们遇到鞍点的时候可以比较轻松的解决优化问题,在大部分情况下,如果我们遇到的是局部最值的时候,在我们当前的维度上看可能是局部最值问题,如果我们放在更高的维度上看待的时候,他可能就变成了一个鞍点的情况
gradient descent+moment技术
每次取g的反方向于上一次移动的方向进行向量和求出这一次移动的方向
常用的optimization:Adam 可以直接调用
from keras.optimizers import Adam
当你的train的Loss值是小的,但是test的Loss值大
Overfitting
解决Overfitting的俩种方法:1.增加训练数据,2.增加约束条件
边栏推荐
- Excel做题记录——整数规划优化模型
- Progressive Reconstruction of Visual Structure for Image Inpainting 论文笔记
- The method of solving stored procedure table name passing through variable in mysql
- state compressed dp
- PMP子过程定义总结
- pytorch、tensorflow对比学习—功能组件(激活函数、模型层、损失函数)
- UE4 从鼠标位置射出射线检测
- 万字逐行解析与实现Transformer,并进行德译英实战(一)
- MySQL实践总结-
- pytroch、tensorflow对比学习—搭建模型范式(构建模型方法、训练模型范式)
猜你喜欢
【愚公系列】2022年07月 Go教学课程 025-递归函数
state compressed dp
USB3.0:VL817Q7-C0的LAYOUT指南(三)
基于ProXmoX VE的虚拟化家庭服务器(篇一)—ProXmoX VE 安装及基础配置
Pyspark Machine Learning: Vectors and Common Operations
ICML2022 | Deep Dive into Permutation-Sensitive Graph Neural Networks
typescript27-枚举类型呢
【无标题】
How to promote new products online?
冲刺金九银十,Android开发面试(内含面试资料|面试题|源码)
随机推荐
「以云为核,无感极速」顶象第五代验证码
云服务器下载安装mongo数据库并远程连接详细图文版本(全)
备战金九银十,如何顺利通过互联网大厂Android的笔面试?
高数 | 【重积分】线面积分880例题
Immutable
4D line-by-line analysis and implementation of Transformer, and German translation into English (3)
时时刻刻保持敬畏之心
MySQL-数据操作-分组查询-连接查询-子查询-分页查询-联合查询
阿叶的目标
LeetCode 27. 移除元素
PMP子过程定义总结
7月编程排行榜来啦!这次有何新变化?
怀念故乡的月亮
深圳某游戏研发公司给每个工位都装监控,网友:堪比坐牢!
文件的异步读写
Dry goods!How to Construct SRv6-TE Performance Test Environment Using Instrumentation
C# | 使用Json序列化对象时忽略只读的属性
UE4 从鼠标位置射出射线检测
万字逐行解析与实现Transformer,并进行德译英实战(一)
今日睡眠质量记录68分