当前位置:网站首页>过拟合原因及解决
过拟合原因及解决
2022-06-25 10:57:00 【用户9854323】
过拟合原因及解决
过拟合:模型在训练集上效果好;在测试集上效果差。模型泛化能力弱。
1、数据量小 解决:数据增强,也就是增加训练数据样本 例如:通过一定规则扩充数据或采集更多数据
2、模型复杂度过大,造成训练误差过小 解决: 1)、在输入中加噪声: 在输入中加高斯噪声,会在输出中生成干扰项。训练时,减小误差,同时也会对噪声产生的干扰项进行惩罚,达到减小权值的平方的目的,达到与 L2 类似的效果;
2)、正则化(限制权值): 通过给损失函数引入额外信息给模型复杂性带来相应的惩罚度。 例如: L1的效果就是让w往0靠,使网络中的权重尽可能为0,也就相当于减小了网络复杂度, L1会趋向于产生少量的特征,而其他的特征都是0;
L2正则化是通过约束參数的范数使其不要太大,所以能够在一定程度上降低过拟合情况, L2会选择更多的特征,这些特征都会接近于0
L1在特征选择时候非常有用, L2就只是一种规则化而已;
3、神经元过于密集 解决:组合多个简单模型 例: 1)dropout:改动神经网路本身,模型训练时,每次随机(如 50% 概率)忽略隐层的某些节点;这样,我们相当于随机从 2^H 个模型中采样选择模型
2)Bagging:简单理解,就是分段函数的概念,用不同的模型拟合不同部分的训练集。
3)Boosting:既然训练复杂神经网络比较慢,那我们就可以只使用简单的神经网络(层数、神经元数限制等)。通过训练一系列简单的神经网络,加权平均其输出。
4、学习树过深 解决: 提前终止(early stopping):使用交叉验证或者k折交叉验证,在每次迭代后计算验证数据集的accuracy,当accuracy不再提高时,就停止训练(一般的做法是,在训练的过程中,记录到目前为止最好的validation accuracy,当连续10次Epoch(或者更多次)没达到最佳accuracy时,则可以认为accuracy不再提高了。)
为什么early stopping有用:因为我们在初始化网络的时候一般都是初始为较小的权值。训练时间越长,部分网络权值可能越大。如果我们在合适时间停止训练,就可以将网络的能力限制在一定范围内。
边栏推荐
- Gaussdb others scenarios with high memory
- Introduction to socket UDP and TCP
- Application of global route guard
- 1-7snapshots and clones in VMWare
- keep-alive
- Démarrer avec Apache shenyu
- FPGA基于VGA显示字符及图片
- Handling of NPM I installation problems
- Socket communication principle
- Checking whether the double value is an integer - Swift - checking if a double value is an integer - swift
猜你喜欢
随机推荐
网络远程访问的方式使用树莓派
Daily 3 questions (3) - check whether integers and their multiples exist
Flutter adds event listening | subscription
【上云精品】节能提效!加速纺织业“智造”转型
CDN+COS搭建图床超详细步骤
At 16:00 today, Mr. sunxiaoming, a researcher of the Institute of computing, Chinese Academy of Sciences, took you into the quantum world
Complete steps for a complete Oracle uninstall
Shen Ying, China Academy of communications and communications: font open source protocol -- Introduction to ofl v1.1 and analysis of key points of compliance
Démarrer avec Apache shenyu
Task03 probability theory
一个五年北漂的技术er,根据这些年的真实经历,给应届生的一些建议
Apache ShenYu 入门
手机办理广州证券开户靠谱安全吗?
垃圾回收机制
MySQL synchronous data configuration and shell script implementation
Google Earth Engine(GEE)——evaluate实现一键批量下载研究区内的所有单张影像(上海市部分区域)
CSRF attack
Is it safe to open a stock account on the compass?
TASK03|概率论
视频会议一体机的技术实践和发展趋势









