当前位置:网站首页>过拟合与正则化
过拟合与正则化
2022-07-05 05:27:00 【李峻枫】
过拟合
这是一个神经网络训练过程中,经常会遇到的问题,简单来说,就是模型的表现了,学习能力太强了,以至于把训练集的所有细节都记录下来了。当遇到测试集,就是之前完全没有见过的数据的时候,就会出现明显的错误。
产生原因
最本质的一个原因就是:参数过多(模型过于复杂)
其他原因就是:
- 测试集与训练集的分布不一样
- 训练集的数量太少
解决办法
针对上述原因,可以提出几种对策
- 降低模型复杂度,常用的有正则化。
- 增强训练集
范数Norm(Minkowski距离)
定义
范数是一个函数,其赋予某个向量空间中的每个向量一长度或大小。
对于零向量,其长度为0。
∥ x ∥ p = ( ∑ i = 1 n ∣ x ∣ p ) 1 p \lVert x \rVert_p = \left(\displaystyle\sum_{i=1}^n \lvert x\rvert^p\right)^{\frac{1}{p}} ∥x∥p=(i=1∑n∣x∣p)p1
范数的性质
- 非负性 ∥ x ∥ ≥ 0 \lVert x\rVert \ge 0 ∥x∥≥0
- 齐次性 ∥ c x ∥ = ∣ c ∣ ∥ x ∥ \lVert cx\rVert=\lvert c\rvert \lVert x\rVert ∥cx∥=∣c∣∥x∥
- 三角不等式 ∥ x + y ∥ ≤ ∥ x ∥ + ∥ y ∥ \lVert x + y\rVert \leq \lVert x\rVert +\Vert y\rVert ∥x+y∥≤∥x∥+∥y∥
范数特征
- L 0 L_0 L0范数:非零元素个数
- L 1 L_1 L1范数:绝对值之和
- L 2 L_2 L2范数:欧拉距离
- L ∞ L_{\infin} L∞范数:绝对值最大的元素的绝对值
正则化
目标函数加上一个范数,作为惩罚项。如果一个参数越大,它就会使范数增大,即惩罚项增大。因此在范数的作用下,不少参数都在不断变小。
参数越小,说明其在神经网络中发挥的作用越小,即对最终结果的影响越小,因此可以使得模型更加简单,而且更加具有泛化能力。
正则化也是一种优胜劣汰的思想,虽然很多参数对模型都有用,但最终只有重要的参数才能被保留下来(值较大,对结果影响大),而大部分参数都被淘汰了(值很小,对结果影响不大)。
边栏推荐
- Drawing dynamic 3D circle with pure C language
- SDEI初探-透过事务看本质
- PMP考生,请查收7月PMP考试注意事项
- Solution to the palindrome string (Luogu p5041 haoi2009)
- 剑指 Offer 05. 替换空格
- Add level control and logger level control of Solon logging plug-in
- SSH password free login settings and use scripts to SSH login and execute instructions
- A preliminary study of sdei - see the essence through transactions
- ssh免密登录设置及使用脚本进行ssh登录并执行指令
- 发现一个很好的 Solon 框架试手的教学视频(Solon,轻量级应用开发框架)
猜你喜欢
Using HashMap to realize simple cache
剑指 Offer 09. 用两个栈实现队列
Pointnet++的改进
[trans]: spécification osgi
Improvement of pointnet++
Web APIs DOM节点
2022年上半年国家教师资格证考试
Embedded database development programming (V) -- DQL
Optimization scheme of win10 virtual machine cluster
[turn to] MySQL operation practice (I): Keywords & functions
随机推荐
Bubble sort summary
Development error notes
C language Essay 1
动漫评分数据分析与可视化 与 IT行业招聘数据分析与可视化
room数据库的使用
When will Wei Lai, who has been watched by public opinion, start to "build high-rise buildings" again?
Zheng Qing 21 ACM is fun. (3) part of the problem solution and summary
[depth first search] 695 Maximum area of the island
YOLOv5-Shufflenetv2
游戏商城毕业设计
How can the Solon framework easily obtain the response time of each request?
Count sort
剑指 Offer 04. 二维数组中的查找
剑指 Offer 06.从头到尾打印链表
FVP和Juno平台的Memory Layout介绍
To the distance we have been looking for -- film review of "flying house journey"
[转]MySQL操作实战(三):表联结
[paper notes] multi goal reinforcement learning: challenging robotics environments and request for research
数仓项目的集群脚本
剑指 Offer 53 - I. 在排序数组中查找数字 I