当前位置:网站首页>过拟合与正则化
过拟合与正则化
2022-07-05 05:27:00 【李峻枫】
过拟合
这是一个神经网络训练过程中,经常会遇到的问题,简单来说,就是模型的表现了,学习能力太强了,以至于把训练集的所有细节都记录下来了。当遇到测试集,就是之前完全没有见过的数据的时候,就会出现明显的错误。
产生原因
最本质的一个原因就是:参数过多(模型过于复杂)
其他原因就是:
- 测试集与训练集的分布不一样
- 训练集的数量太少
解决办法
针对上述原因,可以提出几种对策
- 降低模型复杂度,常用的有正则化。
- 增强训练集
范数Norm(Minkowski距离)
定义
范数是一个函数,其赋予某个向量空间中的每个向量一长度或大小。
对于零向量,其长度为0。
∥ x ∥ p = ( ∑ i = 1 n ∣ x ∣ p ) 1 p \lVert x \rVert_p = \left(\displaystyle\sum_{i=1}^n \lvert x\rvert^p\right)^{\frac{1}{p}} ∥x∥p=(i=1∑n∣x∣p)p1
范数的性质
- 非负性 ∥ x ∥ ≥ 0 \lVert x\rVert \ge 0 ∥x∥≥0
- 齐次性 ∥ c x ∥ = ∣ c ∣ ∥ x ∥ \lVert cx\rVert=\lvert c\rvert \lVert x\rVert ∥cx∥=∣c∣∥x∥
- 三角不等式 ∥ x + y ∥ ≤ ∥ x ∥ + ∥ y ∥ \lVert x + y\rVert \leq \lVert x\rVert +\Vert y\rVert ∥x+y∥≤∥x∥+∥y∥
范数特征
- L 0 L_0 L0范数:非零元素个数
- L 1 L_1 L1范数:绝对值之和
- L 2 L_2 L2范数:欧拉距离
- L ∞ L_{\infin} L∞范数:绝对值最大的元素的绝对值
正则化
目标函数加上一个范数,作为惩罚项。如果一个参数越大,它就会使范数增大,即惩罚项增大。因此在范数的作用下,不少参数都在不断变小。
参数越小,说明其在神经网络中发挥的作用越小,即对最终结果的影响越小,因此可以使得模型更加简单,而且更加具有泛化能力。
正则化也是一种优胜劣汰的思想,虽然很多参数对模型都有用,但最终只有重要的参数才能被保留下来(值较大,对结果影响大),而大部分参数都被淘汰了(值很小,对结果影响不大)。
边栏推荐
- PMP candidates, please check the precautions for PMP examination in July
- 搭建完数据库和网站后.打开app测试时候显示服务器正在维护.
- Detailed explanation of expression (csp-j 2021 expr) topic
- [es practice] use the native realm security mode on es
- Under the national teacher qualification certificate in the first half of 2022
- Mysql database (I)
- Support multi-mode polymorphic gbase 8C database continuous innovation and heavy upgrade
- Warning using room database: schema export directory is not provided to the annotation processor so we cannot export
- kubeadm系列-00-overview
- [paper notes] multi goal reinforcement learning: challenging robotics environments and request for research
猜你喜欢
[轉]: OSGI規範 深入淺出
Optimization scheme of win10 virtual machine cluster
To be continued] [UE4 notes] L4 object editing
A new micro ORM open source framework
Reader writer model
The present is a gift from heaven -- a film review of the journey of the soul
SAP-修改系统表数据的方法
Merge sort
浅谈JVM(面试常考)
Reverse one-way linked list of interview questions
随机推荐
Merge sort
Haut OJ 1401: praise energy
FVP和Juno平台的Memory Layout介绍
使用Electron开发桌面应用
kubeadm系列-00-overview
Haut OJ 1241: League activities of class XXX
Quick sort summary
利用HashMap实现简单缓存
GBase数据库助力湾区数字金融发展
Fragment addition failed error lookup
lxml. etree. XMLSyntaxError: Opening and ending tag mismatch: meta line 6 and head, line 8, column 8
How can the Solon framework easily obtain the response time of each request?
ssh免密登录设置及使用脚本进行ssh登录并执行指令
[merge array] 88 merge two ordered arrays
Download xftp7 and xshell7 (official website)
Romance of programmers on Valentine's Day
Embedded database development programming (zero)
Hang wait lock vs spin lock (where both are used)
Acwing 4300. Two operations
Embedded database development programming (V) -- DQL